SO2 wyklad 4 id 458564

Systemy Operacyjne - semestr drugi

Wyk a

ł d pi t

ą y

Wywołania systemowe

Ka d

ż y system operacyjny zarz d

ą za zasobami systemu komputerowego na którym jest uruchomiony oraz dostarcza pewnych usług procesom u y ż tkownika. Jednocze n

ś ie

wi k

ę szość nowoczesnych systemów operacyjnych zabrania zadaniom z przestrzeni u y ż tkownika bezpo r

ś edniej interakcji z innymi zadaniami tego typu lub wykonywania

operacji na sprz c

ę ie. Ma to na celu zapobie en

ż ie nadu y

ż ciom ze strony tych zadań i stanowi częś

ć mechanizmu ochrony. Oznacza to tak e,

ż e

ż jedynie system operacyjny może

wykonywać niektóre czynno c

ś i, takie jak np.: odczyt i zapis danych z urządzeń wej c

ś ia-wyj c

ś ia. Je l

ś i proces u y

ż tkownika chce pobrać lub zapami t

ę ać dane na takim

urządzeniu, to musi to zrobić za pośrednictwem systemu operacyjnego, uruchamiając odpowiednie wywołanie systemowe. Wywołanie systemowe jest funkcją jądra, która mo e

ż być uruchomiona przez proces u y

ż tkownika, celem zlecenia systemowi operacyjnemu wykonania jakiejś czynno c ś i w imieniu tego procesu1. Zbiór wszystkich wywołań

systemowych stanowi interfejs mi d

ę zy aplikacją a jądrem systemu operacyjnego. Dzięki jego istnieniu zapewniona jest stabilność systemu, mo l ż iwa jest praca

wielozadaniowa oraz łatwiej jest pisać programy, które b d

ę ą wykonywane w przestrzeni użytkownika.

Powyższy opis nale y

ż uzupełnić o element, który jest okre l

ś any mianem interfejsu aplikacji – w skrócie API (ang. Application Programming Interface). Zadania u y ż tkownika

najczęściej nie wywołują bezpośrednio wywo a

ł ń systemowych lecz robią to za pomocą podprogramów języka wysokiego poziomu. W przypadku systemów uniksowych API jest okre l

ś one standardem POSIX, zdefiniowanym przez organizację IEEE. Standard ten opisuje również wywołania systemowe. Ka d ż y system, który ma by

ć uwa a

ż ny za zgodny

z Uniksem musi ten standard implementować2, przy czym nie jest okre l ś ony sposób tej implementacji. Podstawowym językiem programowania w ka d ż ym systemie

uniksowym jest j z

ę yk C. Funkcje należące do API zawarte są w standardowej bibliotece tego j z ę yka, o nazwie libc3. Inne języki programowania wysokiego poziomu mają własne biblioteki standardowe, które najcz c

ęś iej bazują na bibliotece języka C4. Część funkcji okre l

ś onych standardem POSIX stanowią tzw. funkcje opakowuj c

ą e (ang.

wrapping routines), których jedynym zadaniem jest uruchomienie wywołania systemowego. Inną część stanowią funkcje korzystające z więcej niż jednego wywołania systemowego, a jeszcze inną funkcje, które wcale nie korzystają z wywo a ł ń systemowych. Zgodnie z tym co zosta o

ł napisane wcze n

ś iej ró n

ż e kompilatory j z

ę yka C, działające

na ró n

ż ych systemach uniksowych mogą w ró n

ż y sposób implementować ka d

ż ą z tych funkcji.

Wywo a

ł nia systemowe podobnie jak zwykłe funkcje mogą przyjmować pewną liczbę argumentów wywołania, lub nie przyjmować ich w ogóle. Mogą one również oprócz podstawowej operacji wykonywać czynno c

ś i dodatkowe, które wpływają na stan sytemu. Oznacza to wówczas, e

ż wywo a

ł nie ma skutki uboczne. Ka d

ż e wywołanie systemowe

zwraca wartość typu long, która stanowi kod wykonania. Zazwyczaj poprawne zako c ń zenie wywołania sygnalizowane jest liczbą dodatnią (najcz c

ęś iej zero), a błędne,

ujemną. W przestrzeni u y

ż tkownika kod wykonania zapisywany jest do specjalnej zmiennej globalnej o nazwie errno. Jej zawartoś ć może zostać przetworzona na komunikat

czytelny dla u y

ż tkownika dzi k

ę i funkcji perror(). Wywo a

ł nie systemowe implementowane jest za pomocą funkcji napisanej w języku C. Umieszczana jest ona najczęściej w pliku z kodem r

ź ódłowym tej części j d

ą ra, z którą jest powiązane rozwa a

ż ne wywołanie. Kod wszystkich funkcji implementuj c

ą ych wywołania systemowe ma pewne cechy

wspólne. Przyjęto konwencj ,

ę że nazwy takich funkcji konstruowane są według schematu sys_*, gdzie znak „*” oznacza nazwę implementowanego wywołania systemowego.

Dodatkowo nazwy te są poprzedzone modyfikatorem asmlinkage, celem poinformowania kompilatora, e ż argumenty dla tych funkcji są przekazywane wyłącznie za pomocą

stosu. Nie ka d

ż a architektura procesora tego wymaga, więc dla niektórych z nich ten modyfikator jest pusty. Ka d ż e wywołanie systemowe posiada swój numer, który jest

równocze n

ś ie indeksem w tablicy sys_call_table, zawierającej adresy wszystkich zarejestrowanych wywołań systemowych. Jej implementacja zależna jest od sprz t ę u na

którym uruchomiony jest system. W przypadku sprzętu opartego na 32-bitowych procesorach Intela znajduje się ona w pliku syscall_table_32.S, który włączany jest do pliku entry_32.S, również zale n

ż ego od architektury. Dla sprz t

ę u z procesorem opartym o architekturę x86_64 tablica jest implementowana w pliku unistd_64.h, który nast p ę nie

jest włączany do pliku syscall_64.c, a ten załączany jest do entry_64.S. Linux udost p ę nia tak e

ż funkcję sys_ni_call(), zwracaj c

ą ą wartość -ENOSYS, oznaczającą e

wywo a

ł nie o podanym numerze nie zostało zaimplementowane, lub zostało z jakiś przyczyn usunięte, co zdarza się niezmiernie rzadko5. W nowszych wersjach jądra wprowadzono makrodefinicje, które rozwijane są automatycznie przez preprocesor do okre l ś onego nagłówka funkcji realizującej wywołanie systemowe. Nazwy tych makr są utworzone według schematu SYSCALL_DEFINEn, gdzie n jest liczbą argumentów przyjmowanych przez wywołanie systemowe. Je l ś i wywołanie nie przyjmuje żadnych

argumentów, to n jest równe zero. Pierwszym argumentem wywo a

ł nia opisywanych makr jest nazwa wywołania systemowego (bez przedrostka sys_). W przypadku, gdy makro pozwala na okre l

ś enie argumentów funkcji realizującej wywołanie systemowe, to nale y

ż do niego przekazać nie tylko nazwę tego argumentu, ale trzeba ją poprzedzić jego typem.

Proces u y

ż tkownika nie mo e

ż bezpo r

ś ednio wywołać funkcji implementuj c

ą ej wywo a

ł nie systemowe, gdyż znajduje się ona w chronionej przestrzeni jądra. Mo e ż to uczynić

wyłącznie poprzez mechanizm przerwań. W wersji Linuksa dla 32-bitowych procesorów Intela lub zgodnych istnieje specjalne przerwanie programowe o numerze 128 (80h), które s u

ł y

ż do wywoływania wywołań systemowych. Skojarzona jest z nim funkcja system_call(), która stanowi jego procedurę obsługi (ang. handler) i jednocze n ś ie punkt

wejścia dla wywołań systemowych (ang. call gate). Kod tej funkcji jest umieszczony w pliku entry_32.S. Nowsze, 32-bitowe procesory tej firmy (od Pentium II wzwy ) ż

dostarczają dwóch rozkazu sysenter, który pełni t

ę samą funkcj ,

ę co przerwanie 128, ale jest szybszy w działaniu. W momencie wywo a

ł nia przerwania 128 następuje przej c

ś ie

procesora do trybu jądra. Funkcja system_call() sprawdza poprawność numeru wywo a ł nia, który jest jej przekazywany przez rejestr eax. Je l

ś i ten numer nie jest prawidłowy,

to system_call() zwraca błąd -ENOSYS. W przeciwnym przypadku jego wartość jest mno on ż a przez wielkość adresu wyra on

ż ą w bajtach (4 w tym przypadku) i odczytywany

jest adres funkcji wywołania systemowego z tablicy sys_call_table, a nast p ę nie ta funkcja jest wywoływana za pomocą zwykłego rozkazu call. Argumenty wywo a ł nia

systemowego przekazywane są do system_call() za pomocą rejestrów ebx, ecx, edx, esi, edi. Zanim zostanie wywołana funkcja implementująca okre l ś one wywołanie, to

system_call() odkłada warto c

ś i z rejestrów na stos. Je l

ś i trzeba wywołaniu przekazać więcej niż pięć argumentów, to w jednym z rejestrów umieszczany jest adres obszaru pamięci w przestrzeni u y

ż tkownika, gdzie umieszczona jest reszta argumentów wywołania. Wartości wszystkich argumentów muszą zostać zweryfikowane celem sprawdzenia, czy nie są one bł d

ę ne i czy nie spowodują naruszenia ochrony. Szczególnie wa n

ż e jest sprawdzenie argumentów wskaźnikowych. W ich przypadku jądro

wykonuje trzy testy:

czy wska n

ź ik wskazuje na obszar pamięci przestrzeni u y

ż tkownika,

czy wska n

ź ik wskazuje obszar pamięci w przestrzeni procesu na zlecenie którego zostało wywołane wywołanie, 3.

je l

ś i ma zosta

ć wykonana operacja odczytu, to sprawdzane jest, czy obszar na który wskazuje wska n ź ik jest obszarem do odczytu, a je l

ś i ma być wykonany

zapis, to sprawdzane jest, czy do tego obszaru mo n

ż a zapisywać, je l

ś i ma nast p

ą ić wykonanie kodu, to sprawdzane jest, czy mo n

ż a t

ę operację zrealizowa .

Kopiowanie informacji z obszaru pami c

ę i j d

ą ra do obszaru pami c

ę i procesu u y

ż tkownika wykonywane jest za pomocą funkcji copy_to_user(). Przyjmuje ona trzy argumenty.

Pierwszym z nich jest adres obszaru docelowego, drugi to adres obszaru r ź ódłowego, a trzeci to liczba bajtów, które trzeba przekopiowa .

ć Je l

ś i nale y

ż skopiować dane

z obszaru procesu u y

ż tkownika do obszaru pamięci jądra, to wówczas u y

ż wana jest funkcja copy_from_user(). Podobnie jak poprzedniczka przyjmuje ona trzy argumenty, o takim samym znaczeniu. Obie funkcje w przypadku niepowodzenia zwracają liczbę bajtów, których nie udało sie skopiowa , ć a w przypadku powodzenia, wartość zero.

Weryfikację uprawnień procesu wywołuj c

ą ego wywo a

ł nie systemowe w jądrach Linuksa serii 2.6 przeprowadza się za pomocą wywołania funkcji capable(). Je l ś i proces

wywo u

ł jący dane wywołanie systemowe nie ma wymaganych uprawnień do żądanego zasobu, to capable() zwraca wartość zero, w przeciwnym wypadku wartość wi k ę szą od

zera. Lista uprawnień przechowywana jest w pliku linux/capability.h. W starszych wersjach jądra sprawdzane było jedynie, czy proces jest procesem u y ż tkownika

W literaturze dotycz c

ą ej systemów operacyjnych wywołania systemowe okre l

ś a się niekiedy mianem funkcji systemowych. W niniejszym tek c

ś ie terminem tym okre l

ś a

się podprogramy jądra. Wywołania systemowe są tylko podzbiorem tych podprogramów.

Niektóre z funkcji opisanych tym standardem implementują nie tylko systemy kompatybilne z Uniksami. Do tych wyjątków zalicza się między innymi Windows NT.

W przypadku systemu Linux ta biblioteka nazywa si

ę glibc – skrót od GNU libc.

Translatory tych języków są najcz c

ęś iej pisane bezpośrednio, lub przy wykorzystaniu odpowiednich narzędzi, w języku C.

Litery ni w nazwie funkcji są skrótem od angielskich słów not implemented.

Systemy Operacyjne - semestr drugi

uprzywilejowanego. Dokonywane to było z pomocą funkcji suser(). Wywo a ł nie jest wykonywane w kontekście procesu u y

ż tkownika, oznacza to, e

ż ma ono dost p

ę do

deskryptora procesu wywołującego za pomocą makrodefinicji current. Wywołanie systemowe mo n ż a zawiesić (wprowadzić proces, który je uruchomił w stan oczekiwania), je l

ś i musi ono poczekać na jakieś zdarzenia. Po zakończeniu jego wykonania sterowanie wraca do funkcji system_call(), a wartość przez nie zwrócona zapisywana jest w rejestrze eax.

Sposób uruchamiania i dzia a

ł nia wywołań systemowych dla procesorów opartych na innych architekturach jest bardzo podobny. Takie procesory posiadają odpowiednie mechanizmy, które pe n

ł ią taką samą rolę jak przerwanie 128. Przykładowo, procesory oparte na architekturze x86_64 posiadają rozkaz o nazwie syscall. W rezultacie jego wykonania uruchamiana jest wspomniana funkcja system_call(), której implementacja jest zapisana w pliku entry_64.S. Dzia a ł nie tej funkcji jest podobne jak jej

odpowiedniczki dla 32-bitowych procesorów Intela, ale wyst p

ę ują drobne ró n

ż ice. Numer wywołania jest jej przekazywany w rejestrze o nazwie rax, a parametry dla funkcji implementującej wywołanie systemowe są przekazywane za pomocą rejestrów rdi, rsi, rdx, r10, r8 i r9. Jeśli numer wywołania jest poprawny, to mno on ż y jest nie przez 4,

a przez 8. Wartość zwracana przez funkcję realizującą wywołanie systemowe zapisywana jest do rejestru rax. Ostatnia ró n ż ica polega na tym, e

ż warto c

ś i rejestrów przed

uruchomieniem funkcji realizującej wywo a

ł nie nie są odkładane na stos, gdyż te architektury procesorów nie wymagają tego. Dla nich modyfikator asmlinkage b d ę ący

makrem napisanym w j z

ę yku C jest zdefiniowany jako pusty.

Linux jako system dostępny na licencji GPL umożliwia modyfikowanie, dodawanie i usuwanie wywo a ł ń systemowych ka d

ż emu programi c

ś ie, który ma dost p

ę do kodu

ź ódłowego jądra i odpowiednie uprawnienia. W przypadku procesorów opartych na architekturze x86, w celu dodania nowego wywołania należy oprogramować funkcj , ę

która je obsłuży, dodać odpowiedni wpis do tablicy wywołań systemowych, która znajduje się w pliku entry_32.S, okre l ś ić numer wywołania w pliku

include/asm/unistd_32.h i skompilować kod r

ź ódłowy zmodyfikowanego jądra. Dla procesorów o architekturze x86_64 nie trzeba modyfikować pliku entry_64.h, a jedynie plik include/asm/unistd_64.h. W obu przypadkach kod funkcji obsługi wywołania nie mo e ż być umieszczony w module. Dodane przez nas wywołanie nie jest oczywi c ś ie

uwzględnione w a

ż dnej bibliotece języka C, mimo to mo em

y z niego skorzysta

ć w naszych aplikacjach. We wcze n

ś iejszych wersjach jądra mo n

ż a było w tym celu u y

ż ć jednej

z makrodefinicji _syscalln(), gdzie „n” oznacza liczbę argumentów przyjmowanych przez nasze wywołanie. Ka d ż a taka makrodefinicja przyjmowała 2*n+2 argumentów

wywo a

ł nia. Były to: nazwa typu warto c

ś i zwracanej przez wywołanie, nazwa wywołania i argumenty wywołania poprzedzone nazwami ich typów. Te makrodefinicje nie były dostępne we wszystkich platformach sprzętowych. Począwszy od wersji 2.6.18 jądra zosta y ł zastąpione przez funkcję syscall() i przestały być w ogóle dost p

ę ne. Funkcja

syscall() przyjmuje jeden parametr obowi z

ą kowy jakim jest numer wywołania systemowego oraz dowolną liczbę argumentów przekazywanych do niego. Zwraca status wykonania wywołania.

Dodanie do j d

ą ra nowych wywo a

ł ń systemowych jest kuszącym pomysłem, jednak e

ż w r

ś ód twórców jądra Linuksa panuje silna tendencja, aby togo nie robić. Po dok a ł dnych

rozwa a

ż niach mo n

ż a okre l

ś ić nast p

ę ującą list

ę wad i zalet tworzenia nowych wywo a

ł ń jądra:

Wady:

Konieczność przypisania wywołaniu numeru, który musi zosta

ć zaakceptowany przez g ów

nych programistów jądra Linuksa.

Interfejs wywołania powinien zostać zdefiniowany tak, aby nie trzeba go by o ł zmieniać w przyszłości, bo mogłoby to spowodować problemy z wykonywaniem programów, które z tych wywo a

ł ń korzystają.

Nale y

ż dostarczyć ró n

ż ych implementacji tego wywołania dla ró n

ż ych platform sprzętowych, dodatkowo dla ka d

ż ej z nich nale y

ż osobno odkre l

ś ić numer

wywo a

ł nia.

Nie należy implementować wywołania jako r

ś odka prostej komunikacji między procesami.

Zalety:

Wywołania mo n

ż a w prosty sposób implementowa

ć i również prosto si

ę z nich korzysta.

Ze względu na krótki czas przełączania kontekstu w Linuksie wywołania systemowe są bardzo wydajne.

W jądrze Linuksa serii 2.6 i nowszych dost p

ę nych jest r

ś ednio kilkaset6 wywoła .

ń w

Ś iadczy to o „dojrzało c

ś i” rozwojowej tego systemu. Przypadki usuwania istniejących

wywo a

ł ń są bardzo rzadkie. Większoś

ć wywołań jest prosta i dostarcza prostej funkcjonalno c

ś i. Jako wyjątek od tej reguły mo e

ż zostać przedstawione wywo a

ł nie ioctl(). Aby

uniknąć dodawania nowych wywołań mo n

ż a posłu y

ż ć si ,

ę rozwi z

ą ując jakiś problem, tym co dostarcza podsystem obsługi urządzeń i plików.

Liczba ta zmienia się w zależno c

ś i od platformy. Część sprz t

ę u na którym pracuje Linux wymaga specyficznych wywołań systemowych.