background image

17. Co to jest unikod? 

Unicode –  komputerowy zestaw  znaków mający  w  zamierzeniu  obejmować  wszystkie pisma używane  na 
świecie.  Definiują  go  dwa standardy –  Unicode  oraz  ISO  10646.  Znaki  obu  standardów  są  identyczne. 
Standardy te różnią się w drobnych kwestiach, m.in. Unicode określa sposób składu. 

Kodowanie Unicode 

Standard  Unicode  obejmuje  przydział  przestrzeni  numeracyjnej  poszczególnym  grupom  znaków,  nie 
obejmuje  zaś  sposobów  bajtowego kodowania  znaków.  Jest  kilka  metod  kodowania,  oznaczanych 
skrótowcami UCS (Universal Character Set) i UTF (Unicode Transformation Format). Do najważniejszych 
należą:

 

 

UTF-32/UCS-4 

 

UTF-16 

 

UTF-8. 

Mniej popularnymi kodowaniami Unicode są: 

 

UTF-7 

 

UCS-2. 

Istnieją również inne kodowania, stanowiące margines lub pozostające na etapie propozycji, na przykład: 

 

UTF-9 i UTF-18 

 

UTF-EBCDIC 

 

UTF-6 

 

UTF-5. 

 
Kody pierwszych 256 znaków Unicode pokrywają się z kodami ISO Latin 1 (czyli ISO-8859-1), przez co 
kody  pierwszych  128  znaków  pokrywają  się  z ASCII.  Należy  jednak  pamiętać,  że  jest  to  zbieżność 
wyłącznie  numerów  przyporządkowanych  konkretnym  znakom,  wartości bajtów użytych  do  ich  zapisania 
mogą (i w większości kodowań będą) się różnić od tych, które uzyska się stosując Latin 1 lub ASCII. 

 
Wprowadzanie znaków unicode 

Typowe  układy klawiatur udostępniają  tylko  niewielki  zbiór  znaków,  na  przykład  standardowe  polskie 
układy  klawiatury  zawierają  wyłącznie  polskie  litery  i  znak euro,  nie  zawierają  natomiast  znaków 
cudzysłowu. Do wprowadzania znaków nieobecnych na klawiaturze można użyć jednej z poniższych metod: 

 

W systemie Windows NT, Mac OS X (od wersji 10.2) oraz w licznych dystrybucjach Linuksa (ze 
środowiskiem graficznym) dostępna jest tablica znaków, w której można wyszukać potrzebny znak, 
skopiować go do schowka, a następnie wkleić w program. W Systemach Windows 95, 98 i ME tablica 
znaków nie daje dostępu do wszystkich znaków Unicode. 

 

Znając numer pozycji znaku (czy to dziesiętny, czy to szesnastkowy), można wprowadzić ten znak na 
kilka sposobów (nie wszystkie programy obsługują wszystkie opisane tu sposoby): 

 

Trzymając naciśnięty (lewy) Alt i wpisując z klawiatury numerycznej numer dziesiętny tego znaku, 

po czym zwolnić klawisz Alt. 

background image

 

Wpisać numer szesnastkowy tego znaku, a następnie wcisnąć kombinację (lewy) Alt+x. Przed 
numerem szesnastkowym nie może być cyfra ani litera z zakresu af (gdyż zostaną uznane jako 
część kodu, ewentualnie należy poprzedzić kod np. spacją lub uzupełnić kod wiodącymi zerami, tak 
by liczył dokładnie sześć pozycji). 

 

Trzymając naciśnięty (lewy) Alt nacisnąć klawisz plus, wpisać numer szesnastkowy znaku, po czym 
zwolnić klawisz Alt. Metoda ta działa w systemie Windows XP i nowszych. 

 

Trzymając naciśnięte klawisze Ctrl+Shift wpisać numer szesnastkowy znaku, a następnie puścić 
klawisze. Metoda ta działa w środowisku GNOME. Od wersji GTK+ 2.10 należy nacisnąć 
Ctrl+Shift+u, wprowadzić kod szesnastkowy znaku, nacisnąć Enter. 

 
Nazewnictwo  

 
Rada Języka Polskiego proponuje nazwę unikod dla każdego systemu unifikacji kodyfikacji liter.