podstawy teorii informacji E5X5 Nieznany

Podstawy teorii informacji

- teoria informacji
- teoria kodowania (kody optymalne, korekcyjne)
- podstawy kryptografii

Teoria informacji

Co jest nośnikiem, co zawartością (dane, informacja, wiadomości)

⇒ pojęcia podstawowe

należy wyróżnić.

• wiadomość //nośnik//

syntaktyka
słowo, zdanie
dane
nazwa

• informacja //zawartość//

semantyka
treść słowa, zdania
interpretacja danych
pojęcia

Przetwarzanie wiadomości:

α - przekształcenie

⎯

⎯ ⎯

←

⎯

⎯ →

⎯

−

- odwracalne, bez straty informacji

⎯

⎯ →

⎯

- ze stratą informacji

Elementy teorii grafów

Euler chciał przejść przez każdy most w Kaliningradzie dokładnie raz.

Grafem nazywamy trójkę

Γ=(E, K, r), gdzie:

E - niepusty zbiór, którego elementy nazywamy wierzchołkami (węzłami) grafu

K - zbiór, którego elementy nazywamy krawędziami grafu

r - relacja incydencji przypisująca każdej krawędzi co najmniej jeden i co najwyżej

dwa wierzchołki

Przedstawienia grafu:

• graficzne

• zbiór par

(

) (

)

{

}

k e

;

;... , gdzie k

oznacza i-tą krawędź a e

j-ty wierzchołek

• macierz incydencji

e e e e

1 1 1 0
1 0 1 1
1 1 0 1
0 1 1 0

⎡

⎣

⎢

⎤

⎦

⎥

- tu nie rozróżniamy krawędzi

e e e e

1 0 0 0
1 0 1 0

⎡

⎣

⎢

⎤

⎦

⎥

Krawędź, z którą jest incydentny dokładnie jeden wierzchołek nazywamy pętlą.

Rzędem (stopniem) wierzchołka

nazywamy liczbę incydentnych z nim krawędzi, przy

czym pętle liczymy dwukrotnie.

Drogą

w grafie nazywamy ciąg, w którym występują na przemian wierzchołki i krawędzie;

wierzchołki i krawędzie sąsiadujące są incydentne. Drogą zamkniętą nazywamy drogę, w
której pierwszy wierzchołek jest też ostatnim. Rozróżniamy również drogę otwartą. Droga
prosta

to taka na której wierzchołki nie powtarzają się. Długością drogi nazywamy liczbę

krawędzi do niej należących.

Drogę, w której wszystkie krawędzie są różne nazywamy łańcuchem. Łańcuch, który jest
drogą zamkniętą to cykl.

Drogą Eulera

nazywamy cykl zawierający wszystkie krawędzie grafu. W grafie istnieje taka

droga, gdy wszystkie wierzchołki mają parzysty stopień. Drogą jednobieżną lub otwartą
drogą Eulera

nazywamy łańcuch, który nie jest cyklem, zawierający wszystkie krawędzie

grafu. W grafie istnieje taka droga, gdy dokładnie dwa wierzchołki mają nieparzysty stopień.

Łańcuch Hamiltona to

droga prosta zawierająca wszystkie wierzchołki grafu.

Graf jest spójny wtedy gdy dla dowolnych dwóch wierzchołków istnieje droga, w której
wierzchołki te są wierzchołkami początkowym i końcowym.

Graf nazywamy zorientowanym lub skierowanym jeżeli każdej krawędzi
przyporządkujemy wierzchołek początkowy i końcowy.

• relacje incydencji

( )

(

)

( )

{

}

k e

;

;... , przy czym e

oznacza, że wierzchołek jest

początkowy, natomiast e

że jest końcowy

• macierz:

e e e

⎡

⎣

⎢

⎤

⎦

⎥

i a oznacza wierzchołek początkowy, b oznacza końcowy, p.

oznacza początkowy i końcowy jednocześnie, a 0 oznacza, że jest nieincydentny

Grafy ważone

to grafy, w których krawędziom przyporządkowane są liczby rzeczywiste

(wagi).

Grafy spójne zawierające co najmniej jedną krawędź i nie zawierające cykli nazywamy
drzewem

Graf zorientowany nazywamy drzewem zorientowanym gdy zawiera on dokładnie jeden
węzeł, który nie jest węzłem końcowym żadnej krawędzi (korzeń), a każdy z pozostałych
węzłów jest węzłem końcowym dokładnie jednej krawędzi. Poziomem węzła nazywamy
długość drogi od korzenia do tego węzła.

Jeżeli liczba krawędzi wychodzących z każdego węzła jest ograniczona z góry liczbą r to
drzewo nazywamy r-narnym. Jeżeli poziomy wszystkich węzłów końcowych są jednakowe i
równe h to drzewo nazywamy drzewem h-poziomowym. Jeżeli w drzewie r-narnym z
każdego węzła nie będącego liściem wychodzi dokładnie r krawędzi to drzewo nazywamy
drzewem pełnym

Nierówność Krafta

: Liczby naturalne m

, m

, ..., m

, są poziomami końcowymi drzewa r-

narnego gdy:

−

∑

≤

Zbiory wiadomości

Rodzaje zbiorów:

• prosty:

{

}

w w

,...,

, gdzie w

- wiadomość elementarna

• złożony: zbiór wiadomości zawiera ciągi

{

}

w w

,...,

, gdzie w

∈

Przykład

{

}

= 01

, ,..., , k = 4,

(

) (

)

0000

9999

−

• wielowymiarowy: A A

,...,

- zbiory proste, m wymiarowym zbiorem wiadomości

określonym na zbiorach prostych A A

,...,

nazywamy iloczyn kartezjański

× ×

...

Przykład

{

}

= 1 2

, ,...,

{

}

I II

XII

= , ,...,

{

}

= 0000 0001

9999

,...,

np. 12 X 1995, UWAGA! D M L

× ≠ ×

Ilość informacji. Źródło wiadomości.

Ilość informacji to wielkość związana z prawdopodobieństwem pojawienia się,
wygenerowania tej informacji. Im większe prawdopodobieństwo, tym mniejszą ilość
informacji niesie wiadomość.

{

}

w w

,...,

Def.

( )

I w

p w

= log

Ilość informacji wyrażamy w jednostkach r-narnych. Np. gdy r = 2 to jednostką jest bit, a gdy
r = e to jednostką jest nat.

Jeżeli dane są zbiór wiadomości

{

}

w w

,...,

i prawdopodobieństwa wygenerowania

tych wiadomości

( ) ( )

( )

p w

,...,

to mamy określone źródło wiadomości.

Def. Źródło nazywamy źródłem bezpamięciowym jeżeli prawdopodobieństwo

(

)

( )

p w w

p w

⋅

Inaczej:

(

) ( )

p w

dla i,j = 1,2,...,n

Umowa: co wcześniej, co później

(

)

w w

- to oznacza, że pojawiła się wiadomość w

przed

Def. Średnią ilość informacji przypadającą na wiadomość generowaną przez źródło
nazywamy entropią źródła.

( )

( ) ( )

( )

H W

p w

I w

p w

⋅

∑

log

( )

p w

, r

= 2

( )

H W

⋅

∑

log

Tw.

Entropia przyjmuje wartość maksymalną, gdy p

= =

...

i równa jest

log

Identyfikacja źródła wiadomości.

W={ w

, w

, ..., w

}, p

, p

, ..., p

Aby wiedzieć jaką wiadomość wysyła to źródło to mamy zestaw pytań r-narnych. Nazywa się
to systemem identyfikacji źródła wiadomości.

Każdej wiadomości w systemie identyfikacji odpowiada pewna liczba zapytań, oznaczamy ją
przez

l , dla wiadomości

w . Jakość systemu identyfikacji określa wtedy średnia liczba

pytań przypadająca na wiadomość.

( )

E s

p l

⋅

∑

Kody - podstawowe pojęcia.

Zbiór wiadomości - W, alfabet, zbiór liter alfabetu - X.

Def. Kodem nazywamy dowolne przyporządkowanie, w którym każdemu ciągowi
wiadomości ze zbioru W odpowiada ciąg liter alfabetu ze zbioru X.

Przykład.

{

}

w w w w

{ }

= 01

albo

0 0

1 00

0 11

1 00

Kod nazywamy blokowym jeśli każdej wiadomości w

ze zbioru W odpowiada ciąg x

(ciąg

kodowy

, słowo kodowe) ze zbioru X.

Def. Kod blokowy nazywamy kodem nieosobliwym jeżeli słowa kodowe są parami różne.

Przykład.

albo

00 0

01 00

11 1

10 11

Def. K-krotnym rozszerzeniem kodu blokowego nazywamy kod, w którym każdemu
ciągowi wiadomości (w

, w

, ..., w

) ze zbioru W odpowiada ciąg liter alfabetu (x

, x

, ...,

) gdzie x

- słowo kodowe odpowiadające wiadomości w

Przykład.

(

)

( )

w w

1 1

→

(

)

(

)

w w

000

→

(

)

( )

w w

→

..................

(

)

(

)

w w

1111

→

Def. Kod blokowy nazywamy kodem jednoznacznie dekodowalnym wtedy, gdy k-krotne
rozszerzenie tego kodu jest kodem nieosobliwym dla dowolnego k.

Przykład.

{

}

w w w w

00 0

01 01

10 011

11 0111

Def. Kod blokowy nazywamy kodem jednoznacznie dekodowalnym bez opóźnienia,
wtedy, gdy żadne słowo kodowe nie jest przedrostkiem żadnego innego słowa kodowego.
Kod jest kodem równomiernym, gdy słowa kodowe są równej długości.

Konstrukcja kodów jednoznacznie dekodowalnych bez opóźnienia

Źródło

{

}

w w

,...,

i p p

, ,...,

System identyfikacji, r = 3
Znając r-narny system identyfikacji źródła wiadomości kodujemy r-narny kod jednoznacznie
dekodowalny bez opóźnienia za pomocą następującej procedury:

1. Krawędzie wychodzące z każdego węzła drzewa oznaczamy różnymi literami alfabetu.
2. Spisujemy litery oznaczające krawędzie należące do drogi od korzenia do każdego węzła

końcowego. Ciągi liter odpowiadające poszczególnym węzłom końcowym są słowami
kodowymi wiadomości przyporządkowanych tym węzłom.

Def. Kod

r-narny zbudowany zgodnie z podaną procedurą jest kodem jednoznacznie

dekodowalnym bez opóźnienia.

Znając kod r-narny jednoznacznie dekodowalny bez opóźnienia można zbudować r-narny
system identyfikacji źródła wiadomości stosując następującą procedurę:

1. Budujemy h-poziomowe r-narne drzewo pełne, w którym h równe jest maksymalnej

długości słowa kodowego danego kodu.

2. Krawędzie wychodzące z każdego węzła oznaczamy różnymi literami alfabetu.
3. Redukujemy drzewo pozostawiając wyłącznie krawędzie, które tworza drogi od korzenia

do węzłów końcowych oznaczone literami zgodnymi ze słowami kodowymi kodu.

4. Węzły końcowe zredukowanego drzewa oznaczamy odpowiednimi wiadomościami a

pozostałym węzłom przyporządkowujemy odpowiednie pytania r-narne

( ) ( )

l w

d w

dla i = 1,2,...,k

( )

E s

p l

⋅

∑

; średnia liczba pytań r-narnych

( )

E k

d l

⋅

∑

; średnia długość słowa kodowego

( )

E s

E k

Dane jest źródło

⎯

⎯ →

⎯

i p p

, ,...,

Mówimy, że kod K

jest lepszy od kodu K

jeżeli średnia długość słowa kodowego

( )

E K

Kod K nazywamy kodem optymalnym, jeżeli dla każdego kodu K'

( )

E K

≤

Używana jest również nazwa kod zwięzły.

Źródło rozszerzone

- zbiór złożony
- kod rozszerzony (k - krotne rozszerzenie kodu)

{

}

w w

,...,

i p p

, ,...,

- źródło bezpamięciowe

k - krotnie rozszerzone

{

}

w w

k n

⋅

,...,

, gdzie

(

)

w w

,...,

, w

∈ , dla j = 1,...,k

( ) ( ) ( ) ( )

p w

⋅

⋅ ⋅

...

Entropia tego źródła:

( )

H W

p w

⋅

∑

log

( )

H W

p w

⋅

∑

log

Można wykazać, że

( )

H W

k H W

= ⋅

Źródło ciągów Markowa

{

}

w w

,...,

Mówimy, że źródło W jest źródłem ciągów Markowa m - tego rzędu, jeżeli znane są
prawdopodobieństwa warunkowe:

(

)

P w

,...,

(

) (

)

(

)

(

) (

)

(

)

(

) (

)

(

)

p w

⎡

⎣

⎢

⎤

⎦

⎥

L
L

( ) (

) (

)

(

)

p w

p w w

+ +

...

( ) (

) ( ) (

) ( )

(

) ( )

p w

⋅

+ +

⋅

...

(

)

( )

w w

→

Ilość informacji pod warunkiem, że źródło w określonym stanie:

(

)

(

)

I w

p w

,...,

log

,...,

Średnia ilość informacji zawartej w wiadomości wygenerowanej w określonym stanie:

(

)

(

) (

)

∑

⋅

,...,

A ogólnie , w dowolnym stanie:

( )

(

) (

)

∑

⋅

,...,

( )

(

)

(

) (

)

⎟

⎠

⎞

⎜

⎝

⎛

⋅

⎟

⎠

⎞

⎜

⎝

⎛

∑

,...,

( )

(

) (

)

(

)

H w

p w

⋅

∑

,...,

log

,...,

{

}

w w

,...,

- źródło bezpamięciowe generujące wiadomości z

prawdopodobieństwami równymi prawdopodobieństwom ergodycznym źródła Markowa m -
tego rzędu. Nazywamy je źródłem stowarzyszonym.

( )

H w

≥

równość ta ma miejsce wtedy i tylko wtedy gdy prawdopodobieństwa:

(

)

( )

p w

,...,

dla wszystkich stanów.

Kody optymalne

{

}

w w

,...,

; p p

, ,...,

;

( )

E k

−

Tw.

( )

E k

H w

≥

- żeby zapisać wiadomość ze źródła W potrzeba zorganizować

przynajmniej tyle ile wynosi średnia ilość informacji

Tw. Dla dowolnego źródła wiadomości

{

}

w w

,...,

; p p

, ,...,

można zbudować

kod jednoznacznie dekodowalny bez opóźnienia taki, że:

( )

H w

E k

H w

≤

(jedna jednostka r-narna)

• Algorytm wyznaczania r-narnego kodu dla źródła

{

}

w w

,...,

;

p p

, ,...,

;

1. Rozszerzać źródło wiadomości dodając wiadomości z prawdopodobieństwami

równymi 0, aż liczba wiadomości będzie równa

(

)

+ ⋅ −1

, k N

∈ .

2. Uporządkować wiadomości wg niemalejących wartości prawdopodobieństw.
3. Zastąpić r wiadomości z najmniejszymi prawdopodobieństwami jedną wiadomością z

prawdopodobieństwem równym sumie prawdopodobieństw wiadomości
zastępowanych.

4. Sprawdzić czy liczba wiadomości jest równa 1. Jeśli nie, to wykonać czynność 2.

Jeżeli tak to czynność 5.

5. Zbudować r-narne drzewo, w którym węzły odpowiadają wiadomościom, a krawędzie

łączą węzły (wiadomości) za zastępujące z wiadomościami zastępowanymi.

6. Zbudować r-narny kod zgodny z drzewem otrzymanym (r-narnym) tj.

oznaczyć krawędzie literami alfabetu

ustalić ciągi liter na drogach od korzenia do liści

Tw. Kod wyznaczony zgodnie z powyższym algorytmem jest kodem optymalnym

Tw. (Shannona) Dla kodu

(źródła k-krotnie rozszerzonego) spełniającego warunek

( )

H W

E K

H W

≤

zachodzi zależność:

( )

lim

E K

H W

→∞

Jeżeli zbudujemy taki kod to dla kolejnych rozszerzeń źródła wiadomości mamy ciąg, którego
granicą jest średnia entropia źródła wiadomości.

Metody kompresji

Jak przedstawić krócej wiadomości niż zostały przedstawione?
Jeśli

( )

E K

H W

, to nie da się krócej zapisać ciągu.

Jeśli

( )

E K

H W

≠

, to ciąg z nadmiarem.

( )

H W

E K

- sprawność kodu,

< ≤

( )

= − =

−

E K

H W

E K

- rozwlekłość (redundancja) kodu

wej

- długość ciągu początkowego

wyj

- długość ciągu po zastosowaniu kompresji

wej

wyj

- jakość kompresji (współczynnik)

Metody kompresji dzielimy na:
a) bez straty informacji (odwracalne)
b) ze stratą informacji (nieodwracalne)

• Kompresja ciągów binarnych

1. Bezpośrednie kodowanie runów

Runem nazywamy dowolny skończony podciąg binarny. Będziemy wyróżniać runy tzw.
zerowe i jedynkowe. Runy zerowe to ciąg złożone z zer i zakończonych jedynką, a
jedynkowe na odwrót.

Runy zerowe

(1)

(01) (001) (00...001)

Runy jedynkowe (0)

(10) (110) (11...110)

Ciąg zerowy

(00...00)

Ciąg jedynkowy (11...11)

Podany ciąg binarny dzielimy na runy; wyznaczamy prawdopodobieństwa występowania
tych runów; wtórnie kodujemy;

Przykład.
01 001 1 001 01 01 1 01 000 01 000 01 1
n - maksymalna długość runu i również długość ciągu zerowego

1 - 3

( )

01 - 6

( )

001 - 2

( )

001

000 - 2

( )

000

2. Metoda Golomba

n - parametr

= 2

, czyli n = 2,4,8,...

Każdemu runowi przyporządkowany jest ciąg binarny złożony z rdzenia, separatora i
końcówki.
• rdzeń - ciąg złożony wyłącznie z liter 1, których liczba jest równa części całkowitej

−1

, gdzie l - długość runu

• separator - zawsze litera 0

• końcówka - ciąg będący resztą z dzielenia

−1

zapisany na

log n

pozycjach

3. Rozrzedzanie ciągów

Dzieli się ciąg binarny na podciągi o określonej długości i ponownie koduje dając temu,
który występuje najczęściej same zera.

• Kompresja obrazów

1. Kompresja obrazów czarno-białych

Przedstawienie za pomocą wyrażenia z nawiasami

(O) = ((I)(II)(III)(IV)) = (0(101(0(0101)01))(0(1100)0(1011))1)
1 - pole czarne
0 - pole białe

{

}

( 00
) 01

0 10
1 11

przedstawienie za pomocą drzewa czwórkowego

2. obrazy z gradacją kontrastu

p - pole

- piksel

( )

- stopień szarości

- liczba pikseli należących do p

( )

- średni stopień szarości pola p

( )

∑

∈

( )

- odchylenie standardowe stopnia szarości pikseli w polu p

( )

( ) ( )

(

)

∑

∈

−

δ - wartość progowa odchylenia standardowego stopnia szarości pikseli

Kanały informacyjne

Nadawca:
- generowanie wiadomości
- kodowanie
- modulacja

NADAWCA

KANAŁ

ODBIORCA

Kanał
- przesyłanie

Odbiorca
- odbiór
- demodulacja
- dekodowanie

Kanał informacji to:
1. Źródło wiadomości

{

}

w w

,...,

;

p p

,...,

2. Macierz kanału (kanał)
3. Zbiór informacji odebranych:

{

}

z z

, ,...,

;

( ) ( )

( )

p z

,...,

Macierz kanału P jest macierzą prawdopodobieństw warunkowych

(

)

p z

, gdzie

i =1,2,...,n, j = 1,2,..,m

⎡

⎣

⎢

⎤

⎦

⎥

L
L

(

)

p z

Kanał definiujemy też jako macierz P. Musi ona spełniać warunki:

(

)

p z

= ⇔

∑

Przykład.

⎡
⎣

⎢

⎤
⎦

⎥

, to może być macierz kanału

Interpretacja: jeżeli była nadana jakaś wiadomość, to musi być odebrana jako jakaś
wiadomość ze zbioru Z.

Typy kanałów:
1. Kanał idealny

(W i Z równoliczne)

( )

card W

card Z

oraz

(

)

p z

= ∨

0 1

2. Kanał odwracalny

(ogólniejszy)

( )

card W

card Z

≤

; Na podstawie odebranej wiadomości jednoznacznie

wiemy, co nadano.

3. Kanał deterministyczny

( )

card W

card Z

≥

; Wiemy jaka wiadomość będzie odebrana, jeśli wiemy jaką

nadaliśmy.

1. Kanał binarny (symetryczny)

−

⎡
⎣

⎢

⎤
⎦

⎥

Parametry kanału informacyjnego

(

)

[

]

p z

;

(

)

p w

Mamy źródło wiadomości

{

}

w w

,...,

; p p

,...,

(

) ( ) ( )

p w

p z

p w z

⋅

(

)

( )

(

)

p z

p w

p w z

⋅

← kolejność nie jest istotna

⇓

(

) ( ) (

)

( )

p w

p z

p w

⋅

(

) (

)

( )

p w

p z

p w

p z

⋅

( ) (

)

( )

(

)

( )

(

)

( )

p z

p w

p z

p w

p z

p w

⋅

+ +

⋅

...

⇓

( )

(

)

( )

p z

p w

⋅

∑

( )

(

)

[

]

p w

−

- macierz kanału odwróconego, macierz prawdopodobieństw odwrotnych

•

(

)

(

)

I w

p w

log

; w idealnym

= 0

, jak różne to warto się zapytać o średnią

•

(

)

(

) (

)

(

)

(

)

H w z

p w

I w

p w

log

⋅

∑

(

)

( ) (

)

H W Z

p z

H W z

⋅

∑

(

)

( )

(

)

(

)

( ) (

)

(

)

H W Z

p z

p w

p z

p w

log

⋅

⎛

⎝

⎜

⎞

⎠

⎟

⎟ =

⋅

∑

(

)

(

)

(

)

H W Z

p w z

p w

log

⋅

∑

i to się nazywa stratą informacji w kanale

•

(

)

I W Z

- średnia ilość informacji przekazywanych przez kanał informacyjny

•

( )

H W

- średnia po stronie nadawcy

( )

(

)

(

)

H W

H W Z

I W Z

−

⇓

(

)

( )

(

)

( )

(

)

(

)

I W Z

H W

H W Z

p w

p w z

p w

log

−

⋅

−

⋅

∑

a ponieważ:

( )

(

)

( )

p z

p w

⋅

∑

( )

(

) ( )

p w

p z

⋅

∑

(

)

p w z

∑

mamy więc:

(

)

(

) ( )

( )

(

)

(

)

(

)

( )

(

)

(

)

(

)

(

)

( )

I W Z

p w

p z

p w

p w z

p w

p w z

p w

p w z

p w

p w z

p w

log

⋅

⎛
⎝

⎜

⎞
⎠

⎟ ⋅

−

⋅

−

⋅

∑

ale zauważmy:

(

) ( ) ( )

p w

p z

p w z

⋅

, a stąd

(

) (

)

( )

p w

p w z

p z

⇓

(

)

(

)

(

)

( )

∑∑

⋅

log

I tu symetria, przestawiamy w

z z

i to ma praktyczną INTERPRETACJĘ:

(W|Z)

(Z|W)

(W)

(Z)

(W,Z)

Def. Przepustowość kanału

( )

(

)

(

)

I W Z

= max

//ustalona poprzez dobieranie prawdopodobieństw wiadomości generowanych przez źródło//

( )

(

)

Π W

p p

⎧

⎨

⎩

⎫

⎬

⎭

∑

,...,

( )

p w

//bardzo złożony algorytm wyznaczania tego//
Interpretacja:

[

]

(

)

(

)

[

]

[

]

p z

n m

n - wierszy, m - kolumn

Reguły decyzyjne

Pozwalają określić jaka wiadomość została nadana

- wiadomość odebrana

w * - wiadomość przyjęta z a nadaną (ustalona jako nadana)

Miara błędu, jaki popełniamy:

( )

(

)

p e z

p w

* /

= −

Średni błąd decyzji:

( )

p e

p e z

p zj

⋅

∑

Dobre decyzje - gdy minimalizujemy tę sumę, czyli gdy przyjmiemy taką wiadomość w
każdym przypadku, aby błąd konkretnej decyzji wiadomości był minimalny:

(1.)

(

) (

)

p w

* /

≥

, gdzie i = 1,2,...,n

Czyli bierzemy teraz macierz kanału odwróconego

( )

−1

. Sposób wyboru decyzji nazywamy

regułą decyzyjną

. (1.) nazywana jest regułą największego prawdopodobieństwa.

Przykład.

{

}

w w w

{

}

z z z

, ,

, p

= ,2 , p

= ,7 , p

0 1

= ,

z z z

⎡

⎣

⎢

⎤

⎦

⎥

0 1 0

0 8 0 1 0 1

0 1 0

0 5

i na tej podstawie, na podstawie macierzy kanału nie da się tego

określić!!

Napiszmy tę samą regułę inaczej:

(2.)

(

)

( )

(

)

( )

p z

p w

p z

p w

p z

/ *

⋅

≥

⋅

i tu widzimy jak obliczać ale jeszcze inaczej:

(3.)

(

)

( )

(

)

( )

p z

p w

p z

p w

/ *

⋅

≥

⋅

Jeśli nie znamy prawdopodobieństw p p

,...,

i nie mamy żadnych innych przesłanek to

przyjmuje się, że:

= =

...

(Największej wiarygodności)

⇓

(4.)

(

) (

)

p z

/ *

≥

, dla i = 1,2,...,n

Mówimy, że określona jest reguła decyzyjna jeżeli wiemy jaką wiadomość przyjąć za
nadaną, gdy znamy wiadomość odebraną.

Przykład.

{

}

z z

, ,...,

{

}

w w w

{ }

{

}

z z

{

}

z z

Reguła decyzyjna jest określona przez funkcję:

→

, gdzie Z jest podziałem zbioru wiadomości odebranych Z, czyli

{

}

= z z

, ,...,

gdzie z

⊆ dla i = 1,2,...,k; z

∩

= 0 dla i

≠ ;

Strata i ryzyko

Przykład.

(

)

R w w

- funkcja strat, gdzie:

-wiadomość rzeczywiście nadana

w * - wiadopmość ustalona jako nadana

• ogólny przykład definiowania:

{

}

w w

, R - w dowolnych jednostkach

(

)

(

)

R w w

(

)

(

)

R w w

c w

−

, gdzie w

−

≠

⎧

⎨

⎩⎪

gdy

{

}

w w

,...,

( )

c w

−

• Ustalona jest reguła decyzyjna r i funkcja strat

(

)

R w w

Średnia strata przy stosowaniu reguły r określa wówczas funkcja:

(

)

(

)

R w w

p w z

⋅

∑

Kody korekcyjne

Przestrzeń wektorowa

( )

W przestrzeni wektorowej

( )

elementami są ciągi (wektory) binarne.

Należy określić operacje dodawania wektorów i mnożenia wektora przez skalar.

Oznaczenia: a, b, c - skalary, u, v, w - wektory

Dodawanie:

(

)

,...,

(

)

,...,

(

)

⊕

,...,

gdzie

⎩

⎨

⎧

≠

⊕

gdy

, czyli

(

)

mod

⊕

Kody liniowe - struktura i własności

Def. Zbiór

słów kodowych oznaczać będziemy przez

( )

K n k

, - kod liniowy, w którym n -

długość słowa kodowego, k - liczba pozycji informacyjnych niezbędnych do rozróżnienia 2

kodowanych wiadomości

Def. Odległością

( )

d u v

, słów kodowych u i v kodu

( )

K n j

nazywamy liczbę pozycji, na

których wartości w ciągach u i v są różne.

Def. Wagą słowa

( )

w v

słowa kodowego v nazywamy liczbę jedynek występujących w tym

słowie.

Def. Minimalną odległością słów kodowych kodu K nazywamy liczbę

( )

d u v

u v K
u v

∈

≠

min

liczba d nazywana jest również minimalną odległością kodu K

Tw. Minimalna odległość kodu K jest równa minimalnej wadze słowa kodowego v, gdzie

∈ i v ≠ 0

( )

w v

v K
v

∈

≠

min

Tw.

W kodzie liniowym spełniona jest nierówność d

≤ − +1

Przykład.

(

)

= 10111

(

)

= 11101

(

) (

)

10111

01010

11101

Tw. Jeżeli znamy wektor błędów e to możemy ustalić wektor v na podstawie odebranego
wektora v’, a mianowicie: v v e

= +

Przykład.

(

)

= 11101

(

)

= 01010

(

)

= 10111

• Opis kodu za pomocą macierzy

Zauważmy, że kod liniowy (podprzestrzeń

( )

2 ) jest jednoznacznie określony przez

macierz złożoną z wektorów tworzących podprzestrzeń. Macierz tę nazywamy macierzą
generującą kod liniowy, oznaczoną literą G.

Przykład. n

= 5 , k = 5 ,

( )

2 zawiera 2

wektorów

⎡

⎣

⎢

⎤

⎦

⎥

1
0
0

0
1
0

0
0
1

1
0
1

1
1
0

Macierz generującą można przekształcić zamieniając kolumny i zastępując niektóre wiersze
kombinacjami liniowymi.

Przykład.

⎡

⎣

⎢

⎤

⎦

⎥

1
1
0

0
1
0

0
0
1

1
0
1

1
0
0

G''

⎡

⎣

⎢

⎤

⎦

⎥

0
1
0

1
1
0

0
0
1

1
0
1

1
0
0

Kody generowane przez tak przekształcone macierze nazywamy kodami równoważnymi.

Mówimy, że macierz G generująca kod K jest macierzą w postaci kanonicznej jeżeli:

[

]

(

)

[

]

[

]

k k

n k

× −

i macierz z przykładu jest w postaci kanonicznej.

Skoro kod K jest podprzestrzenią przestrzeni

( )

2 zatem istnieje podprzestrzeń, która jest

ortogonalnym dopełnieniem przestrzeni K. Oznaczamy ją przez K

⊥

. K

⊥

jest kodem liniowym

(bo każda podprzestrzeń

( )

2 jest kodem liniowym)

Kody K i K

⊥

nazywamy kodami dualnymi

Niech H będzie macierzą generującą kod K

⊥

Zauważmy, że jeżeli K jest kodem (n, k) to K

⊥

jest kodem (n, n-k). Zatem macierz H ma

rozmiar

(

)

[

]

−

× . Wynika stąd, że:

v H

⋅

= 0 (wektor zerowy o długości n-k) Á v ∈K

i G H

⋅

= 0 (macierz zerowa)

Tw. Macierz

H generującą kod dualny K

⊥

nazywamy macierzą kontrolną kodu K i

odwrotnie: macierz G nazywać będziemy macierzą kontrolną kodu K

⊥

Tw. Jeżeli macierz G jest w postaci kanonicznej, to

(

)

[

]

(

) (

)

[

]

[

]

n k

− ×

− × −

Dowód:

G H

⋅

= 0,

[ ]

G H

I P

⋅

⎡

⎣

⎢

⎤

⎦

⎥

= + =

Przykład.

⎡

⎣

⎢

⎤

⎦

⎥

1
0
0

0
1
0

0
0
1

1
0
1

1
1
0

M
M
M

⎡
⎣

⎢

⎤
⎦

⎥

1
1

0
1

1
0

0
1

M
M

⎡

⎣

⎢

⎤

⎦

⎥

L L

G H

⋅

⎡

⎣

⎢

⎤

⎦

⎥

⎡

⎣

⎢

⎤

⎦

⎥

⎡

⎣

⎢

⎤

⎦

⎥

1 1
0 1
1 0

1 1 1 1

0 0 1 1

1 1 0 0

Kodowanie i dekodowanie

, H ,

( )

n k

- wiadomość

∈ , v

- część informacyjna

Elegancka metoda kodowania

v G

= ⋅

( )

∈

i sprawdzanie:

w H

⋅

= 0 to w K

∈ , w v

w H

⋅

≠ 0 to

przyjmujermy,

że nadane zostało słowo kodowe najblizsze odebranemu

ciągowi w (czyli v, jak dobrze przygotowany ciąg liczy się odległość i trzeba policzyć do
każdego ale w praktyce: )

Przykład.

(

) (

)

w k

= 100 50

słów

( )

10 5

⋅

≈

, czyli po stwierdzeniu, że to nie jest słowo kodowe to

porównanie jest potężnie złożone, ale jest bardziej racjonalna metoda (UNIWERSALNA)

Niech v

v v

= , , ,...,

będą słowami kodowymi kodu

( )

n k

( )

2 2

wektorów i to

możemy rozwiązać, bo może się pojawić któryś z nich:
// l

- wektor o długości l zawierający jedynkę na n-tej pozycji

1 warstwa

...

2 warstwa

+ l

3 warstwa

+ l

//żaden z tych ciągów nie jest równy poprzedniemu, bo jedynka na innej pozycji, jak się

skończy to 2 jedynki i znów na innej pozycji i tych warstw będzie: //

n k

−

warstwa

−

n k

−

n k

−

n k

−

n k

//nowa warstwa będzie już powtórzeniem, ta tablica 2

n k

−

warst zawiera wszystkie wektory

przestrzeni

( )

2 //

Iloczyn s v H

= ⋅

, gdzie

( )

∈

2 nazywamy syndromem błędów (wskaźnikiem błędów)

Zauważmy, że jeżeli ciągi v i v' należą do tej samej warstwy to syndromy błędów dla tych
ciągów są sobie równe

Wprowadzenie do kryptografii

M - tekst jawny

- tekst niejawny

E - algorytm szyfrowania
D - klucz szyfrowania

E - przekształcenie szyfrujące

D przekształcenie deszyfrujące

( )

(

)

- poufność danych

- autentyczność danych

( )

(

)

( )

(

)

Szyfr - sposób zapisania danych taki, aby był on utajniony

Szyfry dzielimy na:
• przestawieniowe
• podstawieniowe

Przestawieniowe (zmiany pozycji poszczególnych znaków)
• sztachetowe
• macierzowe albo tablicowe, kolumnowe

Przykład: KRYPTOGRAFIA
1) zapisujemy w postaci tablicy

[

]

←

parametr

⎥

⎦

⎤

⎢

⎣

⎡

⎥

⎦

⎤

⎢

⎣

⎡

2) odczytujemy kolumnami KYTRPOGAIRFA

Klucz może być w postaci

[

]

, gdzie cyfry następujące po wymiarze tablicy są

kolejnością czytania kolumn

• permutacyjne

f: X

→

i = (123)
f(i) = (231)
KRY PTO GRA FIA

→

RYK TOP RAG IAF

Podstawieniowe
• 1 - 1 monoalfabetyczne
• 1 - n
• m - n poligramowe

a) ABCDEFGHIJKLMNOPQRSTUWXYZ //Cezara k=2
np. BAL

⇒

DCN

//zmodyfikowany Cezar
SZYFRABCDEG...
SZYFR to klucz, musi być jednoznaczny

//uogólniony i trudniejszy
1.

( ) (

)

mod

, gdzie a - numer litery, n - liczba liter

wyrażenie deszyfrujące ma postać:

( )

( ) (

)

mod

−

( ) (

)

mod

⋅

, gdy

( )

NWD

wtedy jednoznacznie

wyrażenie deszyfrujące ma postać:

( )

(

)

mod

−

⋅

Arytmetyka modularna (resztowa)

Liczby całkowite a i b nazywamy liczbami kongruentnymi (przystającymi) według modulo n
(całkowite)

⇔

n jest dzielnikiem (a - b)

Zapisujemy to: a

≡

lub

(

)

≡ mod

Liczbę b nazywamy residium liczby a mod n i odwrotnie.

Zbiór liczb całkowitych

{

}

r r

, ,...,

nazywamy zupełnym zbiorem residiów modulo n

(względem modulo n)

⇔

dla dowolnej liczby całkowitej a istnieje w tym zbiorze dokładnie

jedna liczba r

, taka, że a

≡

W szczególności zbiór

{

}

, ,..., n

− jest zbiorem zupełnym residiów modulo n.

Jeśli przyjmiemy przedział [0, n-1] jako zbiór zupełny residów to piszemy:

= mod .

Jeżeli ograniczymy się do zbioru liczb całkowitych dodatnich, to residium liczby a jest reszta
z dzielenia tej liczby przez moduł n.

Dane są liczby a i n.

Operację wyznaczania residium modulo n liczby a nazywamy redukcją liczby a modulo n

Operacja redukcji liczb (ze zbioru) z pierścienia liczb całkowitych (można wykazać, że zbiór
liczb zredukowanych z operacjami

+ − ⋅

, , jest pierścieniem przemiennym) w pierścień liczb

całkowitych modulo n jest przekształceniem homomorficznym, czyli dla dowolnych liczb
całkowitych a i b i dowolnej operacji

{

}

⊗ ∈ + − ⋅

, , mamy równość:

(

)

(

) (

)

[

]

⊗

mod

Przykład:
n = 9

356947 7

-154715 -5

2 2

Zredukowanym zbiorem rezidiów modulo n nazywamy podzbiór zbioru {0,1,..., n-1}
zawierający liczby względnie pierwsze z n.

Przykład:
n = 10 {1,3,7,9} - residium zredukowane, {0,...,9} - rezydium zupełne
n = 12 {1,5,7,11}

Liczbę elementów zredukowanych zbiorów rezidiów modulo n określa tzw. Funkcja Eulera
Φ(n).

Jeżeli n

⋅

⋅ ⋅

...

, to

( )

(

)

Φ n

⋅

−

∏

1 .

Operacja odwrotna do mnożenia istnieje wtedy i tylko wtedy, gdy dla kazdej liczby a istnieje
liczba a

−1

taka, że:

a a

⋅

−1

mod

Twierdzenie Fermata. Jeżeli

( )

NWD ,

a p

= 1

, gdzie p - liczba pierwsza to a

mod

= 1.

Twierdzenie Eulera. Jeżeli

( )

NWD ,

a n

= 1, to

( )

mod

= 1

Wynika stad, że:

( )

a a

⋅

−

mod

, a więc

( )

−

mod

Czyli jak mamy pierścień, gdzie wszystkie wzajemnie pierwsze to każda ma odwrotną i staje
się ten zbiór ciałem.

Liczby naturalne m m

,...

są względnie pierwsze, jeżeli

(

)

NWD

,...,

m m

. Sa one

parami względne jeżeli

(

)

NWD

m m

= 1 dla każdej pary liczb i, j spełniającej

≤ < ≤

n .

Algorytm Euklidesa:

Dane są dwie liczby m m

∈ , gdzie m

≥

. Jeżeli m

jest dzielnikiem m

, to

(

)

NWD

m m

. Jeżeli m

nie jest dzielnikiem m

, to wykonujemy dzielenie z resztą m

przez m

. Niech q

będzie ilorazem, a m

- resztą z tego dzielenia. Mamy więc

q m

, gdzie m

. Jeżeli

m m

( m

jest dzielnikiem m

), to

(

)

NWD

m m

Jeżeli m

nie jest dzielnikiem m

, to wykonujemy dzielenie z resztą m

przez m

. Niech

będzie ilorazem, a m

- resztą z tego dzielenia, tzn m

q m

, gdzie m

Postępując analogicznie w dalszym ciągu otrzymujemy ciąg skończony m m m

,...,

−

w którym m

> >

−

...

, m m

/| , m m

, ..., m

−

oraz m m

−1

. Wtedy

(

)

NWD

m m

Algorytm szybkiego potęgowania modularnego

Algorytm ten pozwala na obliczenie działania: a

mod , gdzie wszystkie liczby są liczbami

całkowitymi (a oraz b nieujemne a n dodatnie).

1. d

← 1

2. niech

b b

,...,

−1

będzie binarną reprezentacją b

3. for i

← k downto 0

4. do d

← (d·d) mod n

= 1

then d

← (a·d) mod n

7. return d

Algorytm RSA (Rivesta, Shamira i Adelmana)

Klucze jawny i tajny szyfru RSA są funkcjami pary dużych liczb pierwszych. W celu
wygenerowania kluczy odbiorca kryptogramu losuje dwie liczby pierwsze p i q oraz liczbę e.
Iloczyn n = pq oraz e stanowią publiczny klucz szyfrujący. Liczba e musi być względnie
pierwsza z funkcją Eulera

( )

. Spełnione są więc zależności:

p q

= ⋅

( )

(

)(

)

−

( )

(

)

NWD ,

= 1

Do przeprowadzenia szyfrowania i deszyfrowania potrzebne są dwie takie pary:

( )

e d

oraz

(

)

e d

', ' , gdzie e wybieramy losowo (pamiętając o tym, że ma być względnie

pierwsza z

( )

), natomiast d liczymy ze wzorów:

( )

(

)

( )

−

ϕ ϕ

mod

(

)( )

(

)

(

)(

)

−

− −

mod

Wiadomość zaszyfrowaną liczy się następująco:

(

)

mod

Proces deszyfrowania przebiega bardzo podobnie:

(

)

mod

Algorytm Pohliga-Hellmana

[

]

∈

−

mod M

mod

⋅

⋅ ⋅

...

( )

(

)

Φ n

−

∏

( )

Φ p

= −1

( )

e d

⋅

mod

( )

(

)

( )

−

ϕ ϕ

mod

Algorytm Merklego-Hellmana

Klucz tajny jest generowany za pomocą generatora liczb losowych i zawiera ciąg
superrosnący (tzn. elementy tego ciągu są tak wybrane aby każdy element był większy od
sumy poprzedzajacych go elementów) oraz liczbę pierwszą u i liczbę losową w .

Klucz tajny: A

' ( ', ',..., ' )

Liczby u i w spełniają zależności:

∑

< <

u .

Dla liczby w liczbę odwrotną w

−1

oblicza się z zależności:

w w

⋅

−1

mod

Elementy klucza jawnego obliczane są z zależności:

a w

= ' mod

Szyfr Merklego - Hellmana jest szyfrem blokowym, szyfrującym ciągi binarne. Ciag
informacyjny m m

,... dzieli się na bloki

(

)

m m

,...,

, zawierajace po n bitów.

Szyfrowanie bloku odbywa się z udziałem klucza jawnego A według wzoru: C

a m

∑

W procesie deszyfrowania wykorzystuje się klucz tajny. Podczas deszyfracji najpierw oblicza
się C'

mod

−1

Przygotowanie do szyfrowania

• Ustalamy ciąg superrosnący A

' ( ', ',..., ' )

• Ustalamy liczbę u

∑

• Wybieramy liczbę w względnie pierwszą z u
• Obliczamy w

−1

mod

• Przekształcamy wektor A' w wektor A : A w A

= ⋅ ' , czyli a

w a

= ⋅ ' mod

Szyfrowanie

• C A M

= ⋅

, czyli C

a m

∑

Deszyfrowanie

• A w A

mod

−1

• C w C

mod

−1

, gdzie C

A M

= ⋅

• Wyznaczamy M znajac A' i C'

Wyszukiwarka

Podobne podstrony:
3 podstawy teorii stanu napreze Nieznany
,podstawy teorii automatow, opr Nieznany
Podstawowe informacje o planowa Nieznany (4)
podstawowe informacje alzheimer Nieznany
26 Podstawowe pojecia z teorii informacji
Podstawy teorii Elliota Podstaw Nieznany (2)
Podstawowe informacje o planowa Nieznany
Podstawowe informacje o planowa Nieznany (2)
3 Podstawy teorii SJLM cd id 33 Nieznany (2)
001 podstawy informatykiid 217 Nieznany (2)
Podstawy teorii Elliota Podstaw Nieznany
2 Podstawy teorii SJLM cdid 206 Nieznany (2)
Podstawowe informacje o planowa Nieznany (3)
Podstawowe informacje o planowa Nieznany (4)
PODSTAWY TEORII ORGANIZACJI I ZARZĄDZANIA Konwersatorium 1
podstawy teorii przedsiębiorstwa zaoczni

więcej podobnych podstron