plik

2. Języki, gramatyki

2.1. Języki

Definicja języka
Niech T będzie alfabetem, T

- zbiorem wszystkich łańcuchów nad alfabetem T.

Dowolny podzbiór L zbioru T

nazywamy językiem L nad alfabetem T.

⊆

Przykłady:
L

= Ø

- język pusty

= {

} -

język zawierający tylko słowo puste

= T

- język zawierający wszystkie słowa nad alfabetem T

= {

, 0, 01, 001}

język zawierający skończoną liczbę słów

= {0, 01, 011, 0111, ...} = {01

| n

≥

- język nieskończony

Operacje na językach
Niech L, L

i L

będą językami odpowiednio nad alfabetami T, T

i T

⊆

Najczęściej wykorzystuje się następujące operacje na językach:

─ Suma teoriomnogościowa

∪

= { x | x

∈

∨

∈

}

─ Złożenie języków

= { x

| x

∈

∧

∈

}

─ Domknięcie Kleene’ego L*

= {

}

= L

.................

= L

n-1

= L

∪

...

= L

∪

...

Rozpatruje się także operacje przecięcia (iloczynu teoriomnogościowego), dopełnienia,
podstawienia, homomorfizmu i ilorazu.

─ Przecięcie (iloczyn teoriomnogościowy)

∩

= { x | x

∈

∧

∈

}

─ Dopełnienie języka L względem T

−

─ Podstawienie

Podstawienie f jest odwzorowaniem alfabetu T na podzbiory zbioru V* dla pewnego
alfabetu V. Zatem f przyporządkowuje każdemu symbolowi z T pewien język.

f: T ! 2

Odwzorowanie f rozszerzamy na łańcuchy

f: T

! 2

w następujący sposób:

(1) f(

) =

(2) f(xa) = f(x)f(a)

Wreszcie odwzorowanie f rozszerzamy na zbiory łańcuchów, czyli na języki

f: 2

! 2

definiując:

f(L) =



f(x)

∈

Przykład:
Niech

T = {0, 1}

V = {a, b}

f(0) = {a}

f(1) = {b

| n

≥

0} = {

, b, bb, bbb, ...}

Wtedy dla łańcucha 010 mamy:

f(010) = {a} {b

| n

≥

0} {a} = {aa, aba, abba, abbba, ...} = {ab

a | n

≥

Niech

L = {0

1 | m

≥

0} = {1, 01, 001, 0001, ...}

Wtedy

f(L) = {a

| m

≥

0, n

≥

0} =

{

, b, bb, bbb, ..., a, ab. abb. abbb, ..., aa, aab, aabb, aabbb, ..., aaa, aaab, aaabb, ...}

─ Homomorfizm

Homomorfizmem h nazywany takie podstawienie, które każdemu symbolowi alfabetu T
przypisuje dokładnie jeden łańcuch ze zbioru V*, czyli homomorfizm to odwzorowanie:

h: T ! V

Rozszerzamy odwzorowanie h na łańcuchy

h: T

! V

w taki sam sposób, jak to miało miejsce z podstawieniem:

(1) h(

) =

(2) h(xa) = h(x)h(a)

Dalej rozszerzamy homomorfizm h na języki

h: 2

! 2

w taki sam sposób, jak podstawienie

h(L) =



h(x)

∈

Definiujemy przeciwobraz homomorficzny h

-1

(x) łańcucha x jako:

-1

(x) = {y | h(y) = x}

oraz przeciwobraz homomorficzny h

-1

(L) języka L jako:

-1

(L) = {x | h(x)

∈

Przykład:
Niech

T = {0, 1, 2}

V = {a, b}

h(0) = a

h(1) = aab

h(2) = ab

Wtedy dla łańcucha 012 mamy:
h(012) = aaabab
Niech

L = {01, 02}

Wtedy

h(L) = {aaab, aab}

Wyznaczmy h

-1

(h(L))

-1

(h(L)) = {002, 01, 02 1}

≠

Widzimy, że:

-1

(h(L))

⊇

Przykład:
Niech

T = {0, 1}

V = {a, b}

h(0) = aa

h(1) = aba

Niech

L = {(ab)

a | n

≥

0} = {a, aba, ababa, abababa, ...}

Wtedy

-1

(L) = {1}

Wyznaczmy h(h

-1

(L))

h(h

-1

(L)) = {aba}

≠

Widzimy, że:

h(h

-1

(L))

⊆

─ Iloraz języków

Niech będą dane dwa języki: L

⊆

, L

⊆

. Definiujemy iloraz L

tych języków

jako:

= { x | (

∃∃∃∃

∈

) (xy

∈

) }

Przykład:
Rozważamy języki:

= {0

| m

≥

0, n

≥

0} = {1, 01, 10, 001, 010, 100, 0001, 0010, 0100, 1000, ...}

= {10

1 | n

≥

0} = {11, 101, 1001, 10001, ...}

= {0

1 | n

≥

0} = {1, 01, 001, 0001, ...}

Mamy:

∅

gdyż każdy łańcuch y

∈

zawiera dwie jedynki, a każdy łańcuch xy

∈

może

zawierać tylko jedną jedynkę, więc nie istnieje łańcuch x, taki że xy

∈

i y

∈

= {0

| n

≥

0} = {

, 0, 00, 000, ...}

gdyż w rachubę wchodzą tylko słowa 1, 01, 001,

0001 z L

. i tylko słowo 1 z L

= {10

| n

≥

0} = {1, 10, 100, 1000, ...}

Przedrostki, przyrostki

Niech z

∈

⊆

będzie słowem z języka L.

Przedstawimy z w postaci:

z = xy

x,y

∈

x nazywamy przedrostkiem (prefiksem) słowa z, zaś y nazywamy przyrostkiem (sufiksem)
słowa z.

x nazywamy przedrostkiem właściwym słowa z

⇔

≠

y nazywamy przyrostkiem właściwym słowa z

⇔

≠

Własność przedrostkowa i własność przyrostkowa języka
Język L ma własność przedrostkową gdy:

(

∀

∈

L ) (

∀

s – będącego przedrostkiem właściwym słowa z

∈

L ) ( s

∉

L )

czyli język ma własność przedrostkową, jeśli żaden przedrostek właściwy słowa tego języka
nie jest identyczny z żadnym słowem tego języka.
Język L ma własność przyrostkową gdy:

(

∀

∈

L ) (

∀

s – będącego przyrostkiem właściwym słowa z

∈

L ) ( s

∉

L )

czyli język ma własność przyrostkową, jeśli żaden przyrostek właściwy słowa tego języka
nie jest identyczny z żadnym słowem tego języka.
Przykład:

L = {10

| n

≥

0} = {1, 10, 100, 1000, ...}

L nie posiada własności przedrostkowej, gdyż np. słowo 1000 ma przedrostek właściwy 10
będący słowem tego języka.

L posiada własność przyrostkową, gdyż wszystkie przyrostki właściwe słów tego języka mają
postać {0

| n

≥

0}, i żaden z nich nie jest identyczny z żadnym słowem tego języka.