Teoria Gier i Decyzji strategie mieszane

background image

2.4 Dwuosobowe gry macierzowe o sumie zerowej -

strategie mieszane

Okazuje się, że często gra macierzowa nie posiada punktu

siodłowego. Jaką strategię należy wówczas przyjąć?

W grach bez punktu siodłowego żadne czyste strategie nie są w

równowadze. Zatem z powyższego stwierdzenia można wnioskować, że

odstępstwo graczy od swoich strategii minimaksowych może być dla nich

opłacalne. Przeanalizujmy następujący przypadek.

Dana jest gra o następującej macierzy wypłat:

=

4

2

1

3

M

Łatwo jest zauważyć, że nie posiada ona punktu siodłowego.

Załóżmy, że gracz I zastanawia się nad wykorzystaniem strategii a

2

, swojej

strategii bezpieczeństwa, a gracz II chce wykorzystać swoją strategie

bezpieczeństwa b

1

. Jednakże takie proste rozegranie tej gry prowadzi nas do

sytuacji, kiedy jeden z graczy (przypuśćmy, że jest nim gracz I) przeanalizuje

rozgrywkę w następujący sposób: Jeżeli mój przeciwnik będzie grał swoją

optymalną strategią b

1

to ja zagram a

1

i w ten sposób zwiększę swoją

wygraną. Jeżeli jednak w tym samym momencie gracz II domyśli się

rozumowania gracza I, to zamiast zagrać swoją najbezpieczniejszą strategię

b

1

wybierze b

2

, a w takim przypadku gracz I powinien zagrać jednak a

2

.

Przyjmując taki sposób rozumowania wpadamy w pętlę domysłów, czyli nie

jesteśmy w stanie jednoznacznie stwierdzić co zagrać. Bo przecież, gdy gra

nie ma punktu siodłowego, to strategie bezpieczeństwa nie są w

równowadze! Co w takiej sytuacji gracze powinni zrobić?

W takiej sytuacji (gdy nie ma punktu siodłowego) wydaje się, że

background image

W

YKŁADY Z

T

EORII

G

IER I

D

ECYZJI

Str. 2

najlepszym rozwiązaniem dla obu graczy jest wybór swojej strategii w

drodze losowania. Jest to pomysł intuicyjny – ludzie bardzo często odwołują

się w swoich decyzjach do losu, zwłaszcza gdy nie są pewni co wybrać. Jest

też ten pomysł genialny - łatwo bowiem dowieść, co uczynimy za chwilę, że

wybór strategii przez losowanie zwiększa w rozważanym przypadku poziom

bezpieczeństwa graczy. Czy jednak losowanie to może odbywać się dowolna

metodą, czy istnieje sposób najlepszy? Na pytania te odpowiemy w dalszym

ciągu wykładu. Najpierw jednak wprowadzimy pewne formalne definicje i

oznaczenia. Już na wstępie do tego rozdziału określiliśmy strategię mieszaną

jako rozkład prawdopodobieństwa na strategiach czystych (nielosowych). W

grach macierzowych, w których zbiory strategii czystych są skończone

rozkłady prawdopodobieństwa mogą być utożsamiane z wektorami o

nieujemnych współrzędnych sumujących się do jedności.

Rozważmy zatem grę <A, B, M>, w której A i B są zbiorami strategii

czystych graczy I i II o mocach, odpowiednio, m i n. Zbiór A* strategii

mieszanych gracza I jest określony następująco:

}

0

,

,

,

1

,

1

:

)

,

,

(

{

*

1

=

=

=

=

=

i

m

i

i

m

a

m

i

A

α

α

α

α

K

K

α

Analogicznie oznaczamy i określamy zbiór strategii gracza II:

1

:

)

,

,

(

{

*

1

=

=

=

=

n

j

i

n

i

B

β

β

β

K

β

n

i

j

,

,

K

=

}

0

j

β

Poniewa

ż

wypłaty graczy podane s

ą

w ich u

ż

yteczno

ś

ciach, a wybory

strategii niezale

ż

ne, wi

ę

c zgodnie z własno

ś

ci

ą

B funkcji u

ż

yteczno

ś

ci

otrzymujemy,

ż

e wypłaty dla gracza pierwszego okre

ś

lone s

ą

nast

ę

puj

ą

co:

j

m

i

n

j

i

j

i

j

m

i

n

j

i

j

i

M

b

a

M

M

β

α

β

α

∑∑

∑∑

=

=

=

=

=

=

1

1

1

1

)

,

(

)

,

(

β

α

background image

A

NDRZEJ

Z.

G

RZYBOWSKI

Str. 3

a gracz II otrzymuje

)

,

(

β

α

M

. Zauwa

ż

my,

ż

e prawdziwe s

ą

równie

ż

wzory

=

=

=

=

n

j

j

i

m

i

j

M

i

M

M

1

1

)

,

(

)

,

(

)

,

(

β

α

α

β

β

α

Oczywi

ś

cie A

A* oraz BB*, gdy

ż

strategie czyste mo

ż

emy

uto

ż

sami

ć

z rozkładami skoncentrowanymi w jednym punkcie:

)

0

,

,

0

,

1

,

0

,

,

0

(

K

K

i

a

)

0

,

,

0

,

1

,

0

,

,

0

(

K

K

j

b

gdzie 1 jest, odpowiednio, i-t

ą

i j-t

ą

współrz

ę

dn

ą

w powy

ż

szych wektorach.

Na przykład je

ś

li gracz I wybiera strategi

ę

mieszan

ą

(0,1,0…,0), to jest to

równowa

ż

ne wyborowi strategii a

2

i na odwrót.

Uwaga

: W przypadku gdy b

ę

dziemy chcieli podkre

ś

li

ć

,

ż

e gracz u

ż

ywa

strategi

ę

czyst

ą

, w funkcji wypłaty b

ę

dziemy wpisywali jedynie jej numer.

Na przykład M(

α

α

α

α,j) oznacza,

ż

e gracz I gra strategi

ę

dowoln

ą

(mieszan

ą

lub

nie) natomiast gracz drugi gra swoj

ą

j-t

ą

strategi

ę

czyst

ą

, zatem

=

=

m

i

i

j

i

M

j

M

1

)

,

(

α

α

D

EFINICJA

Gr

ę

<C, D, U> nazywamy rozszerzeniem gry <A, B, V> je

ś

li A

C ,

B

D oraz dla ka

ż

dej pary strategii a

A i bB zachodzi: V(a,b)=U(a,b)

Zatem gra w strategiach mieszanych jest rozszerzeniem gry w

strategiach czystych. Wobec tego,

ż

e w nowej grze <A*,B*,M> moce

zbiorów strategii s

ą

nieprzeliczalne pojawiaj

ą

si

ę

nowe problemy. Zacznijmy

od zapisu definicji strategii bezpiecze

ń

stwa. Zgodnie z ogóln

ą

definicj

ą

α

α

α

α*

jest strategi

ą

bezpiecze

ń

stwa gracza pierwszego, gdy spełnia warunek:

background image

W

YKŁADY Z

T

EORII

G

IER I

D

ECYZJI

Str. 4

w

M

M

=

=

)

(

inf

sup

)

*

(

inf

β

α,

β

,

α

β

α

β

oraz

β

β

β

β* jest strategi

ą

bezpiecze

ń

stwa gracza drugiego, gdy:

w

M

M

=

=

)

(

sup

inf

*)

(

sup

β

α,

β

α,

α

β

α

W powy

ż

szych okre

ś

leniach i dalej w tej cz

ęś

ci wykładu kres górny

brany jest po

α

α

α

α∈A*, a kres dolny po β

β

β

β∈B*. Liczby

w oraz

w

oznaczaj

ą

warto

ść

doln

ą

i górn

ą

dla gry <A*,B*,M>.

Wobec tego,

ż

e oba te zbiory s

ą

nieprzeliczalne, nie mamy pewno

ś

ci,

ż

e owe kresy s

ą

osi

ą

gane na zbiorach strategii, zatem nie mamy pewno

ś

ci,

czy istniej

ą

strategie bezpiecze

ń

stwa graczy oraz czy warto

ś

ci dolna i górna

rzeczywi

ś

cie s

ą

ich poziomami bezpiecze

ń

stwa, tj. czy rzeczywi

ś

cie tyle

mog

ą

sobie zagwarantowa

ć

.

Celem dalszej cz

ęś

ci tego rozdziału b

ę

dzie pokazanie,

ż

e tak jest. Co

wi

ę

cej poka

ż

emy,

ż

e strategia bezpiecze

ń

stwa obu graczy nie tylko istniej

ą

,

ale równie

ż

,

ż

e gra w strategiach mieszanych ma zawsze warto

ść

tj.

w =

w

.

Dowód obu tych twierdze

ń

b

ę

dzie jednak odwoływał si

ę

do wyników z teorii

programowania liniowego i dlatego przeniesiemy go do kolejnego paragrafu.

Tutaj udowodnimy jeszcze kilka faktów pomocniczych oraz pozostałe

wyniki, które razem zło

żą

si

ę

na centralne teorii gier o sumie zerowej, zwane

twierdzeniem minimaksowym von Neumanna.

Zaczniemy od udowodnienia lematu, który ma du

ż

e znaczenie dla

omawianej teorii

L

EMAT

Dla ka

ż

dej strategii

β

β

β

β∈B*:

)

(

max

)

(

sup

β

,

β

α,

α

i

M

M

i

=

background image

A

NDRZEJ

Z.

G

RZYBOWSKI

Str. 5

oraz dla ka

ż

dej strategii

α

α

α

α∈A*:

)

(

min

)

(

inf

j

M

M

j

α,

β

α,

β

=

D

OWÓD

Udowodnimy pierwsz

ą

z powy

ż

szych równo

ś

ci. Dowód drugiej jest

analogiczny.

Zauwa

ż

my,

ż

e wobec faktu A

A* nierówno

ść

)

(

max

)

(

sup

β

,

β

α,

α

i

M

M

i

jest oczywista. Poniewa

ż

liczba strategii gracza I jest sko

ń

czona zatem

maksimum znajduj

ą

ce si

ę

po prawej stronie powy

ż

szej nierówno

ś

ci osi

ą

gane

jest dla pewnej z nich. Niech to b

ę

dzie strategia o numerze l, czyli

)

(

max

)

(

β

,

β

,

i

M

l

M

i

=

Wobec faktu niezale

ż

no

ś

ci wyborów strategii, rozkładów brzegowe wektora

(

α,β

α,β

α,β

α,β) s

ą

niezale

ż

ne. Poniewa

ż

warto

ść

M dla strategii mieszanych jest

warto

ś

ci

ą

oczekiwan

ą

u

ż

yteczno

ś

ci uzyskiwanych przy strategiach czystych,

to dla dowolnego

α

α

α

α∈A* i ka

ż

dego ustalonego

β

β

β

β∈B* otrzymujemy:

)

,

(

max

)

,

(

)

,

(

)

,

(

)

,

(

)

,

(

1

1

1

β

β

β

β

β

β

α

i

M

l

M

l

M

l

M

i

M

M

i

m

i

i

m

i

i

i

m

i

=

=

=

=

=

=

=

α

α

α

Zatem

)

(

max

)

(

sup

β

,

β

α,

α

i

M

M

i

Poniewa

ż

nierówno

ść

w drug

ą

stron

ę

ju

ż

wykazali

ś

my, wi

ę

c to ko

ń

czy

dowód lematu.

Z udowodnionego lematu bezpo

ś

rednio wynikaj

ą

nast

ę

puj

ą

ce twierdzenie

background image

W

YKŁADY Z

T

EORII

G

IER I

D

ECYZJI

Str. 6

i wnioski.

T

WIERDZENIE

Dla dowolnej gry macierzowej <A*,B*,M>

)

(

min

sup

j

M

w

j

α,

α

=

oraz

)

(

max

inf

β

,

β

i

M

w

i

=

W

NIOSEK

1

Strategia

α

α

α

α

A* jest strategi

ą

bezpiecze

ń

stwa gracza I wtedy i tylko wtedy,

gdy

)

*

(

min

j

M

w

j

,

α

=

Strategia

β

β

β

β

B* jest strategia bezpiecze

ń

stwa gracza II wtedy i tylko wtedy,

gdy

*)

(

max

β

,i

M

w

i

=

W

NIOSEK

2

Pomi

ę

dzy warto

ś

ciami górnymi i dolnymi gier <A,B,M> oraz

<A*,B*,M> zachodz

ą

nast

ę

puj

ą

ce zwi

ą

zki:

v

w

w

v

D

OWÓD

Uzasadnimy tylko drugi wniosek, gdy

ż

poprzednie stwierdzenia s

ą

oczywiste wobec wykazanych wcze

ś

niej faktów.

Nierówno

ść

w

v

jest łatwa do stwierdzenia wobec obserwacji,

ż

e

obie te wielko

ś

ci s

ą

kresami górnymi tej samej funkcji

)

(

min

)

(

j

M

f

j

,

=

,

przy czym pierwsza z nich jest kresem na zbiorze A druga za

ś

na zbiorze A*

background image

A

NDRZEJ

Z.

G

RZYBOWSKI

Str. 7

i spełniona jest relacja A

A*. Analogicznie mo

ż

na wykaza

ć

prawdziwo

ść

nierówno

ś

ci

v

w

.

Niech teraz

α

α

α

α∈A* i β

β

β

β∈B* b

ę

d

ą

ustalonymi strategiami graczy.

Wtedy

)

(

max

)

(

β

,

β

α,

i

M

M

i

w

i

M

M

i

=

)

(

max

inf

)

(

inf

β

,

β

α,

β

β

w

j

M

j

)

(

min

α,

w

j

M

w

j

=

)

(

min

sup

α,

α

Zatem i trzecia z nierówno

ś

ci jest prawdziwa, co ko

ń

czy dowód

poprawno

ś

ci Wniosku 2.

Zauwa

ż

my,

ż

e ostatni wniosek mówi wprost,

ż

e wprowadzenie

strategii mieszanych mo

ż

e zwi

ę

kszy

ć

poziomy bezpiecze

ń

stwa graczy (nigdy

ich nie zmniejszaj

ą

c). To powa

ż

nie uzasadnia uwzgl

ę

dnienie przez graczy tej

mo

ż

liwo

ś

ci.

T

WIERDZENIE

Je

ż

eli gra <A*,B*,M> ma warto

ść

oraz

α

α

α

α∗∈A* i β

β

β

β

B* s

ą

strategiami bezpiecze

ń

stwa graczy w tej grze, to s

ą

one w równowadze

D

OWÓD

Nierówno

ś

ci

*)

(

sup

*)

*

(

)

*

(

inf

β

α,

β

,

α

β

,

α

α

β

M

M

M

s

ą

oczywiste. Je

ż

eli

α

α

α

α∗∈A* i β

β

β

β

B* s

ą

strategiami bezpiecze

ń

stwa, to na

background image

W

YKŁADY Z

T

EORII

G

IER I

D

ECYZJI

Str. 8

podstawie Lematu oraz Wniosku 1 mamy zatem

w

i

M

M

j

M

w

i

j

=

=

*)

(

max

*)

*

(

)

*

(

min

β

,

β

,

α

,

α

Z zało

ż

enia istnieje warto

ść

gry,

,

w

w

w

=

=

wi

ę

c powy

ż

sze nierówno

ś

ci s

ą

równo

ś

ciami i otrzymujemy

)

*

(

inf

)

*

(

min

*)

*

(

*)

(

max

*)

(

sup

β

,

α

,

α

β

,

α

β

,

β

α,

β

α

M

j

M

M

i

M

M

j

i

=

=

=

=

czyli dla dowolnych

α

α

α

α∈A* i β

β

β

β∈B*

)

*

(

*)

*

(

*)

(

β

,

α

β

,

α

β

α,

M

M

M

To ko

ń

czy dowód.

W

NIOSEK

3

Je

ż

eli w grze <A*,B*,M> strategie

α

α

α

α∗ i α

α

α

α^ s

ą

strategiami

bezpiecze

ń

stwa gracza I, a strategie

β

β

β

β

i

β

β

β

β^ s

ą

strategiami bezpiecze

ń

stwa

gracza II, to

M(

α

α

α

α∗,β

β

β

β

)=M(

α

α

α

α∗,β

β

β

β^)=M

α

α

α^

β

β

β^)=M

α

α

α^

β

β

β

)

i wszystkie wskazane pary strategii s

ą

w równowadze

Powy

ż

szy wniosek jest oczywist

ą

konsekwencj

ą

poprzedniego

twierdzenia i jego dowód pomijamy. Czytelnik zechce go przeprowadzi

ć

jako

ć

wiczenie.

T

WIERDZENIE

Je

ż

eli gra <A*,B*,M> ma warto

ść

oraz

α

α

α

α∗∈A* i β

β

β

β

B* s

ą

w równowadze to s

ą

one te

ż

strategiami bezpiecze

ń

stwa graczy w tej grze.

background image

A

NDRZEJ

Z.

G

RZYBOWSKI

Str. 9

D

OWÓD

Je

ś

li

α

α

α

α∗∈A* i β

β

β

β

B* s

ą

w równowadze to

)

(

inf

sup

)

*

(

inf

*)

*

(

*)

(

sup

)

(

sup

inf

β

α,

β

,

α

β

,

α

β

α,

β

α,

β

α

β

α

α

β

M

M

M

M

M

=

=

Poniewa

ż

z zało

ż

enia

,

w

w

=

wi

ę

c powy

ż

sze nierówno

ś

ci s

ą

rozwa

ż

anym przypadku równo

ś

ciami i otrzymujemy w szczególno

ś

ci

)

(

inf

sup

)

*

(

inf

β

α,

β

,

α

β

α

β

M

M

=

)

(

sup

inf

*)

(

sup

β

α,

β

α,

α

β

α

M

M

=

To ko

ń

czy dowód.

Dwa ostatnie twierdzenia i wniosek 3 s

ą

niezwykle wa

ż

ne dla

omawianej teorii. Mówi

ą

one,

ż

e koncepcje rozwi

ą

zania oparte na poj

ę

ciu

strategii bezpiecze

ń

stwa nie s

ą

w sprzeczno

ś

ci z koncepcj

ą

opart

ą

na punkcie

równowagi - gracz nie b

ę

dzie wi

ę

c miał dylematu, któr

ą

z tych koncepcji

wybra

ć

. Co wi

ę

cej, nawet wyst

ą

pienie wi

ę

kszej liczby ró

ż

nych strategii

bezpiecze

ń

stwa gracza nie prowadzi do dylematu, gdy

ż

wszystkie one

gwarantuj

ą

dokładnie ta sam

ą

wypłat

ę

.

T

WIERDZENIE

Je

ż

eli macierz M ma punkt siodłowy

0

0

j

i

M

, to strategie czyste i

0

,j

0

s

ą

strategiami bezpiecze

ń

stwa w grze <A*,B*,M>

D

OWÓD

Z wniosku 2 i z Twierdzenia C3 otrzymujemy

0

0

j

i

M

v

w

w

v

=

=

=

=

background image

W

YKŁADY Z

T

EORII

G

IER I

D

ECYZJI

Str. 10

Teraz, aby wykaza

ć

,

ż

e i

0

jest strategi

ą

bezpiecze

ń

stwa gracza I wystarczy

zauwa

ż

y

ć

,

ż

e

w

M

j

i

M

j

i

j

=

=

0

0

)

(

min

0

,

gdzie pierwsza z równo

ś

ci jest konsekwencj

ą

tego,

ż

e

0

0

j

i

M

jest punktem

siodłowym.

Analogicznie dowodzimy,

ż

e j

0

jest strategi

ą

bezpiecze

ń

stwa gracza

II.

Ostatnie twierdzenie pokazuje,

ż

e koncepcje gry w strategiach

czystych i w strategiach mieszanych nie s

ą

koncepcjami pozostaj

ą

cymi w

konflikcie. Jakiekolwiek rozwi

ą

zanie uzyskane w grze w strategiach czystych

jest te

ż

rozwi

ą

zaniem w grze w strategiach mieszanych. Zatem rozszerzanie

gry <A,B,M> do gry <A*,B*,M> ma na celu jedynie znalezienie rozwi

ą

zania

w przypadku, gdy ta pierwsza go nie posiada.

Aby zamkn

ąć

nasze rozwa

ż

ania na temat gier o sumie zero pozostało

nam jedynie udowodni

ć

,

ż

e gry <A*,B*,M> maj

ą

zawsze rozwi

ą

zanie, czyli

ż

e zawsze istniej

ą

strategie bezpiecze

ń

stwa graczy i gra zawsze ma warto

ść

.

Jest to tre

ś

ci

ą

kolejnego paragrafu.

2.4 Twierdzenie minimaksowe Johna von Neumanna


Wyszukiwarka

Podobne podstrony:
2.Teoria Gier i Decyzj, uzytecznosc pieniedzy
1 Teoria Gier i Decyzj wersja cz 1id 9965 (2)
2 Teoria Gier i Decyzj uzytecznosc pieniedzyid 20837
Teoria Gier i Decyzj w6
Teoria Gier i Decyzj w4
rusiecki,techniki wspomagania decyzji,Teoria gier
teoria gier a strategia konkurencji 2
TEORIA GIER A STRATEGIA KONKURENCJI
IV Teoria gier
PL (programowanie liniowe), semestr 8, Matematyka, Teoria i praktyka decyzji ekonomicznych
Podejmowanie decyzji strategicznych (100 stron)
Jadczak R Badania operacyjne, wyklad teoria podejmowania decyzji
Jadczak R, Badania operacyjne wyklad teoria podejmowania decyzji
TEORIA PODEJMOWANIA DECYZJI NA PODSTAWIE FIRMY PROFAST
Referat 3 TEORIA GIER PREZENTACJA 1
6 Teoria Gier 1 cw rozwiazania

więcej podobnych podstron