plik

Wybrane eksperymenty z TOU

Metoda eksperymentalna służyła również jako narzędzie testowania teorii

oczekiwanej użyteczności von Neumanna i Morgensterna. Znacznie więcej eksperymentów

ujawniło zachowania stojące w sprzeczności z jej treścią

. Najbardziej znany jest paradoks

Allaisa polegający na sprzeczności miedzy dwoma wyborami. Poprosił on uczestników

eksperymentu by dokonali wyboru pomiędzy dwiema alternatywami, których opcje mogą

zostać opisane jako wartości oczekiwane w postaci ogólnej:

gdzie:

– prawdopodobieństwo otrzymania kwoty A

Pierwszy wybór, miedzy opcją A (p

=1, A

=100 mln franków) i B (p

=0,1, B

=500

mln; p

=0,89, B

=100 mln; p

=0,01, B

=0), uczestnicy eksperymentu rozstrzygali w istotnej

większości na rzecz opcji A. Jednocześnie, w drugim wyborze, ci sami uczestnicy preferowali

opcję D (p

=0,1, D

=500 mln; p

=0,9, D

=0) bardziej niż C (p

=0,11, C

=100 mln; p

=0,89,

=0). Hipotetyczny podmiot, dla którego U(A)>U(B)

powinien przejawiać preferencję

odwrotną U(C)>U(D). Wyniki tego eksperymentu, opartego na hipotetycznych wyborach,

znalazły potwierdzenie w późniejszych badaniach z realnymi wypłatami, oczywiście

mniejszych kwot.

Przedmiotem eksperymentalnego testu były nie tylko aksjomaty TOU, ale również jej

aspekt deskryptywny. Wiele testów poświęcono analizie procesów dokonywania wyborów w

warunkach ryzyka. Jedno z późniejszych studiów badało przechodniość preferencji [Loomes,.

Starmer, Sugden]. Uczestnicy eksperymentu, w wielu przypadkach, bardziej preferowali

możliwość wygrania 8£ z prawdopodobieństwem 0,6 (p

=0,6;a=8£) niż opcję (p

=0,3;b=18£).

Pewność otrzymania 4£ (p

=1;c=4£) była dla tych samych podmiotów cenniejsza niż opcja

=0,6;a=8£). Jednocześnie jednak, preferowali oni możliwość (p

=0,3;b=18£) bardziej niż

pewność wygrania 4£. Tą nieprzechodniość preferencji, autorzy tłumaczyli preferowaniem

bardziej prawdopodobnej wygranej, gdy różnice w ich wartości były relatywnie nieduże. Gdy

różnica w wygranych stała się wysoka, górę wziął wybór przynoszący wyższą wartość

oczekiwaną.

Przytoczone niżej wyniki eksperymentów pochodzą zarówno z prac psychologów jak i ekonomistów.

Eksperymenty częściej przynosiły wyniki sprzeczne z TOU niezależnie, czy przeprowadzali je ekonomiści, czy
psychologowie.

Taka preferencja charakteryzuje podmiot unikający ryzyka, wybierający mniejszą wartość oczekiwaną, jeśli

związana jest z wyższym prawdopodobieństwem osiągnięcia.

Gra strategiczna i jej opis

Definicja gry

Najpowszechniej stosowanym podejściem do definiowania gry strategicznej jest

wymienienie jej elementów składowych. Ich jednoczesne wystąpienie uprawnia do nazwania

jakiejś sytuacji grą strategiczną ([Shubik, 1995, s. 1-16], [Straffin, 2001, s. 1], [Drabik, 2005,

s. 18] oraz przede wszystkim [von Neumann, Morgenstern, 1944, s. 48-55])

. Zgodnie z

powszechnie uznaną definicją z grą strategiczną (Γ) mamy do czynienia zawsze wtedy, gdy:

bierze w niej udział, co najmniej, dwóch graczy; zbiór graczy to N={1,2,…,n},

gdzie n jest liczbą naturalną nie mniejszą od dwóch,

kaŜdy z graczy dysponuje zbiorem strategii określających jego sposób

rozgrywania gry M

; zbiór strategii wszystkich graczy M składa się z

elementów m

, w ramach których kaŜdy z graczy jest reprezentowany przez

jedną strategię; M=M

x…xM

, m

=[m

2j,…,

]

kaŜdemu elementowi zbioru M przyporządkowany jest n-wymiarowy wektor

wypłat u(m

)=[u

),u

),…,u

)]; wektor ten jest nazywany równieŜ

wynikiem gry.

Konkretyzacja tej definicji dla gry dwuosobowej będzie miała postać:

bierze w niej udział dwóch graczy; zbiór graczy to N={A,B},

kaŜdy z graczy dysponuje zbiorem strategii określających jego sposób

rozgrywania gry: M

={a

,…,a

} i M

={b

,…,b

}; zbiór

strategii obydwu graczy M składa się z elementów m

, w których kaŜdy z

graczy jest reprezentowany przez jedną strategię; M=M

, m

=[a

kaŜdemu elementowi zbioru M przyporządkowany jest wynik gry w postaci

punktu dwuwymiarowej przestrzeni euklidesowej określającego wypłaty

graczy u(m

)=(u

),u

)).

Gracze, którzy są nieodzownymi podmiotami gry muszą spełniać określoną

charakterystykę.

„KaŜdy

gracz

powinien

dysponować

zdefiniowanymi

zasobami

obejmującymi równieŜ informacje, mieć do wyboru określoną ilość sposobów postępowania,

Alternatywnym podejściem jest zdefiniowanie gry jako drzewa topologicznego [Owen, 1975, s. 12]. Aby

niepotrzebnie nie komplikować zagadnień, których analiza ma spełniać funkcje pomocnicze, autor postanowił
zrezygnować z tego podejścia.

W dalszej części wywodu, przez wypłaty graczy naleŜy rozumieć doświadczane przez nich uŜyteczności.

Prezentacja alternatywnych koncepcji uŜyteczności zysków oraz przyjęte załoŜenie w tym zakresie zostały
przedstawione w rozdziale 2.1.1. Rozdział 3.5.1. został poświęcony znaczeniu ekonomii eksperymentalnej dla
rozwoju teorii uŜyteczności.

ze szczególnym uwzględnieniem moŜliwości komunikowania się i porozumiewania oraz

wewnętrznie spójny system preferencji lub uŜyteczności odnoszący się do uzyskiwanych

wypłat” [Shubik, 1995, s. 16]. Wszystkie te cechy powinny być uwzględnione w obrębie

reguł gry. Nie moŜe być tak, Ŝe istotne zróŜnicowanie graczy nie zostanie objęte regułami gry.

Graczami mogą być osoby fizyczne, przedsiębiorstwa, instytucje, związki zawodowe, związki

pracodawców, państwa. Tak duŜe zróŜnicowanie jakościowe moŜe powodować problemy

metodologiczne. Jeśli na przeciw siebie staje osoba fizyczna i organizacja nieodzownym jest

przyjęcie załoŜenia, Ŝe ta druga równieŜ obdarzona jest wolną wolą i nie ma problemu z jej

jednoznacznym wyraŜeniem.

Niezwykle istotnym załoŜeniem jest racjonalność graczy, z których kaŜdy „analizuje

grę w poszukiwaniu sposobu uzyskania poŜądanego wyniku, uwzględniając fakt, Ŝe pozostali

robią to samo” [Straffin, 2001, s. 2]. Na ogół, racjonalność graczy ma postać występującą w

przypadku podejmowania decyzji w warunkach niepewności [Luce, Raiffa, 1964, s. 22].

Rzadziej jest to racjonalność związana z podejmowaniem decyzji w warunkach ryzyka.

Dzieje się tak jedynie w przypadku tzw. gier przeciwko Naturze, w których jednym z graczy

jest przyroda „dokonująca wyborów strategii” z załoŜonymi prawdopodobieństwami

[Straffin, 2001, ss. 74-81]. W grach przeciwko Naturze róŜnica między charakterem

podmiotowym graczy polega równieŜ na tym, Ŝe gracz aktywny osiąga określone wypłaty a

Natura nie [Rapoport, 1989, s. 177]. Przykładem takiej gry jest sytuacja opisana w artykule

Davenporta o rybołówstwie na Jamajce [Davenport, 1960].

Zdarza się, Ŝe w określonych wynikach gry bardziej lub mniej zainteresowany jest

tzw. „gracz statysta” (dummy player), który nie ma moŜliwości wpływania swoimi decyzjami

na nie [Shubik, 1995, s. 18]. Dobrym przykładem jest zbiorowy konsument, który w grze

rynkowej moŜe osiągnąć wyŜszą lub niŜszą kwotę nadwyŜki, w zaleŜności od wyborów

strategii dokonywanych przez przedsiębiorstwa. Rola konsumentów sprowadza się jedynie do

wpływu preferencji na krzywą popytu rynkowego, która z kolei staje się elementem reguł gry.

Strategie, jakie stoją do wyboru przed kaŜdym graczem naleŜy rozumieć jako sposoby

rozegrania gry w kompletnym zakresie, od jej rozpoczęcia aŜ do końca [Shubik, 1995, s. 34].

Gra moŜe bowiem polegać na sekwencji ruchów decyzyjnych przeplatanych niekiedy

wpływem zmiennych losowych lub na jednorazowym wyborze strategii przez graczy.

Strategie gracza mogą mieć postać czystą i występować jako jeden z elementów

zbioru M

(np. m

lub m

). Strategia gracza i moŜe teŜ się pojawić w postaci mieszanej

O metodach wyznaczania strategii mieszanych i problemach z ich praktyczną aplikacją traktują rozdziały 1.2.2

i 1.2.3.

której obraz powstaje w wyniku losowania wszystkich spośród dostępnych graczowi strategii

„czystych” zgodnie z określonym rozkładem prawdopodobieństwa p

={p

,...,p

}

takim, Ŝe 0≤p

≤

1 oraz:

∑

[1.1]

gdzie m jest liczbą dostępnych strategii czystych. Dla gracza A strategia mieszana a

∈

to zbiór jego wszystkich strategii mieszanych), to:

=[p

,...,p

[1.2]

Przy takim zdefiniowaniu strategii mieszanej kaŜda strategia czysta a

jest jej

szczególną postacią, w przypadku której tylko jeden składnik rozkładu prawdopodobieństwa

jest większy od zera. Wygrana gracza A, jaką uzyska wybierając strategię mieszaną a

przy jednoczesnym wyborze strategii czystej b

przez gracza B wyraŜa się formułą:

([a

])=p

([a

])+p

([a

])+...+p

([a

])+...+p

([a

]).

[1.3]

Konstrukcja strategii mieszanej, poŜyteczna i poprawna pod względem formalnym,

nastręcza pewnych trudności z praktycznego punktu widzenia. Dla ustalenia strategii

mieszanej a

moŜemy przeprowadzić eksperyment, w którym dzielimy zbiór moŜliwych

wyników pomiędzy

m wzajemnie niezaleŜnych i wzajemnie wykluczających się zdarzeń o

rozkładzie prawdopodobieństwa p

[Luce, Raiffa, 1964, s. 77]. MoŜna do tego uŜyć tablic

losowych lub zaprojektować loterię, w której kolejnych

m zdarzeń wystąpi odpowiednio z

prawdopodobieństwami {p

,...,p

}. W kolejnym kroku gracz powinien dokonać

losowania. W losowaniu tym moŜe się okazać, Ŝe wskazana przezeń strategia czysta przynosi

niŜszy poziom wygranej niŜ u

([a

]) lub niŜszy niŜ inne strategie czyste

. Osiągnięcie

redniej wartości wygranej równej u

([a

]) byłoby moŜliwe dopiero po przeprowadzeniu

nieskończonej ilości losowań w opisanej loterii. Obrońcy koncepcji strategii mieszanych

wskazują na ich dwie istotne cechy. Po pierwsze, poszukiwanie rozwiązania gry w strategiach

mieszanych odbywa się dopiero wtedy, gdy nie moŜna go znaleźć wśród strategii czystych.

Po drugie, operowanie strategiami mieszanymi nie daje przeciwnikowi Ŝadnych informacji o

tym, jakiej uŜyjemy strategii czystej [Luce, Raiffa, 1964, s. 78].

Teoria gier bada zachowania podmiotów w sytuacji konfliktu i kooperacji

[Straffin, 2001, s. 1]. Podstawowym obszarem zainteresowania są oczywiście sytuacje

konfliktu interesów [Malawski, Wieczorek, Sosnowska, 1997, s.12]. O konflikcie interesów w

Luce i Raiffa dają kilka bardzo ciekawych przykładów na praktyczne problemy z wykorzystaniem strategii

mieszanych [Luce, Raiffa, 1964, s. 79]

postaci pełnej moŜemy mówić w przypadku gier o sumie stałej

. Podstawową klasę

reprezentującą ten typ gier, gry o sumie zerowej moŜna zdefiniować jako te, w przypadku

których dla kaŜdego m

naleŜącego do M:

)

(

∑

[1.4]

lub w przypadku gier dwuosobowych:

(

)+u

(

)=0.

[1.5]

W przypadku gier o sumie zerowej wygrane graczy w ramach określonego wyniku gry

zawsze sumują się do zera. Związane jest to z naturalnym konfliktem interesów

wykluczającym jakiekolwiek formy kooperacji. Wygrana jednego gracza wiąŜe się

nierozerwalnie z przegraną drugiego toŜsamą, co do wartości bezwzględnej. W

dwuosobowych grach o sumie zerowej nie ma pola do kooperacji. KaŜdy z graczy pragnie

osiągnąć jak najwyŜszą wygraną uwzględniając to samo dąŜenie u przeciwnika. Jedynie w

przypadku liczby graczy większej niŜ dwa, moŜliwa jest kooperacja poprzez tworzenie

koalicji pozostającej w konflikcie interesów z graczami pozostającymi poza nią.

Alternatywa pomiędzy kooperacją a konfliktem ma równieŜ szansę pojawić się w

przypadku gier o sumie róŜnej od zera (lub nie stałej). Jeśli gracze nie mają w nich

moŜliwości porozumiewania się ani zawierania wiąŜących umów przybierają one postać gier

niekooperacyjnych [Luce, Raiffa, 1964, s. 112], jeśli pojawia się taka moŜliwość moŜna

mówić o grze kooperacyjnej.

Formy prezentacji gier

Prezentacja reguł gry moŜe mieć postać opisową, która zawiera wszystkie istotne

fakty, zaleŜności i charakterystyki istotne dla jej rozegrania. WyraŜona zwartym tekstem

postać gry znajduje najczęściej zastosowanie w przypadku prostych gier, których reguły nie

wymagają skomplikowanych zapisów. Przykładem moŜe być gra rynkowa wzorowana na

grach rynkowych o zmiennym zakresie informacji [Kreps, 1990]. Nazwijmy ją „A vs B”.

Gra „A vs B”

Podstawową klasą tego typu gier są gry o sumie zerowej, i tak je pierwotnie nazwali von Neumann i

Morgenstern [von Neumann, Morgenstern, 1944]. Niektórzy autorzy pozostali wierni tej nazwie [Straffin, 2001],
[Drabik, 2005],  [Luce, Raiffa, 1964],  [Owen,  1975].  Niektórzy  przyjęli  szerszy  znaczeniowo  termin  „gry  o
sumie  stałej”  [Rapoport, 1989].  KaŜdą  grę  o  sumie  stałej  moŜna  przekształcić  liniowo  w  grę  o  sumie  zerowej
odejmując,  od  wygranych  poszczególnych  graczy,  iloraz  stałej  sumy  wygranych  i  liczby  graczy.  Takie
przekształcenie  pozostaje  bez  wpływu  na  wyznaczenie  równowagi  w  grze.  Ze  względu  na  powszechność
stosowania, autor będzie posługiwał się terminem „gra o sumie zerowej”.

Rynek przenośnych odtwarzaczy muzyki z internetu jest opanowany przez dwie firmy

Audioslave i Broadcast. Pierwsza specjalizuje się w odtwarzaczach popularnych, o niŜszej

cenie i gorszych parametrach jakościowych. Posiada w swojej ofercie równieŜ bardziej

zaawansowane technologicznie produkty. Firma Broadcast jest wyspecjalizowana w wysokiej

jakości sprzęcie dla wyrobionych słuchaczy. Obydwie firmy pracują nad wprowadzeniem na

rynek nowego mobilnego odtwarzacza umoŜliwiającego ściąganie plików muzycznych z

internetu. KaŜdy z konkurentów ma do wyboru produkowanie tańszego, ale gorszego

jakościowo odtwarzacza (T) lub zaawansowanego technologicznie, ale droŜszego (D).

W sytuację rynkową wpisany jest czynnik losowy. śadna z firm nie wie czy przyszły

popyt na nowy produkt będzie duŜy, czy mały. Mały popyt to sytuacja, w której udział

koneserów zainteresowanych sprzętem wysokiej jakości w całkowitym zapotrzebowaniu jest

większy. O perspektywach rynkowych wiadomo jedynie, Ŝe duŜy popyt pojawi się z

prawdopodobieństwem p

=0,6 i zapewni obroty w wysokości u

=60 (u

i u

odpowiednio wygrane firm Audioslave i Broadcast toŜsame ich poziomowi przychodów).

Mały popyt moŜe przynieść graczom sumę przychodów u

=30. Zmienna losowa moŜe

wskazać tylko na jeden lub na drugi z wymienionych rozmiarów rynku. Obydwie firmy

podejmują decyzję o wyborze profilu produkcyjnego jednocześnie, nie znając oczywiście

wyboru konkurenta.

Jeśli na małym rynku, obydwie firmy wybiorą strategie a

=T i b

=T, to osiągną

wygrane u

([a

])=20 i u

([a

])=10. W sytuacji, gdy na tym samym rynku zgodny wybór

strategii wskaŜe na produkowanie wysokiej jakości sprzętu (a

=D i b

=D), ich przychody

równieŜ będą wynosić u

([a

])=20 i u

([a

])=10. Wygrane firm w pozostałych

przypadkach osiągają wartości: u

([a

])=25, u

([a

])=5 i u

([a

])=10, u

([a

])=20.

Jeśli firmom przyjdzie operować na rynku o duŜym popycie, te same wybory strategii

przyniosą wyŜszą sumę wygranych do podziału. Wygrane we wszystkich moŜliwych

kombinacjach strategii wynosić będą: u

([a

])=45 i u

([a

])=15, u

([a

])=36 i

([a

])=24, u

([a

])=24, u

([a

])=36 i u

([a

])=42, u

([a

])=18.

Tak zapisane reguły gry podziału rynku miedzy dwóch konkurentów zawierają w

sobie wszystkie istotne informacje. Gdyby jednak przyszło nam poszukać najwłaściwszych

strategii dla obydwu graczy, nawet bez posiadania koniecznej wiedzy na ten temat, posiłkując

się wyłącznie intuicją, sama postać opisowa gry nie ułatwi nam specjalnie zadania. Ze

względu na przydatność w poszukiwaniu rozwiązań gier o róŜnych cechach jakościowych,

obowiązują trzy metody ich zapisu. Są to postać ekstensywna (rozwinięta), macierzowa oraz

postać funkcji charakterystycznej.

Kolejność, w jakiej gracze zostali przedstawieni w dendrycie gry nie ma znaczenia,

gdy tak jak w opisywanej grze, Ŝaden z nich nie zna ani „wyboru” Losu ani wyboru drugiej

strony. Wyniki gry, które pojawiają się na ostatnim poziomie byłyby takie same gdybyśmy,

na przykład, zaczęli od węzła firmy Broadcast a skończyli na „wyborach” Losu. Wszystkie

wierzchołki gracza Audioslave (A) tworzą jeden zbiór informacyjny, poniewaŜ nie zna on ani

rozmiarów rynku ani decyzji konkurenta, w momencie dokonywania własnego wyboru.

Podobnie jest z graczem Broadcast (B).

Dendryt gry pokazuje wszystkie ścieŜki, jakimi moŜe potoczyć się gra. Wyniki gry na

samym dole dendrytu informują o wygranych graczy według porządku (u

). W naszym

przykładzie, jeśli rynek będzie duŜy a obydwaj gracze wybiorą produkcję tańszego

odtwarzacza ([a

]), ich wygrane (przychody ze sprzedaŜy) wyniosą odpowiednio u

=20 i

=10. Gracz A, w ramach swojego ruchu moŜe dokonać wyboru a

lub a

. Podobnie jest w

przypadku gracza B. Splot dokonanych przez graczy wyborów, poprzedzony nieznanym

„wyborem” losu, decyduje o tym, która para wygranych stanie się ich udziałem.

Prezentowany przykład dendrytu gry jest obrazem gry skończonej. Mówimy o grze

skończonej wtedy, gdy jej dendryt zawiera tylko skończoną ilość wierzchołków [Owen, 1975,

s. 15]. W grze skończonej gracz ma równieŜ skończoną liczbę strategii. Przykład gry

nieskończonej to sytuacja, w której gracze podają dowolne liczby całkowite i ten, który poda

niŜszą płaci jedną jednostkę drugiemu. Zbiór strategii czystych jest nieskończony, co czyni

taką i grę [Luce, Raiffa, 1964, s. 415].

Los

Audioslave

Broadcast

mały rynek
p

=0,4

duŜy rynek
p

=0,6

(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)

Schemat 1.1. Dendryt gry „A vs B”

ródło: opracowanie własne na podstawie [Kreps, 1990]

Tabela 1.1. Macierz gry dwuosobowej
u

...

([a

]) u

([a

])

...

([a

])

...

([a

])

([a

]) u

([a

])

...

([a

])

...

([a

])

...

([a

]) u

([a

])

...

([a

])

...

([a

])

...

([a

]) u

([a

])

...

([a

])

...

([a

])

...

([a

]) u

([a

])

...

([a

])

...

([a

])

([a

]) u

([a

])

...

([a

])

...

([a

])

...

([a

]) u

([a

])

...

([a

])

...

([a

])

...

([a

]) u

([a

])

...

([a

])

...

([a

])

ródło: opracowanie własne

Drugą podstawową formą prezentacji gry jest jej postać macierzowa. Jakkolwiek jej

przydatność ogranicza się do gier dwuosobowych

, bardzo ułatwia poszukiwanie rozwiązań w

tej klasie gier. Postać macierzowa gry dwuosobowej to tabela, której wiersze odpowiadają

wyborom strategii czystych jednego gracza, a kolumny wyborom strategii czystych drugiego.

Na przecięciu kaŜdej pary strategii w tabeli pomieszczone są wartości wygranych obydwu

graczy, jakie osiągają oni przy koincydencji tych właśnie wyborów. Posługując się

oznaczeniami z definicji gry dwuosobowej moŜemy zbudować jej macierz, jaką pokazuje

Tabela 1.1. Macierz wygranych została przedstawiona w postaci dwumodułowej. Jej górny

moduł zawiera wygrane gracza, którego strategie zostały wymienione w wierszach tabeli.

Dolny moduł to wygrane drugiego gracza, którego strategie to nagłówki kolumn. Takie

podejście sprawiło, Ŝe niektórzy autorzy gry dwuosobowe o sumie róŜnej od zera i nie stałej

nazywają grami dwumacierzowymi [Drabik, 2005, s. 68]. MoŜna oczywiście informacje

zawarte w Tabeli 1.1 skoncentrować w jednym module, podając w kaŜdej komórce parę

wygranych. W takim wariancie prezentacji zawsze jako pierwsza podawana jest wypłata

gracza, którego strategie wymienione są w nagłówkach wierszy. Gry dwuosobowe o sumie

zerowej zapisuje się w postaci macierzy z wygranymi jednego z graczy. Taki skrócony zapis

w pełni przekazuje zaleŜność między wyborami strategii a wygranymi obydwu uczestników

gry. Gra o sumie stałej, choć toŜsama liniowo z grą o sumie zerowej, jest często

O ile moŜna jeszcze sobie wyobrazić prostopadłościan, podzielony na sześcianiki odpowiadające splotom

strategii w grach trzyosobowych, to gry o ilości graczy większej od trzech nie mogłyby znaleźć czytelnej
prezentacji macierzowej. UtoŜsamienie, o którym mowa jest tak silne w literaturze tematu, Ŝe niektórzy autorzy
nazywają gry dwuosobowe grami macierzowymi [Straffin, 2001].

przedstawiana w postaci dwumacierzowej, by ułatwić czytelnikowi orientację w zmienności

wygranych obydwu graczy.

Gra „A vs B” zawiera w swoich regułach wpływ czynnika losowego. Gdyby gracze

znali rozmiar rynku przed podjęciem decyzji mielibyśmy do czynienia z jedną lub drugą

jednoznacznie określoną macierzą wygranych. Tak nie jest, zatem wpływ ryzyka związanego

z kształtowaniem się czynnika losowego naleŜy uwzględnić poprzez wyznaczenie wartości

oczekiwanych wygranych obydwu graczy. Uprawnia nas do tego przyjęcie załoŜenia o

liniowej uŜyteczności liczbowej. Liczymy, więc na przykład: u

([a

])=0,4·20+0,6·45=35 a

([a

])=0,4·10+0,6·15=13.

Tabela 1.2. Macierz gry „A vs B”

Audioslave

35,0

24,4

Broadcast

29,2

29,6

Audioslave

13,0

23,6

Broadcast

18,8

18,4

ródło: opracowanie własne

Gra w postaci funkcji charakterystycznej jest obrazem wykreowanym dla potrzeb gier

n-osobowych. „Oznaczmy zbiór wszystkich graczy gry n-osobowej przez N={1,2,...,n}.

KaŜdy niepusty podzbiór zbioru N (łącznie z całym N i zbiorami jednoelementowymi)

nazwiemy koalicją. Przez funkcje charakterystyczną gry n-osobowej będziemy rozumieć

funkcję rzeczywistą v określoną dla wszystkich podzbiorów zbioru N, która kaŜdemu

podzbiorowi S

⊂

N przyporządkowuje wartość maksyminową

(dla S) w grze dwuosobowej

rozgrywanej między S a N-S, przy załoŜeniu, Ŝe utworzyły się właśnie dwie koalicje” [Owen,

1975, s. 136]. Wartość v(S) oznacza wartość uŜyteczności, jaką mogą osiągnąć uczestnicy

koalicji bez względu na decyzje podmiotów pozostających poza nią. Twórcy koncepcji

funkcji charakterystycznej wymienili trzy cechy, które musi spełniać [von Neumann,

Morgenstern, 1944, s. 241]:

v(Ø)=0; gdzie Ø to podzbiór pusty,

[1.6]

v(-S)=-v(S),

[1.7]

Pojęcie maksyminu gry o sumie zerowej zostanie przedstawione w dalszej części pracy. Tutaj wystarczy

powiedzieć, Ŝe jest to wartość wygranej v przynoszona przez parę strategii, która zapewnia, Ŝe jeden z graczy
wygra, co najmniej v a drugi przegra najwyŜej v.

v(S

∪

T)≥v(S)+v(T); jeśli S

∩

T=Ø.

[1.8]

W następnym kroku von Neumann i Morgenstern udowodnili, Ŝe funkcja

charakterystyczna spełnia warunki [1.6-1.8] dla kaŜdej gry. Prostą ilustracją koncepcji funkcji

charakterystycznej była następująca gra [von Neumann, Morgenstern, 1944, s. 222-223].

Gra w dobór koalicjanta

KaŜdy z trzech graczy (N={1,2,3}) podaje jednocześnie, numer jednego z

pozostałych. Jeśli dwóch poda, na wzajem, swoje numery to tworzą koalicję i dzielą po

połowie jednostkę, którą daje im gracz pozostający poza koalicją.

Zapis tej gry w postaci funkcji charakterystycznej spełnia wszystkie warunki

sformułowane przez von Neumanna i Morgensterna:

v(Ø)=v(123)=0,

[1.9]

v(1)=v(2)=v(3)=-1

[1.10]

v(12)=v(23)=v(13)=1.

[1.11]

Na ogół, nie zapisuje się gier dwuosobowych w postaci funkcji charakterystycznej.

Niemniej, dla porównania wszystkich trzech prezentowanych form zapisu gier strategicznych,

gra „A vs B” zostanie przedstawiona równieŜ w postaci funkcji charakterystycznej

v(Ø)=0; v(A)=29,41; v(B)=18,59; v(AB)=48.

[1.12]

Jak widać, dla gier dwuosobowych, warunek [1.8] przybiera postać równości.

Zapisanie gry n-osobowej w postaci funkcji charakterystycznej jest moŜliwe dopiero po

rozwiązaniu szeregu gier dwuosobowych. O metodach temu słuŜących będą traktowały dwie

kolejne części pracy.

Zanim jednak do nich przejdziemy, sprawdźmy, jak na reguły gry wpływa zakres

informacji, jakim dysponują gracze. W grze „A vs B” dokonywali oni wyborów strategii nie

znając, na wzajem, swoich posunięć ani rozmiarów rynku. Sprawdźmy, co stanie się, jeśli

zmienimy nieco warunki gry „A vs B”.

Gra „A przeciw B”

Ta gra opiera się na zachowaniu wszystkich, poza jedną reguł gry „A vs B”.

Zmienioną regułą jest jednoczesność wyboru strategii. Firma Broadcast, ze względu na

mniejsze rozmiary i, co za tym idzie, większą elastyczność, podejmuje decyzję później,

znając juŜ wybór firmy Audioslave.

Opisana modyfikacja warunków zmieni rozłoŜenie zbiorów informacyjnych postaci

ekstensywnej gry. Gracz B podejmuje decyzję wiedząc, czy A wybrał a

czy a

Sposób wyznaczenia v(A) i v(B) zostanie przedstawiony w następnej części pracy.

W porównaniu z grą „A vs B” sytuacja gracza A nie zmieniła się. Gracz B natomiast,

zamiast jednego, ma dwa zbiory informacyjne. Jeden łączy wierzchołki połączone z gałęziami

odpowiadającymi wyborom strategii a

(produkować tańszy odtwarzacz T), drugi to dwa

wierzchołki, do których dochodzą gałęzie a

(produkować droŜszy odtwarzacz D). Wiedza

dotycząca wyboru strategii przez gracza A modyfikuje zbiór strategii gracza B. Nie jest on juŜ

prostą alternatywą b

lub b

. W obecnej postaci gry, gracz B ma do wyboru cztery strategie:

– zawsze wybierać odtwarzacz tańszy („TT;DT”),

– wybierać ten sam profil produktu co A („TT;DD”),

– zawsze wybierać przeciwnie niŜ A („TD;DT”)

– zawsze wybierać odtwarzacz droŜszy („TD;DD”).

Strategia b

jest toŜsama ze strategią b

z poprzedniej wersji gry. Podobnie jest z parą

i b

. Niemniej dla zaakcentowania odmienności gier „A vs B” i „A przeciw B”

wprowadzono odmienne oznaczenia. Postać macierzowa gry „A przeciw B” musi uwzględnić

wzrost ilości strategii czystych gracza B oraz inne kombinacje wygranych brane do kalkulacji

wartości oczekiwanej wypłat graczy. Na przykład, wynik gry dla kombinacji strategii [a

]

będzie następujący u

([a

])=0,4·10+0,6·42=29,2 i u

([a

])=0,4·20+0,6·18=18,8.

Los

Audioslave

Broadcast

mały rynek
p

=0,4

duŜy rynek
p

=0,6

(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)

Schemat 1.2. Dendryt gry „A przeciw B”

ródło: opracowanie własne na podstawie [Kreps, 1990]

Tabela 1.3. Macierz gry „A przeciw B”

Audioslave

35,0

24,4

35,0

29,6

29,2

24,4

Broadcast

29,2

29,6

Audioslave

13,0

23,6

13,0

18,4

18,8

23,6

Broadcast

18,8

18,4

ródło: opracowanie własne

Macierze gier „A vs B” i „A przeciw B” róŜnią się ze względu na pojawienie się

nowych wierszy b

i b

. Nowa macierz podległa istotnemu rozbudowaniu. Zmiany postaci

ekstensywnej gry nie są tak ewidentne. W niej, zmianie ulega tylko zakres zbioru

informacyjnego jednego gracza. Oczywiście to nie zmienia faktu, Ŝe obydwie postacie

przedstawiają tą samą grę.

Przykład wpływu zmiany zbiorów informacyjnych w grze „A przeciw B” ilustruje

dobrze metamorfozę, jaką przechodzi obraz gry od postaci ekstensywnej do macierzowej.

Wpływ czynnika losowego, który rozgałęział dendryt gry zostaje zredukowany do udziału

prawdopodobieństw w liczeniu wartości oczekiwanych wypłat graczy. KaŜdy moŜliwy

przebieg gry, czyli partia gracza zostaje zredukowana do postaci jednej strategii czystej i

jednego ruchu. Konstrukcja strategii nie wymaga jakiejkolwiek wiedzy o decyzjach

przeciwnika. Dopiero jej wybór, połączony ze znajomością decyzji przeciwnika, w sposób

automatyczny dobiera wygrane do policzenia odpowiedniej wartości oczekiwanej. Opisana

procedura to „redukcja kaŜdej gry do prostej postaci standardowej, zwanej postacią normalną

gry” [Luce, Raiffa, 1964, s. 58]. Postać normalna, o której mowa, róŜni się od postaci

macierzowej jedynie szczegółami technicznymi dotyczącymi konstrukcji tabeli.

Idąc dalej w przemianach zakresu informacji graczy, moŜemy zbudować kolejną grę.

Zmiana zbiorów informacyjnych gracza A powinna pociągnąć za sobą zwiększenie się liczby

jego strategii czystych.

Gra „A kontra B”

Przyjmijmy wszystkie reguły gry „A przeciw B” zmieniając tylko jedną. Firma

Audioslave zamówiła badanie rynku i poznała jego rozmiar przed podjęciem decyzji o profilu

produktu. Firma Broadcast wie, Ŝe badania zostały przeprowadzone, ale nie zna ich wyniku.

Postać rozwinięta gry „A kontra B” zmieni się w stosunku do poprzedniej wersji

analizowanej sytuacji rynkowej w zakresie zbioru informacyjnego gracza A. Wiedza o

rozmiarach rynku sprawi podzieli się on na dwa reprezentujące odpowiednio informacje:

„rynek jest duŜy” lub „rynek jest mały”.

W porównaniu z grą „A przeciw B”, zbiór strategii gracza B nie ulegnie zmianie.

Zbiór strategii gracza A musi zostać zbudowany z uwzględnieniem zmian w zakresie

informacji. Nowe strategie budowane są przed zdobyciem wiedzy o rozmiarach rynku, ale w

swojej istocie muszą ją uwzględniać. W obecnej postaci gry, gracz A ma do wyboru cztery

strategie:

– niezaleŜnie od rozmiarów rynku wybierać odtwarzacz tańszy („mT;dT”),

– wybrać tańszy na mały rynek i droŜszy na duŜy („mT;dD”),

– wybrać droŜszy na mały rynek i tańszy na duŜy („mD;dT”),

– zawsze wybierać odtwarzacz droŜszy („mD;dD”).

Nie potrzeba głębszej analizy, aby zauwaŜyć, Ŝe najniŜsze wygrane powinna przynosić

strategia a

. Polega ona na wejściu z tanim odtwarzaczem na mały rynek, na którym dominują

audiofile lub z drogim odtwarzaczem na rynek duŜy, który oczekuje tzw. „sprzętu dla

Los

Audioslave

Broadcast

mały rynek
p

=0,4

duŜy rynek
p

=0,6

(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)

Schemat 1.3. Dendryt gry „A kontra B”

ródło: opracowanie własne na podstawie [Kreps, 1990]

kaŜdego”. NajwyŜsze wygrane powinien, zatem przynieść graczowi A wybór strategii a

Zapis macierzowy gry „A kontra B” potwierdza te przypuszczenia.

Tabela 1.4. Macierz gry "A kontra B"

Audioslave

35,0

22,4

37,0

24,4

35,0

29,6

35,0

29,6

29,2

18,4

35,2

24,4

Broadcast

29,2

25,6

33,2

29,6

Audioslave

13,0

25,6

11,0

23,6

13,0

18,4

13,0

18,4

18,8

29,6

12,8

23,6

Broadcast

18,8

22,4

14,8

18,4

ródło: opracowanie własne

Podobnie, jak w przypadku przejścia od gry „A vs B” do gry „A przeciw B” macierz

gry „A kontra B” róŜni się od poprzedniej pojawieniem się dwóch dodatkowych kolumn a

. Gdybyśmy z tej macierzy usunęli wszystkie komórki poza naroŜnikowymi,

otrzymalibyśmy macierz gry, od której zaczynaliśmy („A vs B”).

Gry o sumie zerowej

1.1.4.

Punkt siodłowy jako rozwiązanie w strategiach czystych

Natura gier o sumie zerowej

przejawia się w ich ściśle konkurencyjnym charakterze

[Luce, Raiffa, 1964, s. 64]. Jest on widoczny w czystej postaci, jeśli mamy do czynienia z grą

dwuosobową. Zwiększenie ilości graczy do n>2 stwarza moŜliwość dla budowania koalicji,

co zmienia naturę sytuacji strategicznych opisywanych grami o sumie zerowej. Ścisły konflikt

interesów ustępuje miejsca wyborowi między koalicjami. Oczywiście suma wygranych

koalicji i jej dopełnienia nadal jest zerowa, ale sytuacja pojedynczego gracza jest inna niŜ w

przypadku gry dwuosobowej. Z tej przyczyny, oraz ze względu na przedmiot zainteresowania

zasadniczej części pracy uwaga zostanie skoncentrowana na grach dwuosobowych.

cisły konflikt interesów połączony z dokonywaniem wyborów w warunkach

niepewności przynosi szczególną konstrukcję sytuacji decyzyjnej. DąŜąc do maksymalnej

Strategia a

jest toŜsama z a

a a

z a

. Analogicznie jak w przypadku gracza B.

Przypomnijmy, Ŝe prawie wszystkie obserwacje dotyczące tej klasy gier moŜna rozciągnąć na szerszą

kategorię gier o sumie stałej.

wygranej gracz moŜe doprowadzić do bardzo niepoŜądanego wyniku. Dokonując wyborów

strategii kaŜdy z graczy musi mieć świadomość tego, Ŝe przeciwnik pośrednio ma na celu

minimalizację jego wygranej. Racjonalnym jest zatem dokonywanie takich wyborów, które

uchronią od jak najwyŜszych przegranych. Gdyby posłuŜyć się terminologią wojskową, w

grach o sumie zerowej naleŜy stosować strategie minimalizacji strat. Przyjrzyjmy się

przykładowi następującej gry.

„Walka o rynek 1”

Dwa przedsiębiorstwa walczą o udział w rynku lokalnym. KaŜde z nich ma do wyboru

trzy strategie tzw. mixu marketingowego. W zaleŜności od tego, jakie wybiorą strategie,

mogą stracić lub zyskać kosztem konkurenta określoną część rynku mierzoną w punktach

procentowych. Wyniki przyporządkowania wygranych graczy parom strategii przedstawia

Tabela 1.5.

Tabela 1.5. Macierz gry "Walka o rynek 1"

-4%

-1%

-2%

-1%

ródło: opracowanie własne

Gdyby gracz B postawił sobie za cel odebranie konkurentowi największej, moŜliwej w

tej grze, części rynku (u

=3%), musiałby wybrać strategię b

. Jednak, jeśli jednocześnie gracz

A wybierze strategię a

, udziałem B stanie się maksymalna moŜliwa utrata części rynku, czyli

=-4%. Gdyby podobnym dąŜeniem kierował się gracz A, mogłoby się skończyć utratą 2%

rynku. Teoria gier nie daje odpowiedzi jak powinien postąpić gracz, aby osiągnąć jak

najwyŜszą wygraną w grze o sumie zerowej. MoŜe jednak wskazać sposób wyboru strategii,

który zapewni pewien minimalny poziom wygranej, lub patrząc z innego punktu widzenia,

maksymalny poziom przegranej.

JuŜ von Neumann i Morgenstern w swoim kanonicznym dziele sformułowali

postulaty, których spełnienie powinno towarzyszyć odnajdywaniu rozwiązań w grach o sumie

zerowej. Jednym z nich jest dominacja strategii. Jeśli strategia

przynosi, co najmniej,

takie same wygrane jak inna strategia a

, niezaleŜnie od wyboru pozostałych graczy, a

Von Neumann i Morgenstern definiując dominację posłuŜyli się terminem „imputacja” czyli n-wymiarowy

wektor wypłat wszystkich graczy spełniający kryteria indywidualnej i zbiorowej racjonalności w grach n-
osobowych. W wielu pracach powstałych później, w przypadku gier dwuosobowych, operuje się definicją
dominacji strategii [Owen, 1975, s. 31] [Straffin,2001, s. 7] i to podejście zostało przyjęte przez autora.

przynajmniej w jednym wypadku wyŜszą to, moŜemy powiedzieć, Ŝe a

dominuje a

, lub a

jest zdominowane przez a

[von Neumann, Morgenstern, 1944, s. 37]. W przypadku gier

dwuosobowych, opisana dominacja ma miejsce wtedy, i tylko wtedy, gdy dla kaŜdego

∈

])

([

]

([

≥

[1.13]

i istnieje co najmniej jedno b

∈

, Ŝe:

])

([

]

([

[1.14]

Analogicznie moglibyśmy zdefiniować dominację w obrębie zbioru strategii gracza B.

Racjonalnie zachowujący się gracz nigdy nie wybierze strategii zdominowanej

. Postulat

dominacji pozwala na ograniczenie zbioru strategii podczas poszukiwania rozwiązania gry.

MoŜna z niego usunąć wszystkie strategie zdominowane.

Tabela 1.6. Wyznaczanie wartości gry "Walka o rynek 1"

min

∈

-4%

-1%

-4%

min

max

∈

-2%

-1%

-2%

max

∈

max

min

∈

ródło: opracowanie własne

Postulowany sposób rozwiązywania gier wykorzystuje pojęcie maksyminu

[von

Neumann, Morgenstern, 1944, s. 89-93]. Maksyminem gry dwuosobowej o sumie zerowej

nazywamy, taką wartość v

, Ŝe:

])

([

min

max

∈

[1.15]

Maksymin gry jest wskazaniem strategii gracza B przynoszącym najwyŜszą z najniŜszych

wygranych, jakie poszczególne strategie tego gracza mogą przynieść. Innymi słowy, dla

kaŜdej strategii gracza B odnajdujemy najniŜszą wartość, zakładając, Ŝe gracz A będzie

odpowiadał w sposób najkorzystniejszy dla siebie. Spośród wszystkich, tak wskazanych

minimów, wybieramy największe. W grze „Walka o rynek 1” maksyminem jest

Niektórzy autorzy dzielą dominacje na słabą, zgodną z nierównością [1.13] i ostrą, w przypadku której ta

nierówność przybiera postać ostrą [Drabik, 2005, s. 34]. Nie zmienia to praktycznego wymiaru dominacji.
Strategia zdominowana nie wejdzie w skład rozwiązania niezaleŜnie od tego, czy jest to nierówność ostra czy
nieostra.

Matematyczną koncepcję maksyminu przedstawił po raz pierwszy E. Borel [Borel, 1921]. Von Neumannowi

przypisuje się jej pionierskie wykorzystanie w sformułowaniu twierdzenia maksyminowego dla gier o sumie
zerowej [von Neumann, 1928].

([a

])=1%. Gracz B, wybierając strategię b

, czyli swoją strategię maksyminową,

zapewnia sobie, Ŝe wygra, co najmniej, 1% rynku.

Z punktu widzenia gracza A, interesująca jest inna postać tej samej kategorii teorii

gier. śeby zapewnić sobie minimalny poziom wygranej A musi wybierać strategię tak, aby

gracz B wybierając najkorzystniej dla siebie, osiągnął najniŜszą z najwyŜszych wygranych.

Gracz A powinien się kierować kryterium minimaksu. Minimaksem gry dwuosobowej jest

taka wartość gry v

, Ŝe:

])

([

max

min

∈

[1.16]

W grze „Walka o rynek 1”, minimaksem gry jest v

([a

])=1%. Gracz A

wybierając strategię minimaksową a

gwarantuje sobie, Ŝe nie przegra więcej niŜ 1% rynku.

Wyznaczenie maksyminu i minimaksu gry pozwala wyznaczyć poziomy bezpieczeństwa

obydwu graczy. Strategia maksyminowa jest nazywana równieŜ strategią bezpieczeństwa

[Luce, Raiffa, 1964, s. 70]. Wybierając ją, gracz zapewnia sobie bezpieczeństwo

maksymalizacji minimalnego poziomu wygranej równego v

. Wygrane v

i v

nazywane są

równieŜ, odpowiednio dolną i górną wartością gry [Drabik, 2005, s. 31-32].

Łatwo udowodnić, Ŝe minimaks gry dwuosobowej o sumie zerowej jest równy, co do

bezwzględnej wartości i przeciwny, co do znaku, jej maksyminowi na wygranych drugiego

gracza [von Neumann, Morgenstern, 1944, s. 109]:

])

([

min

max

])

([

max

min

∈

−

[1.17]

])

([

max

min

])

([

min

max

∈

−

[1.18]

Gra „Walka o rynek 1” jest przykładem konfliktu interesów, w którym maksymin

zrównuje się z minimaksem:

])

([

max

min

])

([

min

max

∈

[1.19]

Jeśli mamy do czynienia z taką sytuacją, oznacza to, Ŝe gra posiada punkt siodłowy

[von Neumann, Morgenstern, 1944, s. 95]. Jednocześnie taką grę moŜna określić jako ściśle

określoną [von Neumann, Morgenstern, 1944, s. 106]. Punkt siodłowy w grach

dwuosobowych o sumie zerowej to taka para strategii, przy której zachodzi warunek [1.19].

Wygrana „v” w punkcie siodłowym nazywana jest wartością gry. Jest ona jednocześnie równa

lub wyŜsza od pozostałych w kolumnie i niŜsza lub równa od pozostałych w wierszu

. Punkt

siodłowy w grach o sumie zerowej traktujemy jako rozwiązanie gry w strategiach czystych, a

Oczywiście mówimy o macierzy wygranych gracza, którego strategie stanowią nagłówki wierszy.

strategię nań się składające jako optymalne strategie czyste graczy. Niektórzy autorzy

definiują rozwiązanie dwuosobowej gry o sumie zerowej jako trzyelementowy zbiór: wartość

gry oraz optymalne strategie graczy [Straffin, 2001, s. 17].

Wróćmy na moment do gry „A przeciw B”, którą pozostawiliśmy bez rozwiązania.

Jest to gra o sumie stałej toŜsama liniowo z grą o sumie zerowej opisaną Tabelą 1.7, która ma

punkt siodłowy w strategiach [a

] (Audioslave produkuje odtwarzacz tańszy a Broadcast

wybiera inaczej od konkurenta). W tym rozwiązaniu gracze dzielą się oczekiwaną wartością

rynku w sposób następujący: u

([a

])=29,2 i u

([a

])=18,8. Te same wygrane staną się

udziałem graczy, jeśli wybiorą strategie [a

]. Nie jest to jednak punkt siodłowy,

’([a

])=-5,2 nie jest wartością najniŜszą w wierszu i najwyŜszą w kolumnie. Ponadto,

jeśli przed wyznaczeniem maksyminu i minimaksu wykorzystamy kryterium dominacji to

okaŜe się, Ŝe strategia b

dominuje wszystkie pozostałe, co czyni wybór gracza B trywialnym.

Gracz A zna macierz wygranych, zatem pozostaje mu wybór najlepszej odpowiedzi na b

czyli a

Tabela 1.7. Wyznaczenie punktu siodłowego gry "A przeciw B"

’

min

∈

-11

-0,4

-11

-5,6

-11

-5,2

-0,4

-5,2

min

max

∈

-5,2

-5,6

-5,2

max

∈

-5,2

-0,4

max

min

∈

-5,2

ródło: opracowanie własne

Aby dopełnić powinności wyznaczenia punktu siodłowego w grze, która była

rozwinięciem „A przeciw B” ponownie dokonano przekształcenia liniowego macierzy

wygranych z Tabeli 4. Powstała gra o sumie zerowej ma jeden punkt siodłowy w strategiach

]. Wartością gry jest:

])

([

])

([

max

min

])

([

min

max

−

∈

[1.20]

Taka wartość gry oznacza podział rynku: u

([a

])=33,2 i u

([a

])=14,8.

Wykorzystanie kryterium dominacji prowadzi, tym razem, gracza A do

jednoznacznego wyboru strategii a

, która dominuje wszystkie pozostałe. Graczowi B

pozostaje wybrać b

, która jest jego najlepszą odpowiedzią na a

. Znalezione rozwiązania gier

„A przeciw B” i „A kontra B” wskazują, Ŝe graczowi A, czyli firmie Audioslave, opłaca się

zapłacić za badania rynku tylko wtedy, gdy ich cena nie będzie większa od czterech

([a

])-u

([a

])=33,2-29,2=4).

Tabela 1.8. Wyznaczenie punktu siodłowego w grze "A kontra B"

min

∈

-11

1,6

-13

-0,4

-13

-11

-5,6

-11

-5,6

-11

-5,2

5,6

-11,2

-0,4

-11,2

min

max

∈

-5,2

-1,6

-9,2

-5,6

-9,2

-9,2

max

∈

-5,2

5,6

-9,2

-0,4

max

min

∈

-9,2

ródło: opracowanie własne

Zdarza się, Ŝe w grach dwuosobowych o sumie zerowej są dwa punkty siodłowe. Taka

sytuacja oczywiście moŜe mieć miejsce, ale zawsze są to rozwiązania ekwiwalentne i

zamienne. „KaŜde dwa punkty siodłowe tej samej gry, mają tą samą wartość. Jeśli zarówno

gracz A jak i gracz B wybiorą strategie zawierające punkty siodłowe, to wynik gry zawsze

będzie punktem siodłowym” [Straffin, s. 10].

Tabela 1.9. Wyznaczanie wartości gry "Walka o rynek 2"

min

∈

-4%

-1%

-4%

min

max

∈

max

∈

max

min

∈

ródło: opracowanie własne

Poszukiwanie punktu siodłowego w grze „Walka o rynek 2”

przyniosło podwójne

wskazanie. Niezmieniona, w porównaniu z grą „Walka o rynek 1”, wartość gry v=1% pojawia

się dla dwóch par strategii:

])

([

])

([

])

([

max

min

])

([

min

max

∈

[1.21]

Gra „Walka o rynek 2” ma dwa punkty siodłowe. Zgodnie z twierdzeniem o ekwiwalentności

i zamienności, graczom obojętne jest, w którym z punktów siodłowych przyjdzie im się

znaleźć.

„Walka o rynek 2” róŜni się od pierwszej wersji tylko macierzą wypłat.

Oczywiście, liczba punktów siodłowych równa dwa nie jest limitem ich liczebności w

jednej grze. Wystarczy wyobrazić sobie grę, w której nieparzyste wiersze macierzy

zawierałyby wyłącznie wypłaty większe od v w nieparzystych kolumnach lub równe v w

parzystych. Parzyste wiersze zaś powinny zawierać wyłącznie wygrane niŜsze od v. Liczba

punktów siodłowych

, jakie posiada ta gra moŜna byłoby określić wzorem:

)

(

)

(

)

(

[1.22]

gdzie m to liczba strategii gracza A (kolumny) a n to ilość strategii gracza B (wiersze), E zaś

jest funkcją przyporządkowującą kaŜdej liczbie rzeczywistej jej część całkowitą.

Wystarczyłoby, Ŝeby tylko jedna z liczby strategii zmierzała do nieskończoności, a taka gra

miałaby nieskończoną ilość punktów siodłowych.

1.1.5.

Rozwiązanie w strategiach mieszanych; twierdzenie maksyminowe

W praktyce moŜemy mówić o duŜym szczęściu, jeśli uda się znaleźć, chociaŜ jeden

punkt siodłowy. Większość gier, z jakimi mamy do czynienia, nie ma Ŝadnego punktu

siodłowego, toŜsamego z rozwiązaniem w strategiach czystych. Z taką grą juŜ mieliśmy do

czynienia. Przypomnijmy sobie grę „A vs B” w postaci macierzowej (Tabela 1.2). Odejmując

od wygranych obydwu graczy 24 (połowa wartości oczekiwanej rynku), otrzymamy grę o

sumie zerowej.

Warunek [1.19] nie jest spełniony w przypadku tej gry. Von Neumann i Morgenstern

zdefiniowali takie gry jako nie ściśle określone. W ich przypadku v

≤

[von Neumann,

Morgenstern, 1944, s. 110]. To nie oznacza, Ŝe nie posiadają one rozwiązań. NaleŜy ich

poszukiwać innymi metodami. NiezaleŜnie od tego, jaką wybierzemy metodę, w skład

rozwiązania nie będzie juŜ wchodzić para strategii czystych. Koniecznym będzie rozszerzenie

przynajmniej jednego zbioru strategii o ich mieszaną postać.

Tabela 1.10. Gra "A vs B" przekształcona liniowo

min

∈

-11

-0,4

-11

min

max

∈

-5,2

-5,6

-5,6

max

∈

-5,2

-0,4

max

min

∈

-5,2

ródło: obliczenia własne

Znalezienie optymalnej strategii mieszanej, dla kaŜdego z obydwu graczy, polega na

wyznaczeniu takiej, która spełniać będzie analogiczną rolę jak czysta strategia optymalna w

grach z punktem siodłowym. Aby tego dokonać naleŜy wyznaczyć zbiór prawdopodobieństw,

który wyznaczy taką strategię mieszaną, Ŝe nie będzie moŜna znaleźć innej, gwarantującej

wyŜszy poziom wygranej niezaleŜnie od wyborów drugiego gracza.

Dowolna strategia mieszana gracza A zbudowana z m strategii czystych i rozkładu

prawdopodobieństwa p

={p

,...,p

} takiego, Ŝe 0≤p

≤

1 oraz

∑

, to

=[p

,...,p

]. Analogicznie moŜemy zdefiniować postać ogólną strategii

mieszanej gracza B (b

∈

) jako b

=[q

,...,q

] (0≤q

≤

1 oraz

∑

Spośród wszystkich strategii mieszanych a

∈

i b

∈

, optymalnymi a

i b

będą te,

które spełnią warunki:

])

([

inf

sup

])

([

∈

[1.23]

])

([

sup

inf

])

([

∈

[1.24]

gdzie:

– dolna wartość gry w strategiach mieszanych,

– górna wartość gry w strategiach mieszanych,

sup – kres górny zbioru wypłat generowanych przez strategie mieszane,

inf – kres dolny zbioru wypłat generowanych przez strategie mieszane

Inaczej rzecz ujmując, moŜemy stwierdzić, Ŝe wyznaczenie optymalnej strategii

mieszanej polega na znalezieniu takich prawdopodobieństw losowania strategii, by drugi z

graczy nie mógł przekroczyć pewnego maksymalnego poziomu wygranej, niezaleŜnie od

tego, jaką strategię czystą wybierze. I odwrotnie, gracz, którego wygrane opisane są macierzą

gry będzie szukał takich prawdopodobieństw, by zapewnić sobie minimalny poziom wypłaty

niezaleŜnie od wyborów przeciwnika. Optymalna strategia mieszana wyznaczona w tym

drugim przypadku musi przynieść maksymalną v

spełniającą układ warunków

przedstawiony niŜej.

W ślad za E. Drabik zastąpiono pojęcia „max” i „min” by zaakcentować odmienność gier ściśle określonych

od gier nie ściśle określonych [Drabik, 2005, s. 36].













≤

≥

...

])

([a

...

])

([a

...

])

([a

])

([a

...

])

([a

...

])

([a

...

])

([a

])

([a

...

])

([a

...

])

([a

...

])

([a

])

([a

])

([a

...

])

([a

...

])

([a

])

([a

[1.25]

Dwuosobowe gry o sumie zerowej, bez punktów siodłowych, o dwuelementowych

zbiorach

strategii

czystych,

moŜemy

zawsze

rozwiązać

wykorzystując

metodę

przyrównywania [Shubik, 1995, s. 222]. Wybierając swoją optymalną strategię mieszaną,

gracz zapewnia sobie, Ŝe przeciwnik nie odniesie Ŝadnej korzyści z poznania jej [Straffin,

2001, s. 15]. Postawmy się na miejscu gracza B w grze „A vs B”. Musi on wybrać takie

prawdopodobieństwa q

i q

losowania strategii b

i b

, aby gracz A nie mógł odnieść korzyści

z wiedzy o jego wyborze strategii mieszanej. Dzieje się tak wtedy, gdy:









≤

⇒

])

([

])

([

])

([

])

([

)

(

)

(

[1.26]

W analizowanej grze ten warunek daje się sprowadzić do równania:

)

(

)

(

−

[1.27]

którego rozwiązaniem jest

. Optymalną strategią mieszaną gracza B jest

]. Przynosi ona dolną wartość gry w strategiach mieszanych:

)

(

)

(

)

(

)

(

−

[1.28]

Wybór optymalnej strategii przez gracza B oznacza podział wartości oczekiwanej

rynku, przy którym firma Audioslave osiąga przychód u

=29,41 a firma Broadcast u

=18,59.

Wybierając optymalną strategię mieszaną gracz B gwarantuje sobie, Ŝe osiągnie przychód, co

najmniej równy 18,59, niezaleŜnie od wyboru strategii przez gracza A. Porównanie

uzyskanego wyniku z rozwiązaniem gry „A przeciw B” (u

=18,8) pokazuje, Ŝe znajomość

decyzji konkurenta pozwala firmie Broadcast zagwarantować sobie wygraną wyŜszą o 0,21.

Wykres 1.1. Graficzna interpretacja metody przyrównań dla gry "A vs

B" przekształconej liniowo (v

)

-12

-11

-10

-9

-8

-7

-6

-5

-4

-3

-2

-1

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

EV(a

)

EV(a

)

ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]

Dolna wartość gry w strategiach mieszanych niesie z sobą podobną interpretację jak

maksymin w grach ściśle określonych. Jest to dobrze widoczne na wykresie obrazującym

działanie metody przyrównywania. Gracz A, znając wybraną przez B strategię mieszaną, dla

kaŜdego q

≠

, mógłby tak dobierać swoją strategię czystą, aby B osiągał wygrane mniejsze

od v

=-5,41. Dla q

wybierałby a

, a gdy q

, a

. Tylko wybór optymalnej strategii

mieszanej, opartej na q

gwarantuje, Ŝe wygrana B nie będzie niŜsza niŜ v

=-5,41.

Analogicznie wyznaczana jest górna wartość gry w strategiach mieszanych.

Optymalna strategia mieszana gracza musi spełniać warunek:









≤

⇒

])

([

])

([

])

([

])

([

)

(

)

(

[1.29]

W grze „A vs B” warunek [1.29] przybiera postać:

)

(

)

(

−

[1.30]

którego rozwiązaniem jest

. Optymalną strategią mieszaną gracza A jest

]. Przynosi ona dolną wartość gry w strategiach mieszanych:

)

(

)

(

)

(

)

(

−

[1.31]

Wykres 1.2. Graficzna interpretacja metody przyrównań dla gry "A vs

B" przekształconej liniowo (v

)

-12

-11

-10

-9

-8

-7

-6

-5

-4

-3

-2

-1

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

EV(b

)

EV(b

)

ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]

Grając swoją strategię optymalną A gwarantuje sobie, Ŝe B nie wygra więcej niŜ v

niezaleŜnie od tego czy wybierze b

czy b

Wyniki obliczeń przeprowadzonych dla gry „A vs B” są ilustracją twierdzenia

von Neumanna. Zgodnie z nim, w kaŜdej dwuosobowej grze o sumie zerowej z pełną

informacją, moŜna znaleźć rozwiązanie składające się z optymalnych strategii mieszanych

takich, Ŝe:

])

([

])

([

[1.32]

gdzie w jest wartością gry w strategiach mieszanych [von Neumann, Morgenstern, 1944,

s. 123]. Jeśli rozszerzymy zbiory strategii graczy dopuszczając ich mieszanie, kaŜda gra jest

ciśle określona. Autorski dowód tego twierdzenia jest dość skomplikowany i opiera się na

twierdzeniu Brouwera o punkcie stałym. Wśród późniejszych wersji prostotą wyróŜnia się

dowód Nasha [Luce, Raiffa, 1964, s. 362-364]. NiezaleŜnie od sposobu dowodzenia,

twierdzenie minimaksowe von Neumanna ma fundamentalne znaczenie dla poszukiwania

rozwiązań w grach o sumie zerowej.

Wykres pokazujący metodę przyrównania, wykorzystaną w rozwiązaniu gry

dwuosobowej o sumie zerowej i macierzy wygranych 2x2, ma wyłącznie znaczenie

ilustracyjne. Jeśli rozszerzymy rozmiar macierzy do nx2, okaŜe się, Ŝe graficzna ilustracja

ułatwia i przyspiesza analityczne wyznaczenie rozwiązania metodą przyrównania

Tabela 1.11. Poszukiwanie punktu siodłowego gry "Walka o rynek 3"

min

∈

-4%

min

max

∈

max

∈

max

min

∈

ródło: opracowanie własne

„Walka o rynek 3”

Wróćmy do gry „Walka o rynek 2” redukując ją. Okazało się, bowiem Ŝe ze względu

na wysokie koszty, gracz A na pewno nie wybierze strategii a

Nowa gra nie ma punktu siodłowego. Nie moŜna teŜ, zacząć od metody przyrównania

w postaci analitycznej ze względu na nierówną liczebność zbiorów strategii czystych obydwu

graczy. Wybór optymalnej strategii mieszanej gracza A poprzedźmy konstrukcją

odpowiedniego wykresu.

Wykres 1.3. Graficzna interpretacja metody

przyrównań dla gry "Walka o rynek 3"

-5%

-4%

-3%

-2%

-1%

0,0

0,2

0,4

0,6

0,8

1,0

EV(b

)

EV(b

)

EV(b

)

ródło: opracowanie własne

Williams idzie dalej w uznaniu znaczenia interpretacji graficznej twierdząc, Ŝe istnieje autonomiczna metoda

graficzna rozwiązywania gier o macierzach wygranych 2xm [Williams, 1965, s. 88].

Właściwy wykres, dla ułatwienia odczytu szukanych wartości naleŜy uzupełnić tabelą,

która pokazuje jak zmieniają się wartości oczekiwane wygranych gracza B w zaleŜności od

prawdopodobieństwa p

wyboru strategii a

przez gracza A.

Tabela 1.12. Wyznaczanie wartości gry "Walka o rynek 3" metodą przyrównania

0,0000

0,1429

0,2222

0,5000

1,0000

EV(b

)

2,000%

2,143%

2,222%

2,500%

3,000%

EV(b

)

4,000%

2,857%

2,222%

0,000%

-4,000%

EV(b

)

3,000%

2,857%

2,778%

2,500%

2,000%

ródło: opracowanie własne

Gracz A wie, Ŝe konkurent będzie dąŜył do osiągnięcia jak najwyŜszej wygranej przy

danym wyborze prawdopodobieństwa p

. Jeśli 0≤p

≤

0,1429, B wybierze strategię b

, gdy

0,1429≤p

≤

0,5 najwyŜszą wygraną przyniesie strategia b

i ostatecznie dla 0,5≤p

≤

najlepszym wyborem B będzie strategia b

(zob. Wykres 1.3). Graczowi A pozostaje wybór

takiego prawdopodobieństwa p

, by „osadzić” B w najniŜszym punkcie, najkorzystniejszej dla

niego, łamanej. Zarówno z wykresu jak i z Tabeli 1.12 wynika, Ŝe najkorzystniej dla A będzie

wybrać p

=0,5, gwarantując sobie tym, Ŝe B nie wygra więcej niŜ v

=2,5%.

W takiej sytuacji B, z pewnością nie wybierze b

. Aby wyznaczyć jego optymalną

strategię mieszaną, naleŜy posłuŜyć się loterią strategii b

i b

. Musi ona zapewnić spełnienie

warunku [1.26], który w przypadku gry „Walka o rynek 3” daje się sprowadzić do postaci:

)

−

[1.33]

Rozwiązaniem tego równania jest q

=0,5. Dolna wartość gry w strategiach mieszanych

wynosi v

=2,5%. MoŜemy juŜ wskazać rozwiązanie gry „Walka o rynek 3”. Składają się na

nie:

optymalna strategia gracza A: a

optymalna strategia gracza B: b

,0b

wartość gry v

=w=2,5%.

Porównanie rozwiązań gier „Walka o rynek 2” i „Walka o rynek 3” wskazuje, Ŝe

usunięcie strategii a

, jakkolwiek konieczne ze względu na wysokie koszty, było niekorzystne

dla gracza A. Wartość gry wzrosła z v=1% do w=2,5%. MoŜna się tego było spodziewać,

wszak usunęliśmy strategię, która dominowała a

we wcześniejszej wersji gry. Jeśli zatem,

dodatkowe koszty związane z podjęciem realizacji strategii a

są niŜsze od wartości, jaką

moŜe przynieść utrzymanie 1,5% rynku, gracz A powinien pozostać przy „Walce o rynek 2”.

WyróŜnienie gier o sumie zerowej zawdzięczać naleŜy ich jednoznacznej naturze. W

grach tego typu konflikt interesów występuje w czystej postaci. „Główną ideą

1.3.

Niekooperacyjne gry o sumie róŜnej od zera

1.3.1.

Równowaga w strategiach czystych

Naturalnym dopełnieniem zbioru gier o sumie zerowej są gry o sumie róŜnej od zera

Jednocześnie moŜna powiedzieć, Ŝe zarówno gry o sumie zerowej jak i gry o sumie róŜnej od

zera są rozłącznymi podzbiorami gier o sumie dowolnej. Gry n-osobowe o sumie róŜnej od

zera to te, w przypadku których istnieje przynajmniej jedno m

naleŜące do M takie, Ŝe:

)

(

≠

∑

[1.34]

lub w przypadku gier dwuosobowych, istnieje przynajmniej jedno m

naleŜącego do M, takie,

)+u

)≠0.

[1.35]

W przypadku gier o sumie róŜnej od zera wygrane graczy w ramach określonego

zbioru wyników gry, przynajmniej w jednym przypadku, nie sumują się do zera. Powoduje to

niejednoznaczność sytuacji strategicznej. MoŜe być tak, Ŝe zmiana wskazania strategii, przez

co najmniej jednego gracza zwiększy wygrane wszystkich uczestników gry, albo tak, Ŝe

wygrane części graczy zwiększają się, części zmniejszają a pozostałych nie zmieniają się.

Brak powszechności konfliktu interesów moŜe w skrajnej sytuacji przybrać postać ich

pełnej zbieŜności. W takiej sytuacji, kaŜda zmiana strategii prowadzi do zmian wygranych

graczy o tym samym znaku. Z punktu widzenia teorii gier takie sytuacje są trywialne.

Ewentualność wystąpienia sytuacji, w której wszyscy gracze będą zainteresowani w

określonej zmianie strategii zdecydowanie wyróŜnia gry o sumie róŜnej od zera. Istnieje

waŜna klasa dwuosobowych gier o sumie róŜnej od zera zwana grami kooperacyjnymi. Ich

rozwiązanie polega na wyznaczeniu par strategii, co do przyjęcia których gracze podejmują

wiąŜące zobowiązanie i przynoszących obydwu wyŜsze wygrane niŜ przy niekooperacyjnym

wyborze strategii. Ich szczególne znaczenie sprawia, Ŝe wyznaczaniu rozwiązań

kooperacyjnych poświęcono odrębną część pracy.

W tej części pracy uwaga zostanie skoncentrowana na grach niekooperacyjnych. Są to

te gry o sumie zerowej, w przypadku których niedozwolone jest komunikowanie się graczy

przed grą i Ŝaden z nich nie zna wyboru strategii konkurenta przed dokonaniem własnego. W

przypadku niekooperacyjnych gier n-osobowych niedopuszczalne jest tworzenie koalicji.

Oczywiście, to samo dotyczy relacji między grami o sumie stałej a grami o sumie zmiennej.

RozwaŜania nad wyznaczaniem rozwiązań w grach niekooperacyjnych rozpocznijmy

od analizy prostej gry o nazwie „Ścisła”.

„Ścisła”

Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie

strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Jeśli jednocześnie wybiorą strategie

typu 1, osiągną parę najniŜszych z osiągalnych wygranych. Gdy zgodny wybór padnie na

strategie typu 2, udziałem graczy będą najwyŜsze dostępne im wygrane. Mieszanie typów

strategii przynosi wygrane mieszczące się wewnątrz dostępnych przedziałów, a ten z graczy,

który wybierze typ o wyŜszej numeracji wygrywa mniej niŜ gdyby było odwrotnie.

Tabela 1.13. Macierze wygranych gry „Ścisła”

Strategia

0,5

Strategia

ródło: opracowanie własne

Wyznaczenie pary strategii w tej grze nie nastręcza problemów nawet wtedy, gdy nie

miało się styczności z teorią gier. śadnemu z nich nie opłaca się grać strategii typu 1,

poniewaŜ, niezaleŜnie od wyboru konkurenta, strategia typu 2 zawsze przyniesie wyŜszą

wygraną. MoŜemy zatem wykorzystać, znane z teorii gier o sumie zerowej kryterium

dominacji. Eliminacja zdominowanych strategii typu 1 prowadzi do rozwiązania [a

] i

wygranych u

([a

])=25 i u

([a

])=30.

Spójrzmy na inny aspekt tego rozwiązania zakładając, Ŝe kryterium dominacji nie

moŜe zostać zastosowane. Gracz A nie znając wyboru strategii przez konkurenta starać się

będzie znaleźć najlepsze na nie odpowiedzi. Zarówno na b

jak i na b

najlepszą odpowiedzią

jest a

. Analogicznie gracz B wybiera strategię b

. W ten sposób wyłonić się moŜe para

strategii, która jest najlepszą odpowiedzią na siebie nawzajem. Taką parę strategii

definiujemy jako równowagę w grze. Równowaga jako wskazanie rozwiązania w grze

niekooperacyjnej została zaproponowana po raz pierwszy przez Johna Nasha. Po raz pierwszy

zdefiniował ją bez wskazywania konkretnej pary wartości uŜyteczności opierając się na

Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o

sumie róŜnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].

relacjach między strategiami [Nash, 1950b, 1951]. KaŜdy z n graczy ma do wyboru określoną

liczbę strategii M

={m

,...,m

}. Niech wygraną gracza i, przy określonym

wektorze strategii m

(kaŜdy z graczy wskazuje jedną), będzie u

([m

,...,m

]).

Określony wektor strategii m

=[m

,...,m

] nazwiemy równowagą wtedy, gdy dla

kaŜdego gracza i:

([m

,...,m

])=

max

([m

,...,m

]).

[1.36]

aden z graczy nie moŜe poprawić swojej sytuacji zmieniając swoją strategię m

jakąkolwiek inną m

, jeśli pozostali utrzymają wybory strategii, które złoŜyły się na

równowagę.

1.3.2.

Równowaga w strategiach mieszanych, twierdzenie Nasha

Nash, oprócz zdefiniowania równowagi w teorii gier, udowodnił, Ŝe kaŜda gra o sumie

róŜnej od zera ma, co najmniej jeden punkt równowagi [Nash, 1951]. Dowód cechował się

„wyjątkową elegancją” [Luce, Raiffa, 1964, s. 105] i opierał się na twierdzeniu Brouwera o

punkcie stałym. Równowaga, której istnienie dowiódł Nash moŜe opierać się zarówno na

wektorach strategii czystych jak i mieszanych. Znaczenie twierdzenia Nasha jest

porównywane do znaczenia twierdzenia minimaksowego von Neumanna. Niestety, jego

praktyczna przydatność dla wyznaczania rozwiązań gier jest mniejsza.

Powróćmy na chwilę do gier o sumie zerowej. Przywołanie definicji punktu

siodłowego pozwala na stwierdzenie, Ŝe jest on szczególnym przypadkiem równowagi dla tej

klasy gier. Idąc tym tropem Nash zaproponował równowagę jako rozwiązanie gier o sumie

róŜnej od zera. Związek z grami o sumie zerowej rozszerza się równieŜ na moŜliwość

poszukiwania rozwiązań w strategiach mieszanych. Jeśli gra nie ma równowagi w strategiach

czystych, istnieje moŜliwość wyznaczenia jej szukając optymalnych prawdopodobieństw

losowania strategii. W grach dwuosobowych o symetrycznych macierzach moŜemy posłuŜyć

się metodą przyrównania. Przyjrzyjmy się grze „Mix”

„Mix”

Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie

strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Wygrane zmieniają się zgodnie z

zapisami Tabeli 1.14.

Tabela 1.14. Macierze wygranych gry „Mix”

Strategia

ródło: opracowanie własne

Gra nie ma równowag w strategiach czystych. Znalezienie równowagi w strategiach

mieszanych polega na znalezieniu takich prawdopodobieństw losowania strategii przez gracza

A {p,1-p} i przez gracza B {q,1-q}, Ŝe Ŝaden z nich nic nie zyska na zmianie swojej strategii

na inną. Innymi słowy, jeśli obydwaj gracze zastosują swoje optymalne strategie mieszane, to

aden z nich nie moŜe zwiększyć swojej wygranej zmieniając strategię. Wyznaczone

prawdopodobieństwa muszą spełniać warunki:

EVb

(p)=pu

([a

])+(1-p)u

([a

])=EVb

(p)=pu

([a

])+(1-p)u

([a

]),

[1.37]

EVa

(q)=qu

([a

])+(1-q)u

([a

])=EVa

(q)=qu

([a

])+(1-q)u

([a

]).

[1.38]

W grze “Mix” te warunki konkretyzują się do postaci:

18p+8(1-p)=28p,

[1.39]

34q+6(1-q)=36(1-q).

[1.40]

Rozwiązaniem równań [1.43] i [1.44] są p=

i q=

. Na równowagę w strategiach

mieszanych składają się a

] i b

]. Wartości wygranych w równowadze

to u

=19

oraz u

=12

. Wybór optymalnych strategii mieszanych pozostających w

równowadze trudno uznać za satysfakcjonujący. Para strategii [a

] przynosi wyŜsze

wygrane obydwu graczom.

Niestety gry podobne do „Mix” nie są jedynymi, w przypadku których trudno wskazać

równowagę jako rozwiązanie. Dzieje się tak równieŜ w przypadku równowag w strategiach

czystych. Kanonicznym przykładem jest „K lub P”. Jest to gra naleŜąca do typu „dylemat

więźnia”

„K lub P”

Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o

sumie róŜnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].

Szerzej o genezie i eksperymentalnej weryfikacji „dylematu więźnia” napisano w rozdziale poświęconym

historii zastosowania eksperymentów w ekonomii.

Dwa przedsiębiorstwa

mają do wyboru strategię konkurencji (1) lub porozumienia

(2). Jednoczesny wybór strategii konkurencji [a

] przynosi graczom niŜsze zyski niŜ

jednoczesny wybór strategii porozumienia [[a

]. Jeśli jednak któryś z graczy zerwie

porozumienie i wybierze strategię konkurencji przy lojalnej postawie konkurenta, osiągnie

wyŜszy zysk niŜ gdyby go dochował. Jednocześnie drugi z graczy traci wygrywając mniej niŜ

przy zgodnym wyborze strategii konkurencji. Na przykład, gdy porozumienie zrywa A

([a

])>u

([a

]) i jednocześnie u

([a

])<u

([a

]).

Tabela 1.15. Macierze wygranych gry „K lub P”

Strategia

ródło: opracowanie własne

Najlepszą odpowiedzią A na dowolną strategię B jest a

. Analogiczną rolę spełnia b

Zgodnie z definicją para strategii opartych na konkurencji stanowi równowagę w tej grze

]=[a

]. Widać jednak, Ŝe jednoczesna zmiana wyboru strategii na [a

] podnosi zyski

obydwu graczy. To wskazanie, z kolei, pozostaje pod istotnym zagroŜeniem jednostronnej

zmiany strategii na a

lub b

. Analizowana gra, podobnie jak inne reprezentujące typ „dylemat

więźnia”, jest najbardziej jaskrawym przykładem trudności, na jakie napotykamy podczas

wyznaczania rozwiązania gry niekooperacyjnej o sumie zerowej. KaŜdej propozycji

towarzyszy alternatywa korzystniejsza, przynajmniej dla jednego z graczy.

Przewaga pary strategii [a

] nad [a

], wynika z tego, Ŝe ta druga nie spełnia

kryterium optymalności, które łączy racjonalność indywidualną z racjonalnością zbiorową.

Opiera się ono postulacie sformułowanym ok. 1900 roku przez włoskiego ekonomistę

Vilfredo Pareto. Zgodnie z nim „nie powinien być akceptowany system ekonomiczny, jeśli

moŜliwy jest inny, korzystniejszy dla wszystkich uczestników” [Straffin, 2001, s. 86]. Ta

definicja moŜe zostać zaadaptowana dla potrzeb teorii gier z jednoczesną zamianą ostrej

nierówności na nieostrą. Optymalny w sensie Pareto będzie kaŜdy wektor strategii n graczy

Gra jest uproszczoną wersją duopolu Cournot’a, któremu więcej miejsca poświęcono w rozdziale dotyczącym

duopolu jako gry strategicznej.

=[m

,...,m

] taki, Ŝe nie będzie moŜna znaleźć innego dostępnego

=[m

,...,m

] takiego, Ŝe dla kaŜdego gracza i:

([m

,...,m

])≤u

([m

,...,m

]),

[1.41]

i przynajmniej dla jednego:

([m

,...,m

])<u

([m

,...,m

]).

[1.42]

Kryterium optymalności w sensie Pareto moŜemy wykorzystać jako postulat, który

spełniać powinno rozwiązanie gry o sumie róŜnej od zera. Nie będziemy wówczas

przyjmować jako rozwiązań tych wektorów strategii, które nie przynoszą Pareto optymalnych

kombinacji wygranych. Spełnienie tego postulatu jest dobrze widoczne na graficznym obrazie

zbioru wyników gry, czyli obszarze wygranych. W przypadku dwuosobowych gier o sumie

róŜnej od zera jest to część przestrzeni euklidesowej składająca się z punktów opisujących

pary wygranych dla wszystkich moŜliwych par strategii (po jednej kaŜdego z graczy),

zarówno czystych jak i mieszanych.

ródło: opracowanie własne

Wykres 1.4. Obszar wygranych gry

"Ścisła"

]

Wykres 1.5. Obszar wygranych gry "K lub P"

]

Tabela 1.16. Macierze wygranych gry „Dwie równowagi”

Strategia

-2

ródło: opracowanie własne

Równowagi w tej grze to pary strategii [a

] i [a

]. Gracz A zdecydowanie

preferuje pierwszą z nich, gracz B drugą, nie są zatem ekwiwalentne i wymienne. Nawet jeśli

obydwie są optymalne w sensie Pareto, trudno przyjąć, Ŝe gracze zgodzą się na jedną z nich.

Konieczność wyboru między dwiema równowagami optymalnymi w sensie Pareto jest

naturalnym zaproszeniem do poszukiwania rozwiązania kooperacyjnego, o którym traktować

będzie następna część tego rozdział.

Wykres 1.6. Wielobok wygranych gry "Dwie

równowagi"

-4

-2

]

ródło: opracowanie własne

Bardzo istotną propozycję kryterium wyboru miedzy dwiema równowagami w ramach

gier niekooperacyjnych zgłosił John Harsanyi. Polegała ona na wykorzystaniu dwóch

kategorii: dominacji wypłat i dominacji ryzyka [Harsanyi, 1977, s. 274]. Pierwsze z nich

opiera się na wyborze tej równowagi, która przynosi wyŜszą wygraną przynajmniej jednemu z

graczy i nie niŜszą pozostałym. Racjonalność tego kryterium nie powinna budzić dyskusji,

wszak pokrywa się z kryterium optymalności Pareto.

Drugie z kryteriów Harsanyi’ego jest inspirowane koncepcją Luce’a i Raiffy

„dominacji psychologicznej”, jaka moŜe mieć miejsce w relacjach dwóch nieekwiwalentnych

i niewymiennych równowag [Luce, Raiffa, 1964, s. 108-109]. W pierwszym kroku naleŜy

sprawdzić, czy optymalna strategia mieszana moŜe zapewnić graczom wyŜsze wygrane, niŜ

gdyby wybrali strategię czystą korzystniejszą dla przeciwnika. Równowaga w strategiach

mieszanych w grze „Dwie równowagi” to para strategii a

] i b

]

przynosząca wygrane u

oraz u

=6. Taki wynik gry jest zdominowany przez obydwie

równowagi. Racjonalnie zachowujący się gracz nie wybierze równowagi w strategiach

mieszanych nawet, jeśli przyszłoby mu wybrać strategię czystą umoŜliwiającą ustalenie się

równowagi mniej korzystnej dla niego.

Następnym krokiem w wykorzystaniu kryterium dominacji ryzyka jest wyznaczenie

indeksów ryzyka towarzyszących obydwu równowagom [Harsanyi, 1977, s. 276]. Dla

kaŜdego z graczy indeks zbudowany jest tak, Ŝe w liczniku znajduje się róŜnica jego

wygranych w alternatywnych równowagach liczona tak by zawsze miała znak dodatni, a w

mianowniku róŜnica jego wygranej w preferowanej równowadze i wygranej w sytuacji, gdy

przeciwnik odpowie najmniej korzystnie na próbę forsowania tej równowagi. W grze „Dwie

równowagi” odpowiednie indeksy będą miały następującą postać:

])

([

])

([

])

([

])

([

−

[1.43]

])

([

])

([

])

([

])

([

−

[1.44]

WyŜsza wartość indeksu oznacza, Ŝe równowaga preferowana przez gracza A ([a

])

dominuje w zakresie ryzyka równowagę [a

] i ona powinna być wskazana jako unikalne

rozwiązanie w tej grze. Wskazana zostaje ta równowaga, której ewentualne odrzucenie przez

konkurenta wiąŜe się z mniejszą względną szkodą. Niestety dominacja ryzyka pozostaje

bezuŜytecznym narzędziem wyboru równowagi w strategiach czystych w szczególnym

przypadku, w którym liczniki i mianowniki indeksów ryzyka są sobie równe. Dzieje się tak w

przypadku gry „Tchórz”.

„Tchórz”

Dwa przedsiębiorstwa utworzyły konsorcjum dla realizacji pewnego kontraktu. KaŜde

z nich ma do wyboru dwie strategie. Mogą wykonać kontrakt (1) lub nie podejmować

adnych działań licząc na to, Ŝe druga strona wypełni go sama (2). Jeśli zgodnie kooperując

wykonają zlecone prace ([a

]), osiągną zyski równe 2. Jeśli Ŝadne z przedsiębiorstw nie

podejmie wykonania kontraktu ([a

]), wysokie kary umowne spowodują straty równe -8 u

obydwu. W sytuacji, gdy jeden wykona cały kontrakt a drugi osiągnie wypłatę bez ponoszenia

kosztów ([a

] lub [a

]), zyski wyniosą odpowiednio -4 i 6.

Tabela 1.17. Macierze wygranych gry „Tchórz”

Strategia

-4

Strategia

-4

-8

ródło: opracowanie własne

Gra „Tchórz” ma dwie, optymalne w sensie Pareto, równowagi w strategiach

czystych

. Przynoszą je pary strategii [a

] (korzystniejsza dla B) i [a

] (korzystniejsza dla

A). MoŜna teŜ w niej wyznaczyć równowagę w strategiach mieszanych. Jest nią para

] i b

], która przynosi wygrane u

=-1. Równowagi te nie są

ekwiwalentne ani wymienne. Nie moŜna w tej grze skorzystać z kryterium dominacji wypłat.

adna z równowag nie dominuje pozostałych.

Wykres 1.7. Wielobok wygranych gry "Tchórz"

-10

-8

-6

-4

-2

-10 -8

-6 -4

-2

[a1,b1]

[a2,b2]

[a2,b1]

[a1,b2]

ródło: opracowanie własne

Gra „Tchórz” jest modyfikacją archetypowej gry „Chicken” popularnej wśród amerykańskich nastolatków w

latach pięćdziesiątych ubiegłego stulecia. Dwa samochody  jadą naprzeciw siebie z duŜą prędkością. Kierowca,
który  pierwszy  zahamuje  „traci  twarz”  i  przegrywa.  Gracze  mają  do  wyboru  dwie  strategie,  hamować  lub  nie
hamować  [Straffin,  2001,  s. 103].  W  polskich  tłumaczeniach  ksiąŜek  dotyczących  teorii  gier,  na  ogół,
zachowana  zostaje  oryginalna  nazwa  tej  gry,  choć  zdarzają  się  jej  tłumaczenia  nie  oddające  istoty  rzeczy  (np.
„kurczak” [Leibenstein, 1988, s. 301]).

Kryterium dominacji ryzyka równieŜ nie posłuŜy wskazaniu unikalnej równowagi w

strategiach czystych. Wyznaczenie indeksów ryzyka przynosi rezultat i

. Dramatyczny

brak moŜliwości wyznaczenia rozwiązania w strategiach czystych w grze „Tchórz” moŜna

wytłumaczyć następująco: „im bardziej jesteś przekonany do wyboru stchórzenia, tym

bardziej kusząca jest strategia przeciwna” [Raiffa, Metcalfe, Richardson, 2002, s. 69]. Jedynie

równowaga w strategiach mieszanych moŜe zostać wskazana jako rozwiązanie ze względu na

dominację ryzyka. Ten wybór jest oparty na toŜsamości indeksów ryzyka równowag w

strategiach czystych.

1.3.4.

Gry o sumie róŜnej od zera z asymetrią informacji

Wyznaczenie rozwiązania w grze „Tchórz” moŜe się stać trywialne, jeśli zmienimy

zakresy informacji, jakimi dysponują gracze. W pierwotnej wersji gry Ŝaden z nich nie wie,

co wybierze przeciwnik (zbiory informacyjne zaznaczone linią kreskowaną na Schemacie

1.5). Wybory strategii są dokonywane jednocześnie. Wyobraźmy sobie jednak, Ŝe jeden z

graczy decyduje jako drugi i wie, jaką strategię wybrał rywal. ZałóŜmy, Ŝe A wybiera

strategię jako pierwszy (zbiory informacyjne zaznaczone linią kropkowaną).

Pełen zakres informacji gracza B stwarza moŜliwość przedstawienia jeszcze jednej z

metod szukania rozwiązań w grach o sumie dowolnej. Metoda ta wykorzystuje ich postać

rozwiniętą. Polega na odrzucaniu przez gracza tych gałęzi, które przynoszą mu mniejsze

wygrane. Lewy węzeł, będący jednocześnie lewym zbiorem informacyjnym, zostanie

zredukowany przez gracza B o wybór b

(6>2). W przypadku prawego węzła odrzucona

zostanie gałąź b

(-4>-8). Gracz B wybierze więc strategię: „wybierać zawsze inaczej niŜ

przeciwnik”. Jeśli gracz A zakłada, Ŝe ma do czynienia z racjonalnym przeciwnikiem łatwo

(2,2)

(-4,6)

(6,-4)

(-8,-8)

Schemat 1.4. Dendryt gry „Tchórz”

ródło: opracowanie własne

moŜe zidentyfikować jego wybór. Najlepszą odpowiedzią A na strategię gracza B „wybierać

zawsze inaczej niŜ przeciwnik” będzie wybór strategii a

(6>-4). „Taka metoda znajdowania

dobrych strategii poprzez analizę drzewka gry od końca nazywa się indukcją wsteczną”

[Malawski, Wieczorek, Sosnowska, 1997, s. 30].

Gracz A wiedząc, Ŝe przeciwnik będzie podejmował decyzję znając jego wybór,

wybierze strategię biernego oczekiwania na zrealizowanie kontraktu przez gracza B.

Dokonywanie wyboru strategii w pierwszej kolejności przynosi przewagę w grze w

„Tchórza”. Jednocześnie większy zakres informacji stawia gracza B w mniej korzystnej

sytuacji. Sprawa ma się tutaj odwrotnie niŜ w przypadku gry „A przeciw B”, w której

znajomość decyzji rywala przyniosła firmie B wzrost wygranej w punkcie siodłowym.

MoŜliwość wyboru strategii w pierwszej kolejności stworzyła sytuację, w której gracz

A swoją decyzją moŜe sformułować skuteczną groźbę. Wybierając jako pierwszy bierne

oczekiwanie na wykonanie kontraktu przez partnera, wymusza na nim reakcję obronną w

postaci wyboru strategii „wykonanie kontraktu”. O groźbach mówimy wtedy, gdy:” (i) gracz

A deklaruje, Ŝe w wypadku jakiegoś działania gracza B sam podejmie określone działanie,

które (ii) będzie niekorzystne dla B, oraz (iii) będzie niekorzystne takŜe dla niego samego”

[Straffin, 2001, s. 111]. ZałóŜmy, Ŝe w grze „Tchórz” dopuszczamy moŜliwość kontaktu

między graczami przed jednoczesnym wyborem strategii. KaŜdy z nich moŜe sformułować

wówczas groźbę: „jeśli ty zagrasz swoją strategię (2) to ja zrobię to samo”. Wystosowanie

groźby rodzi problem wiarygodności. Ze względu na warunek (iii) adresat ma prawo wątpić

w jej realizację. Gdy dokona on swojego wyboru, wykonanie groźby nie przynosi juŜ Ŝadnej

korzyści jej autorowi. Próba rozwiązania tego problemu moŜe pojawić się w powtarzanej

wersji gry, w której dla uwiarygodnienia groźby gracz moŜe pozwolić sobie na niŜsze

wygrane w kilku pierwszych turach.

Tabela 1.18. Macierz gry „Tchórz: róŜnica wygranych”

Wygrane B = u

’

-10

ródło: opracowanie własne

Optymalne strategie gróźb są najlepszą odpowiedzią na siebie nawzajem.

Wyznaczamy je jako punkt siodłowy gry powstałej w wyniku odjęcia od siebie wygranych z

wyjściowej gry o sumie róŜnej od zera:

’([a

])=u

([a

])-u

([a

] oraz u

’([a

])=u

([a

])-u

([a

])).

[1.45]

W przypadku gry „Tchórz” punktem siodłowym takiej gry jest para strategii [a

KaŜdy z graczy deklarując brak jakiegokolwiek działania na rzecz wykonania

kontraktu, formułuje groźbę, która jest najlepszą odpowiedzią na groźbę przeciwnika.

Optymalne groźby pozostają w równowadze. Pamiętać naleŜy jednak, Ŝe ich realizacja

przynosi jedyny wynik, który nie jest Pareto optymalny w zbiorze strategii czystych. Para

optymalnych strategii gróźb nie moŜe być traktowana jako propozycja rozwiązania gry o

sumie róŜnej od zera. Groźby stanowią jedynie narzędzie słuŜące osiągnięciu poŜądanego

wyniku gry. Ich przydatność widoczna jest w przypadku gier powtarzanych oraz przy

wyznaczaniu rozwiązań kooperacyjnych, o czym szerzej przeczytać będzie moŜna w

następnej części pracy.

1.3.5.

Poziomy bezpieczeństwa, wykorzystanie kryterium maksyminowego

Trudności w wyborze jednoznacznego rozwiązania gier o sumie róŜnej od zera

stwarzają pokusę wykorzystania narzędzi słuŜących wyznaczaniu optymalnego rozwiązania

gier o sumie zerowej. Ulegnięcie tej pokusie prowadzi nas do wyznaczenia optymalnych

strategii w grach o sumie róŜnej od zera zwanych strategiami bezpieczeństwa. Wartość gry

uzyskana w ten sposób to poziom bezpieczeństwa gracza. Z praktycznego punktu widzenia,

wyznaczenie poziomów bezpieczeństwa polega na znalezieniu maksyminów w grach o

wygranych kaŜdego z graczy z osobna. Macierze wygranych w grze o sumie róŜnej od zera

traktowane są jak macierze gry o sumie zerowej. Zakładamy tym samym, Ŝe wygrana

kaŜdego z graczy jest jednocześnie przegraną drugiego. Wyborowi strategii przyświeca

przekonanie, Ŝe przeciwnik jest zainteresowany w minimalizacji naszej wygranej.

Tabela 1.19. Gra "Tchórz: suma zero B"

min

∈

-4

min

max

∈

-8

-4

max

∈

-4

max

min

∈

-4

ródło: obliczenia własne

Pozostańmy przy najczęściej analizowanej ostatnio grze w „Tchórza”. Macierz gry o

sumie zerowej na wygranych gracza B ma punkt siodłowy w strategiach czystych. Jest nim

para strategii [a

]. Wartość tej gry to v=-4 i taki jest właśnie poziom bezpieczeństwa gracza

B. NiezaleŜnie od wyboru przeciwnika, wybierając strategię b

, gwarantuje on sobie, Ŝe

wygra, co najmniej -4.

Wyznaczony analogicznie poziom bezpieczeństwa gracza A wynosi równieŜ -4 i

gwarantowany jest wyborem strategii a

. Zwróćmy uwagę, Ŝe obustronny wybór strategii

bezpieczeństwa w grze „Tchórz” przynosi wynik gry, który nie jest równowagą, ale spełnia

kryterium optymalności Pareto. Wiedza o wyborze strategii bezpieczeństwa moŜe jednak

zostać wykorzystana przez przeciwnika, który ma sposobność wybrać strategię

kontrbezpieczną, czyli najlepszą na nią odpowiedź. Strategią kontrbezpieczną gracza A jest a

a gracza B b

. Wykorzystanie strategii bezpieczeństwa jako wskazania rozwiązania w grach o

sumie zerowej ma, jak widać, jedną podstawową wadę. Strategie bezpieczeństwa nie są w

równowadze i nie przynoszą rozwiązania stabilnego.

Tabela 1.20. Alternatywy dla równowag w grze „Tchórz”

Strategie A

Strategie B

bezpieczna

kontrbezpieczna

-4

kontrbezpieczna

bezpieczna

-4

kontrbezpieczna

-8

ródło: opracowanie własne na podstawie [Straffin, 2001]

Wybierając swoje strategie bezpieczeństwa, kaŜdy z graczy umoŜliwia przeciwnikowi

osiągnięcie równowagi bardziej korzystnej dla niego. Nie moŜna zatem zaryzykować tezy o

przydatności narzędzi wyznaczania rozwiązań gier o sumie zerowej dla rozwiązywania gier o

sumie róŜnej od zera.

Wszechstronne próby znalezienia rozwiązania w grze „Tchórz” przyniosły jedynie

wskazanie równowagi w strategiach mieszanych a

] i b

]. Przy

nieskończonej liczbie powtórzeń przyniesie ona wygrane u

=-1. Nie zapominajmy jednak

o sytuacji, jaka stoi za analizowaną grą. Jeśli w którymś z powtórzeń wylosowana zostanie

para strategii [a

], nie będzie juŜ kolejnego kontraktu do zrealizowania. Podobnie moŜe być

równieŜ wtedy, gdy losowanie strategii przyniesie którąkolwiek z równowag w strategiach

czystych. Konsorcjum rozpadnie się z przyczyn oczywistych.

Wskazanie równowagi jako rozwiązania gry o sumie róŜnej od zera ma dwie zalety.

Po pierwsze, jest to propozycja wyróŜniająca się tym, Ŝe pojedynczy gracz nie moŜe poprawić

swojej sytuacji wyłącznie swoimi działaniami. Po drugie, jak dowiódł Nash, w kaŜdej grze

moŜna wskazać równowagę. Niestety, gdy mamy do czynienia z liczbą nie ekwiwalentnych i

nie wymiennych równowag większą niŜ jeden, pojawia się problem wskazania tej właściwej.

Harsanyi zaproponował wykorzystanie kryteriów dominacji wypłat i dominacji ryzyka. Ich

zastosowanie umoŜliwia wskazanie unikalnej równowagi jako rozwiązania gry. Jednak w

oczekiwanych wypłat pienięŜnych, i niech wtedy liczby macierzy wypłat przedstawiają

wypłaty pienięŜne” [Luce, Raiffa, 1964, s. 98].

1.4.2.

Powtarzanie jako metoda rozwiązywania gier o sumie zerowej

Powtarzanie gry o sumie zerowej przynosi supergrę o tej samej charakterystyce.

KaŜda powtarzalna gra o sumie zerowej, tak jak jej składowa, jest ściśle konkurencyjna. Jej

rozwiązaniem będzie wybór strategii maksyminowej w kaŜdej iteracji. Gry ściśle

konkurencyjne w wersji powtarzanej nie stwarzają istotnych problemów z teoretycznego

punktu widzenia. MoŜemy nawet stwierdzić, Ŝe stworzenie fikcyjnej gry, poprzez

powtarzanie bazowej gry o sumie zerowej, moŜe przynieść nową metodę jej rozwiązywania.

„Ekspansja”

Dwa przedsiębiorstwa produkują ten sam wyrób. Przedsiębiorstwo A charakteryzuje

się mniejszym udziałem w rynku i wyŜszymi kosztami marginalnymi niŜ przedsiębiorstwo B.

Otwierają się przed nimi dwa nowe rynki. Jeśli obydwa wejdą na ten sam rynek ([a

] lub

]), słabsze przedsiębiorstwo A przegrywa zyski równe jedności na rzecz konkurenta.

Odwrotnie dzieje się wtedy, gdy wybierają róŜne rynki ([a

] lub [a

]), poniewaŜ A moŜe

wzmocnić się nie będąc atakowane przez konkurenta.

Tabela 1.21. Gra "Ekspansja"

min

∈

-1

min

max

∈

-1

max

∈

max

min

∈

ródło: obliczenia własne na podstawie [Shubik, 1995]

Gra nie ma punktu siodłowego w strategiach czystych, ale sprawdźmy, jak będzie się

zmieniać sytuacja, jeśli będzie powtarzana. ZałóŜmy, Ŝe gracze zaczynają od jednoczesnego

wyboru drugiego rynku. Przez cały czas, gracze monitorują częstość wyboru strategii przez

przeciwnika. W następnych turach wybierają odpowiednią strategię tak długo, dopóki drugi z

graczy nie zacznie częściej wybierać strategii, na którą najlepszą odpowiedzią będzie zmiana

własnej strategii. Gracz B powinien zmienić strategię juŜ w drugiej turze, poniewaŜ najlepszą

Gra jest odmianą archetypowej gry „Matching Pennies” polegającej na jednoczesnym wskazaniu jednej z

dwóch stron monety przez dwóch graczy. Jeśli wskaŜą tą samą stronę wygrywa jeden, jeśli róŜne wygrywa
drugi. Wygraną jest pokazywana moneta.

odpowiedzią na a

jest b

. Gracz A zmienia strategię na a

w turze czwartej, zaraz po tym jak

okazuje się, Ŝe gracz B zaczął częściej grać b

Tabela 1.22. Gra "Ekspansja" rozgrywana wielokrotnie

Wybór A

Częstość wyboru A

Wybór B

Częstość wyboru B

Tura

0,0000

1,0000

0,0000

1,0000

0,0000

1,0000

0,5000

0,0000

1,0000

0,6667

0,3333

0,2500

0,7500

0,2500

0,4000

0,6000

0,8000

0,2000

0,5000

0,8333

0,1667

0,5714

0,4286

0,8571

0,1429

0,6250

0,3750

0,7500

0,2500

0,6667

0,3333

0,6667

0,3333

0,7000

0,3000

0,6000

0,4000

0,7273

0,2727

0,5455

0,4545

ródło: obliczenia własne na podstawie [Shubik, 1995]

Zgodnie z tą dynamiką gra moŜe się toczyć w nieskończoność. Robinson [1951]

udowodnił, Ŝe częstości wyboru strategii zmierzają w niej do wartości optymalnych

prawdopodobieństw mieszania strategii. W grze „Ekspansja” punkt siodłowy w strategiach

mieszanych to para a

] i b

] przynosząca wartość gry v=0. JuŜ przy 250

powtórzeniach średnia wypłata gracza B wynosi 0,02. Zdaniem Robinsona, analizując grę o

sumie zerowej poprzez dokonywanie powtórzeń, moŜemy wyznaczyć optymalne strategie

mieszane graczy i jej wartość.

Wykres 1.8. Częstość wyboru strategii a

w powtarzanej grze "Ekspansja"

0,0

0,3

0,5

0,8

1,0

1,3

101

126

151

176

201

226

tury

ródło: opracowanie własne

Wykres 1.8 pokazuje jak wygasają oscylacje częstości wybierania strategii wokół

optymalnego prawdopodobieństwa jej losowania. W miarę, jak przyrasta ilość iteracji, ich

odchylenie od p=0,5 jest coraz mniejsze. Podobnie będzie wyglądać wykres dla kaŜdej z

pozostałych strategii czystych dostępnych graczom. Co prawda, wraz z gaśnięciem oscylacji

wydłuŜa się jej okres, ale nie zmienia to faktu, Ŝe częstość wyboru strategii zmierza do

optymalnego prawdopodobieństwa jej losowania.

1.4.3.

Powtarzane gry o sumie róŜnej od zera

Niestety metoda Robinsona nie znajduje zastosowania w grach o sumie róŜnej od zera.

Zbudowanie normatywnego modelu wskazującego na najlepszą strategię kaŜdego z graczy

wymaga przyjęcia szeregu załoŜeń upraszczających. Badacze chętniej zajmują się

konkretnymi przykładami gier niŜ uniwersalną teorią powtarzalnych gier o sumie niezerowej.

Najczęściej przedmiotem ich zainteresowania był „dylemat więźnia”. Zbiega się to

szczęśliwie z powinowactwem gier tego typu z modelem duopolu, którego uproszczoną

postacią była gra „K lub P”.

Zanim zajmiemy się metodami znajdowania rozwiązań w powtarzanym dylemacie

więźnia, przedstawmy ogólną postać tego typu gry w wersji jednoetapowej. KaŜdy z graczy

ma do wyboru dwie strategie: zdrada (z) lub kooperacja (k). ZałóŜmy, Ŝe macierze wygranych

obydwu graczy będą symetryczne. Nie będzie to miało wpływu na naturę wyznaczonego

rozwiązania.

Tabela 1.23. Macierze wygranych gry „Dylemat więźnia”

Strategia

ródło: opracowanie własne

Relacja pomiędzy wygranymi zawsze układać się będzie zgodnie z nierównościami

c>k>z>f oraz

≥

. Przypomnijmy, Ŝe równowaga w tej grze to para strategii [a

Jednocześnie jest to jedyny wynik gry w strategiach czystych, który nie jest optymalny w

sensie Pareto.

ZałóŜmy, Ŝe gracze znają ilość powtórzeń, jaką przyjdzie im rozegrać. Analizując grę

z perspektywy ostatniej iteracji, uznają za racjonalne wybranie w niej strategii zdrady, która

dominuje kooperację. Wybór jest oczywisty, bowiem więcej powtórzeń nie będzie. To z kolei

sprawia, Ŝe tura przedostania, ze strategicznego punktu widzenia, upodabnia się do ostatniej.

Ponownie najbardziej racjonalnym wyborem dla obydwu graczy będzie zdrada. „Szanse na

kooperacje upadają jak kostki domina – równieŜ pierwszym wynikiem musi być para strategii

zdrady” [Straffin, 2001, s. 96]. Zgodnie z tą logiką równowaga w dylemacie więźnia jest

równocześnie równowagą w jego powtarzanej określoną ilość razy wersji. Jednak

doświadczenie uczy, Ŝe gracze nie zawsze z Ŝelazną konsekwencją stosują opisany sposób

myślenia, a i w teorii znaleziono sposób na odejście od tego zdeterminowanego rozwiązania.

Polega on na załoŜeniu, Ŝe gracze nie znają ilości powtórzeń, jaka będzie ich udziałem. Nie

znają ostatniej tury, więc nie mogą rozpocząć wstecznego odliczania strategii zdrady w

kolejnych powtórzeniach.

W literaturze wymienia się cztery metody wyboru strategii w przypadku dylematu

więźnia powtarzanego nieokreśloną ilość razy [Shubik, 1970]:

•

wprowadzenie dodatniego prawdopodobieństwa zakończenia gry na kaŜdym jej etapie,

•

wprowadzenie dodatniego współczynnika dyskontującego,

•

zastąpienie gry jej skończoną wersją z funkcją wartości końcowej,

•

optymalizacja średniej wypłaty dla pojedynczej iteracji.

Pierwszy ze sposobów zakłada, Ŝe kaŜda tura, następna po pierwszej, zostanie

rozegrana z prawdopodobieństwem 0≤p≤1 [Shubik, 1970]. Gdyby kaŜdy z graczy zawsze

wybierał strategię kooperacji, jego suma wygranych wyniosłaby:

−

[1.46]

Mógłby jednak zdecydować się na zagranie zdrady w m-tej iteracji. Przeciwnik odpowie tą

samą zmianą w turze m+1 i dalej wybrane strategie pozostaną w równowadze. Suma

wygranych tego, który zdradzi pierwszy przybiera postać:

)

(

)

(

−

[1.47]

Nie będzie się opłacało zdradzić, jeśli [1.50] będzie większe od [1.51].

)

(

)

(

−

[1.48]

Przekształcając tą nierówność otrzymujemy:

−

[1.49]

Gracze powinni grać kooperacyjnie pod warunkiem, Ŝe prawdopodobieństwo rozegrania

kolejnego powtórzenia jest większe od ilorazu róŜnic wygranych z nierówności [1.49].

Warunek jest niezaleŜny od tego, w którym powtórzeniu moŜe pojawić się zdrada.

Powróćmy na chwilę do gry „K lub P”. W przypadku obydwu graczy graniczna

wartość prawdopodobieństwa wynosi p=

. Jeśli w tej grze o wystąpieniu kolejnej iteracji

decydować będzie rzut monetą, zdrada nie będzie się opłacała Ŝadnemu z graczy. Na

przykład, stałe granie kooperacji przez gracza A przynosi mu oczekiwaną wartość sumy

wygranych równą 50. Jednocześnie ta sama suma osiąga wartość 48,75 w wypadku zdrady w

czwartym powtórzeniu. Jeśli w odmiennej sytuacji, o kolejnym powtórzeniu będzie

decydować wyrzucenie szóstki przy pomocy kości do gry, to stałe wybieranie kooperacji

przez obydwu graczy przynosi oczekiwaną wartość sumy wygranych równą 30, a zdrada w

czwartej iteracji przyniesie jej wzrost do 30,0139.

Druga z przedstawionych metod jest modyfikacją pierwszej. Prawdopodobieństwo

rozegrania kolejnej iteracji zostaje zastąpione przez współczynnik dyskontujący. Gracze,

oczekując na wygrane w kolejnych turach, ponoszą koszty alternatywne związane z

odroczeniem wypłaty w czasie. Ich miarą jest stopa dyskontowa d. Jeśli pierwsza tura

rozgrywana jest dziś, a kolejne z interwałem rocznym, to wartość obecna wygranej gracza A

otrzymanej w etapie m jest warta:

)

(

)

(

−

[1.50]

Nierówność [1.52] przybiera teraz postać:

)

(

)

(

)

(

−















−













[1.51]

a nierówność [1.53]:

−

[1.52]

W grze „K lub P” górną granicą wartości stopy dyskontowej, poniŜej której nie opłaca

się zdradzać, jest d=200%. Jest to na tyle duŜa wartość, Ŝe moŜna być spokojnym o trwałość

kooperacji. Przy zdecydowanie częściej spotykanej d=10%, strategia trwałej kooperacji

przynosi graczowi A wartość oczekiwaną sumy wygranych równą 275, a zdrada w czwartym

powtórzeniu to jedynie 203,6

Graniczne prawdopodobieństwo rozegrania kolejnej tury i maksymalna stopa

dyskontowa są koncepcjami wskazującymi warunki dla opłacalności zdrady w dowolnym

powtórzeniu gry w przyszłości. Trzeba jednak pamiętać o ograniczonym zastosowaniu tych

propozycji. Opierają się one na daleko idących załoŜeniach upraszczających. Gracze

zaczynają od jednoczesnego wyboru kooperacji, a zdrada jednego z graczy przynosi mu

jednorazową korzyść i od następnego powtórzenia prowadzi do trwałego wyboru zdrady

przez obydwu. Nie trzeba specjalnie wysilać wyobraźni, by dostrzec moŜliwość pojawienia

się ponownie odmiennego scenariusza, na przykład kooperacji po paru kolejnych

obustronnych wyborach zdrady.

Trzecia z wymienionych przez Shubika metod wyboru strategii w powtarzanym

dylemacie więźnia polega na wyznaczeniu wartości końcowej. „Pozwala ona na zamianę

nieskończonego horyzontu czasowego gry moŜliwością jej zakończenia przez gracza „i” w

okresie T i uzyskania wypłaty końcowej Q

, która ma zrekompensować mu odstąpienie

uczestnictwa sukcesorowi. Q

moŜe być dowolną ogólną funkcją gry do etapu T” [Shubik,

1995, s. 289]. Technika wyznaczania wartości końcowej opiera się na takim modelowaniu

gry, Ŝe konkretną rolę spełnia w niej określona sekwencja graczy, w której kaŜdy odstępuje

od gry w zamian za opłatę końcową. Horyzont czasowy gry kolejnych graczy jest, tym

samym, skończony. „Wartość końcowa dla kaŜdego z nich moŜe być określona przez

czynniki introspektywne takie jak, altruizm lub skłonność do pozostawienia spuścizny, albo

zewnętrzne takie jak, podatki, subsydia, prawa i zwyczaje [Shubik, 1980, 1981].

Wróćmy ponownie do gry „K lub P”. ZałóŜmy, Ŝe dodatkowy bonus o wartości 25 jest

wypłacany graczowi A w wypadku jednoczesnego wyboru kooperacji w powtórzeniu T.

Graniczna wartość stopy dyskontowej d=10% występuje w tych wariantach dylematu więźnia, w których

róŜnica wygranych między zgodnymi wyborami zdrady i kooperacji jest dziesięciokrotnie mniejsza od
relatywnej korzyści ze zdrady partnera wybierającego kooperację:

Wygrane A = u

21,8

10,0

35,0

23,0

Wygrane B = u

21,8

35,0

10,0

23,0

ródło: opracowanie własne

Obustronny wybór strategii kooperacji przynosi relatywnie niewielki przyrost wygranych w stosunku do
równowagi w tej grze. Zdrada partnera gotowego do współpracy jest dalece korzystniejsza. Dodać naleŜy, Ŝe
minimalną wartością prawdopodobieństwa rozegrania kolejnej tury w tej grze gwarantującą trwałość kooperacji
jest p=10/11.