Wybrane eksperymenty z TOU
Metoda eksperymentalna służyła również jako narzędzie testowania teorii
oczekiwanej użyteczności von Neumanna i Morgensterna. Znacznie więcej eksperymentów
ujawniło zachowania stojące w sprzeczności z jej treścią
1
. Najbardziej znany jest paradoks
Allaisa polegający na sprzeczności miedzy dwoma wyborami. Poprosił on uczestników
eksperymentu by dokonali wyboru pomiędzy dwiema alternatywami, których opcje mogą
zostać opisane jako wartości oczekiwane w postaci ogólnej:
n
n
2
2
1
1
A
p
A
p
A
p
EV
+
+
+
=
L
1
p
p
p
n
2
1
=
+
+
+
L
gdzie:
p
i
– prawdopodobieństwo otrzymania kwoty A
i
.
Pierwszy wybór, miedzy opcją A (p
1
=1, A
1
=100 mln franków) i B (p
1
=0,1, B
1
=500
mln; p
2
=0,89, B
2
=100 mln; p
3
=0,01, B
3
=0), uczestnicy eksperymentu rozstrzygali w istotnej
większości na rzecz opcji A. Jednocześnie, w drugim wyborze, ci sami uczestnicy preferowali
opcję D (p
1
=0,1, D
1
=500 mln; p
2
=0,9, D
2
=0) bardziej niż C (p
1
=0,11, C
1
=100 mln; p
2
=0,89,
C
2
=0). Hipotetyczny podmiot, dla którego U(A)>U(B)
2
powinien przejawiać preferencję
odwrotną U(C)>U(D). Wyniki tego eksperymentu, opartego na hipotetycznych wyborach,
znalazły potwierdzenie w późniejszych badaniach z realnymi wypłatami, oczywiście
mniejszych kwot.
Przedmiotem eksperymentalnego testu były nie tylko aksjomaty TOU, ale również jej
aspekt deskryptywny. Wiele testów poświęcono analizie procesów dokonywania wyborów w
warunkach ryzyka. Jedno z późniejszych studiów badało przechodniość preferencji [Loomes,.
Starmer, Sugden]. Uczestnicy eksperymentu, w wielu przypadkach, bardziej preferowali
możliwość wygrania 8£ z prawdopodobieństwem 0,6 (p
a
=0,6;a=8£) niż opcję (p
b
=0,3;b=18£).
Pewność otrzymania 4£ (p
c
=1;c=4£) była dla tych samych podmiotów cenniejsza niż opcja
(p
a
=0,6;a=8£). Jednocześnie jednak, preferowali oni możliwość (p
b
=0,3;b=18£) bardziej niż
pewność wygrania 4£. Tą nieprzechodniość preferencji, autorzy tłumaczyli preferowaniem
bardziej prawdopodobnej wygranej, gdy różnice w ich wartości były relatywnie nieduże. Gdy
różnica w wygranych stała się wysoka, górę wziął wybór przynoszący wyższą wartość
oczekiwaną.
1
Przytoczone niżej wyniki eksperymentów pochodzą zarówno z prac psychologów jak i ekonomistów.
Eksperymenty częściej przynosiły wyniki sprzeczne z TOU niezależnie, czy przeprowadzali je ekonomiści, czy
psychologowie.
2
Taka preferencja charakteryzuje podmiot unikający ryzyka, wybierający mniejszą wartość oczekiwaną, jeśli
związana jest z wyższym prawdopodobieństwem osiągnięcia.
Inny
eksperyment
testował
efekt
istotności
prawdopodobieństw.
Gdy
prawdopodobieństwa wygranych są tak niewielkie, że wydają się niemożliwe, podmioty
wybierają wygraną o wyższej wartości pomijając różnice w prawdopodobieństwach. W teście
eksperymentalnym
86%
podmiotów
wybrało
opcję
(p
a
=0,9;a=3 000)
kosztem
(p
b
=0,45;b=6 000), jednocześnie ci sami gracze w 73% preferowali (p
c
=0,001;c=6 000)
zamiast (p
d
=0,002;d=3 000) [Kahneman, Tversky]. Podobne wyniki uzyskano również w
innych eksperymentach [MacCrimmon, Larsson].
1
Gra strategiczna i jej opis
1.
Definicja gry
Najpowszechniej stosowanym podejściem do definiowania gry strategicznej jest
wymienienie jej elementów składowych. Ich jednoczesne wystąpienie uprawnia do nazwania
jakiejś sytuacji grą strategiczną ([Shubik, 1995, s. 1-16], [Straffin, 2001, s. 1], [Drabik, 2005,
s. 18] oraz przede wszystkim [von Neumann, Morgenstern, 1944, s. 48-55])
1
. Zgodnie z
powszechnie uznaną definicją z grą strategiczną (Γ) mamy do czynienia zawsze wtedy, gdy:
a.
bierze w niej udział, co najmniej, dwóch graczy; zbiór graczy to N={1,2,…,n},
gdzie n jest liczbą naturalną nie mniejszą od dwóch,
b.
kaŜdy z graczy dysponuje zbiorem strategii określających jego sposób
rozgrywania gry M
i
; zbiór strategii wszystkich graczy M składa się z
elementów m
j
, w ramach których kaŜdy z graczy jest reprezentowany przez
jedną strategię; M=M
1
xM
2
x…xM
n
, m
j
=[m
1j
,m
2j,…,
m
nj
]
c.
kaŜdemu elementowi zbioru M przyporządkowany jest n-wymiarowy wektor
wypłat u(m
j
)=[u
1
(m
j
),u
2
(m
j
),…,u
n
(m
j
)]; wektor ten jest nazywany równieŜ
wynikiem gry.
Konkretyzacja tej definicji dla gry dwuosobowej będzie miała postać:
a.
bierze w niej udział dwóch graczy; zbiór graczy to N={A,B},
b.
kaŜdy z graczy dysponuje zbiorem strategii określających jego sposób
rozgrywania gry: M
a
={a
1
,a
2
,…,a
i
,…,a
m
} i M
b
={b
1
,b
2
,…,b
j
,…,b
n
}; zbiór
strategii obydwu graczy M składa się z elementów m
ij
, w których kaŜdy z
graczy jest reprezentowany przez jedną strategię; M=M
a
xM
b
, m
ij
=[a
i
,b
j
],
c.
kaŜdemu elementowi zbioru M przyporządkowany jest wynik gry w postaci
punktu dwuwymiarowej przestrzeni euklidesowej określającego wypłaty
2
graczy u(m
ij
)=(u
a
(m
ij
),u
b
(m
ij
)).
Gracze, którzy są nieodzownymi podmiotami gry muszą spełniać określoną
charakterystykę.
„KaŜdy
gracz
powinien
dysponować
zdefiniowanymi
zasobami
obejmującymi równieŜ informacje, mieć do wyboru określoną ilość sposobów postępowania,
1
Alternatywnym podejściem jest zdefiniowanie gry jako drzewa topologicznego [Owen, 1975, s. 12]. Aby
niepotrzebnie nie komplikować zagadnień, których analiza ma spełniać funkcje pomocnicze, autor postanowił
zrezygnować z tego podejścia.
2
W dalszej części wywodu, przez wypłaty graczy naleŜy rozumieć doświadczane przez nich uŜyteczności.
Prezentacja alternatywnych koncepcji uŜyteczności zysków oraz przyjęte załoŜenie w tym zakresie zostały
przedstawione w rozdziale 2.1.1. Rozdział 3.5.1. został poświęcony znaczeniu ekonomii eksperymentalnej dla
rozwoju teorii uŜyteczności.
2
ze szczególnym uwzględnieniem moŜliwości komunikowania się i porozumiewania oraz
wewnętrznie spójny system preferencji lub uŜyteczności odnoszący się do uzyskiwanych
wypłat” [Shubik, 1995, s. 16]. Wszystkie te cechy powinny być uwzględnione w obrębie
reguł gry. Nie moŜe być tak, Ŝe istotne zróŜnicowanie graczy nie zostanie objęte regułami gry.
Graczami mogą być osoby fizyczne, przedsiębiorstwa, instytucje, związki zawodowe, związki
pracodawców, państwa. Tak duŜe zróŜnicowanie jakościowe moŜe powodować problemy
metodologiczne. Jeśli na przeciw siebie staje osoba fizyczna i organizacja nieodzownym jest
przyjęcie załoŜenia, Ŝe ta druga równieŜ obdarzona jest wolną wolą i nie ma problemu z jej
jednoznacznym wyraŜeniem.
Niezwykle istotnym załoŜeniem jest racjonalność graczy, z których kaŜdy „analizuje
grę w poszukiwaniu sposobu uzyskania poŜądanego wyniku, uwzględniając fakt, Ŝe pozostali
robią to samo” [Straffin, 2001, s. 2]. Na ogół, racjonalność graczy ma postać występującą w
przypadku podejmowania decyzji w warunkach niepewności [Luce, Raiffa, 1964, s. 22].
Rzadziej jest to racjonalność związana z podejmowaniem decyzji w warunkach ryzyka.
Dzieje się tak jedynie w przypadku tzw. gier przeciwko Naturze, w których jednym z graczy
jest przyroda „dokonująca wyborów strategii” z załoŜonymi prawdopodobieństwami
[Straffin, 2001, ss. 74-81]. W grach przeciwko Naturze róŜnica między charakterem
podmiotowym graczy polega równieŜ na tym, Ŝe gracz aktywny osiąga określone wypłaty a
Natura nie [Rapoport, 1989, s. 177]. Przykładem takiej gry jest sytuacja opisana w artykule
Davenporta o rybołówstwie na Jamajce [Davenport, 1960].
Zdarza się, Ŝe w określonych wynikach gry bardziej lub mniej zainteresowany jest
tzw. „gracz statysta” (dummy player), który nie ma moŜliwości wpływania swoimi decyzjami
na nie [Shubik, 1995, s. 18]. Dobrym przykładem jest zbiorowy konsument, który w grze
rynkowej moŜe osiągnąć wyŜszą lub niŜszą kwotę nadwyŜki, w zaleŜności od wyborów
strategii dokonywanych przez przedsiębiorstwa. Rola konsumentów sprowadza się jedynie do
wpływu preferencji na krzywą popytu rynkowego, która z kolei staje się elementem reguł gry.
Strategie, jakie stoją do wyboru przed kaŜdym graczem naleŜy rozumieć jako sposoby
rozegrania gry w kompletnym zakresie, od jej rozpoczęcia aŜ do końca [Shubik, 1995, s. 34].
Gra moŜe bowiem polegać na sekwencji ruchów decyzyjnych przeplatanych niekiedy
wpływem zmiennych losowych lub na jednorazowym wyborze strategii przez graczy.
Strategie gracza mogą mieć postać czystą i występować jako jeden z elementów
zbioru M
i
(np. m
i1
lub m
in
). Strategia gracza i moŜe teŜ się pojawić w postaci mieszanej
3
,
3
O metodach wyznaczania strategii mieszanych i problemach z ich praktyczną aplikacją traktują rozdziały 1.2.2
i 1.2.3.
3
której obraz powstaje w wyniku losowania wszystkich spośród dostępnych graczowi strategii
„czystych” zgodnie z określonym rozkładem prawdopodobieństwa p
j
={p
j1
,p
j2
,...,p
jk
,...,p
jm
}
takim, Ŝe 0≤p
jk
≤
1 oraz:
∑
=
=
m
1
k
jk
1
p
,
[1.1]
gdzie m jest liczbą dostępnych strategii czystych. Dla gracza A strategia mieszana a
pj
∈
M
pa
(M
pa
to zbiór jego wszystkich strategii mieszanych), to:
a
pj
=[p
j1
a
1
,p
j2
a
2
,...,p
jk
a
k
,...,p
jm
a
m
].
[1.2]
Przy takim zdefiniowaniu strategii mieszanej kaŜda strategia czysta a
k
jest jej
szczególną postacią, w przypadku której tylko jeden składnik rozkładu prawdopodobieństwa
p
jk
jest większy od zera. Wygrana gracza A, jaką uzyska wybierając strategię mieszaną a
pj
przy jednoczesnym wyborze strategii czystej b
j
przez gracza B wyraŜa się formułą:
u
a
([a
pj
,b
j
])=p
j1
u
a
([a
1
,b
j
])+p
j2
u
a
([a
2
,b
j
])+...+p
jk
u
a
([a
k
,b
j
])+...+p
jm
u
a
([a
m
,b
j
]).
[1.3]
Konstrukcja strategii mieszanej, poŜyteczna i poprawna pod względem formalnym,
nastręcza pewnych trudności z praktycznego punktu widzenia. Dla ustalenia strategii
mieszanej a
pj
moŜemy przeprowadzić eksperyment, w którym dzielimy zbiór moŜliwych
wyników pomiędzy
m wzajemnie niezaleŜnych i wzajemnie wykluczających się zdarzeń o
rozkładzie prawdopodobieństwa p
j
[Luce, Raiffa, 1964, s. 77]. MoŜna do tego uŜyć tablic
losowych lub zaprojektować loterię, w której kolejnych
m zdarzeń wystąpi odpowiednio z
prawdopodobieństwami {p
j1
,p
j2
,...,p
jk
,...,p
jm
}. W kolejnym kroku gracz powinien dokonać
losowania. W losowaniu tym moŜe się okazać, Ŝe wskazana przezeń strategia czysta przynosi
niŜszy poziom wygranej niŜ u
a
([a
pj
,b
j
]) lub niŜszy niŜ inne strategie czyste
4
. Osiągnięcie
ś
redniej wartości wygranej równej u
a
([a
pj
,b
j
]) byłoby moŜliwe dopiero po przeprowadzeniu
nieskończonej ilości losowań w opisanej loterii. Obrońcy koncepcji strategii mieszanych
wskazują na ich dwie istotne cechy. Po pierwsze, poszukiwanie rozwiązania gry w strategiach
mieszanych odbywa się dopiero wtedy, gdy nie moŜna go znaleźć wśród strategii czystych.
Po drugie, operowanie strategiami mieszanymi nie daje przeciwnikowi Ŝadnych informacji o
tym, jakiej uŜyjemy strategii czystej [Luce, Raiffa, 1964, s. 78].
Teoria gier bada zachowania podmiotów w sytuacji konfliktu i kooperacji
[Straffin, 2001, s. 1]. Podstawowym obszarem zainteresowania są oczywiście sytuacje
konfliktu interesów [Malawski, Wieczorek, Sosnowska, 1997, s.12]. O konflikcie interesów w
4
Luce i Raiffa dają kilka bardzo ciekawych przykładów na praktyczne problemy z wykorzystaniem strategii
mieszanych [Luce, Raiffa, 1964, s. 79]
4
postaci pełnej moŜemy mówić w przypadku gier o sumie stałej
5
. Podstawową klasę
reprezentującą ten typ gier, gry o sumie zerowej moŜna zdefiniować jako te, w przypadku
których dla kaŜdego m
j
naleŜącego do M:
0
)
m
(
u
j
n
1
i
i
=
∑
=
,
[1.4]
lub w przypadku gier dwuosobowych:
u
a
(
m
ij
)+u
b
(
m
ij
)=0.
[1.5]
W przypadku gier o sumie zerowej wygrane graczy w ramach określonego wyniku gry
zawsze sumują się do zera. Związane jest to z naturalnym konfliktem interesów
wykluczającym jakiekolwiek formy kooperacji. Wygrana jednego gracza wiąŜe się
nierozerwalnie z przegraną drugiego toŜsamą, co do wartości bezwzględnej. W
dwuosobowych grach o sumie zerowej nie ma pola do kooperacji. KaŜdy z graczy pragnie
osiągnąć jak najwyŜszą wygraną uwzględniając to samo dąŜenie u przeciwnika. Jedynie w
przypadku liczby graczy większej niŜ dwa, moŜliwa jest kooperacja poprzez tworzenie
koalicji pozostającej w konflikcie interesów z graczami pozostającymi poza nią.
Alternatywa pomiędzy kooperacją a konfliktem ma równieŜ szansę pojawić się w
przypadku gier o sumie róŜnej od zera (lub nie stałej). Jeśli gracze nie mają w nich
moŜliwości porozumiewania się ani zawierania wiąŜących umów przybierają one postać gier
niekooperacyjnych [Luce, Raiffa, 1964, s. 112], jeśli pojawia się taka moŜliwość moŜna
mówić o grze kooperacyjnej.
2.
Formy prezentacji gier
Prezentacja reguł gry moŜe mieć postać opisową, która zawiera wszystkie istotne
fakty, zaleŜności i charakterystyki istotne dla jej rozegrania. WyraŜona zwartym tekstem
postać gry znajduje najczęściej zastosowanie w przypadku prostych gier, których reguły nie
wymagają skomplikowanych zapisów. Przykładem moŜe być gra rynkowa wzorowana na
grach rynkowych o zmiennym zakresie informacji [Kreps, 1990]. Nazwijmy ją „A vs B”.
Gra „A vs B”
5
Podstawową klasą tego typu gier są gry o sumie zerowej, i tak je pierwotnie nazwali von Neumann i
Morgenstern [von Neumann, Morgenstern, 1944]. Niektórzy autorzy pozostali wierni tej nazwie [Straffin, 2001],
[Drabik, 2005], [Luce, Raiffa, 1964], [Owen, 1975]. Niektórzy przyjęli szerszy znaczeniowo termin „gry o
sumie stałej” [Rapoport, 1989]. KaŜdą grę o sumie stałej moŜna przekształcić liniowo w grę o sumie zerowej
odejmując, od wygranych poszczególnych graczy, iloraz stałej sumy wygranych i liczby graczy. Takie
przekształcenie pozostaje bez wpływu na wyznaczenie równowagi w grze. Ze względu na powszechność
stosowania, autor będzie posługiwał się terminem „gra o sumie zerowej”.
5
Rynek przenośnych odtwarzaczy muzyki z internetu jest opanowany przez dwie firmy
Audioslave i Broadcast. Pierwsza specjalizuje się w odtwarzaczach popularnych, o niŜszej
cenie i gorszych parametrach jakościowych. Posiada w swojej ofercie równieŜ bardziej
zaawansowane technologicznie produkty. Firma Broadcast jest wyspecjalizowana w wysokiej
jakości sprzęcie dla wyrobionych słuchaczy. Obydwie firmy pracują nad wprowadzeniem na
rynek nowego mobilnego odtwarzacza umoŜliwiającego ściąganie plików muzycznych z
internetu. KaŜdy z konkurentów ma do wyboru produkowanie tańszego, ale gorszego
jakościowo odtwarzacza (T) lub zaawansowanego technologicznie, ale droŜszego (D).
W sytuację rynkową wpisany jest czynnik losowy. śadna z firm nie wie czy przyszły
popyt na nowy produkt będzie duŜy, czy mały. Mały popyt to sytuacja, w której udział
koneserów zainteresowanych sprzętem wysokiej jakości w całkowitym zapotrzebowaniu jest
większy. O perspektywach rynkowych wiadomo jedynie, Ŝe duŜy popyt pojawi się z
prawdopodobieństwem p
d
=0,6 i zapewni obroty w wysokości u
a
+u
b
=60 (u
a
i u
b
to
odpowiednio wygrane firm Audioslave i Broadcast toŜsame ich poziomowi przychodów).
Mały popyt moŜe przynieść graczom sumę przychodów u
a
+u
b
=30. Zmienna losowa moŜe
wskazać tylko na jeden lub na drugi z wymienionych rozmiarów rynku. Obydwie firmy
podejmują decyzję o wyborze profilu produkcyjnego jednocześnie, nie znając oczywiście
wyboru konkurenta.
Jeśli na małym rynku, obydwie firmy wybiorą strategie a
1
=T i b
1
=T, to osiągną
wygrane u
a
([a
1
,b
1
])=20 i u
b
([a
1
,b
1
])=10. W sytuacji, gdy na tym samym rynku zgodny wybór
strategii wskaŜe na produkowanie wysokiej jakości sprzętu (a
2
=D i b
2
=D), ich przychody
równieŜ będą wynosić u
a
([a
2
,b
2
])=20 i u
b
([a
2
,b
2
])=10. Wygrane firm w pozostałych
przypadkach osiągają wartości: u
a
([a
2
,b
1
])=25, u
b
([a
2
,b
1
])=5 i u
a
([a
1
,b
2
])=10, u
b
([a
1
,b
2
])=20.
Jeśli firmom przyjdzie operować na rynku o duŜym popycie, te same wybory strategii
przyniosą wyŜszą sumę wygranych do podziału. Wygrane we wszystkich moŜliwych
kombinacjach strategii wynosić będą: u
a
([a
1
,b
1
])=45 i u
b
([a
1
,b
1
])=15, u
a
([a
2
,b
2
])=36 i
u
b
([a
2
,b
2
])=24, u
a
([a
2
,b
1
])=24, u
b
([a
2
,b
1
])=36 i u
a
([a
1
,b
2
])=42, u
b
([a
1
,b
2
])=18.
Tak zapisane reguły gry podziału rynku miedzy dwóch konkurentów zawierają w
sobie wszystkie istotne informacje. Gdyby jednak przyszło nam poszukać najwłaściwszych
strategii dla obydwu graczy, nawet bez posiadania koniecznej wiedzy na ten temat, posiłkując
się wyłącznie intuicją, sama postać opisowa gry nie ułatwi nam specjalnie zadania. Ze
względu na przydatność w poszukiwaniu rozwiązań gier o róŜnych cechach jakościowych,
obowiązują trzy metody ich zapisu. Są to postać ekstensywna (rozwinięta), macierzowa oraz
postać funkcji charakterystycznej.
6
Pierwsza z nich, postać ekstensywna, to ta, której podstawowym elementem jest
drzewko lub dendryt gry [Malawski, Wieczorek, Sosnowska, 1997, s. 16]. Dendryt gry jest
układem gałęzi i wierzchołków (węzłów), pokazujących wybory graczy i wskazania zmiennej
losowej w całej partii gry. MoŜliwości, jakie stoją przed graczem w momencie dokonywania
wyboru nazywamy ruchem. Ciąg wyborów od początku gry do jej końca to partia
[Luce, Raiffa, 1964, s. 46]. Ten wierzchołek, do którego nie dochodzi Ŝadna gałąź to początek
gry a ten, od którego nie wychodzą juŜ gałęzie jest wynikiem gry [ibidem, s. 50]. Poziom
dendrytu gry zawierający jej wyniki oznacza jej koniec. Aby określona konstrukcja
topologiczna mogła być nazwana drzewkiem gry musi spełniać wyznaczone kryteria:
a)
kaŜdy wewnętrzny węzeł przypisany jest któremuś z graczy (włączając Los),
wykonującemu z niego ruch,
b)
kaŜda z gałęzi wyprowadzona w dół z danego węzła reprezentuje moŜliwy wybór
gracza,
c)
kaŜdej gałęzi odpowiadającej „wyborowi” w ramach ruchu Losu przypisane jest
prawdopodobieństwo z jakim los dokona określonych wyborów,
d)
kaŜdemu węzłowi końcowemu przypisane są wypłaty graczy,
e)
wierzchołki naleŜące do danego gracza w ramach jednego ruchu podzielone są na zbiory
informacyjne; dokonując wyboru gracz wie, w którym zbiorze informacyjnym się
znajduje ale nie wie, w którym z jego węzłów,
f)
z kaŜdego z węzłów naleŜących do tego samego zbioru informacyjnego wyprowadzana
jest taka sama liczba gałęzi, oznaczanych w taki sam sposób.
Ilustrację opisu postaci ekstensywnej gry oparto na przykładzie „A vs B”. Dendryt gry
wygląda, w tym przypadku, następująco:
7
Kolejność, w jakiej gracze zostali przedstawieni w dendrycie gry nie ma znaczenia,
gdy tak jak w opisywanej grze, Ŝaden z nich nie zna ani „wyboru” Losu ani wyboru drugiej
strony. Wyniki gry, które pojawiają się na ostatnim poziomie byłyby takie same gdybyśmy,
na przykład, zaczęli od węzła firmy Broadcast a skończyli na „wyborach” Losu. Wszystkie
wierzchołki gracza Audioslave (A) tworzą jeden zbiór informacyjny, poniewaŜ nie zna on ani
rozmiarów rynku ani decyzji konkurenta, w momencie dokonywania własnego wyboru.
Podobnie jest z graczem Broadcast (B).
Dendryt gry pokazuje wszystkie ścieŜki, jakimi moŜe potoczyć się gra. Wyniki gry na
samym dole dendrytu informują o wygranych graczy według porządku (u
a
,u
b
). W naszym
przykładzie, jeśli rynek będzie duŜy a obydwaj gracze wybiorą produkcję tańszego
odtwarzacza ([a
1
,b
1
]), ich wygrane (przychody ze sprzedaŜy) wyniosą odpowiednio u
a
=20 i
u
b
=10. Gracz A, w ramach swojego ruchu moŜe dokonać wyboru a
1
lub a
2
. Podobnie jest w
przypadku gracza B. Splot dokonanych przez graczy wyborów, poprzedzony nieznanym
„wyborem” losu, decyduje o tym, która para wygranych stanie się ich udziałem.
Prezentowany przykład dendrytu gry jest obrazem gry skończonej. Mówimy o grze
skończonej wtedy, gdy jej dendryt zawiera tylko skończoną ilość wierzchołków [Owen, 1975,
s. 15]. W grze skończonej gracz ma równieŜ skończoną liczbę strategii. Przykład gry
nieskończonej to sytuacja, w której gracze podają dowolne liczby całkowite i ten, który poda
niŜszą płaci jedną jednostkę drugiemu. Zbiór strategii czystych jest nieskończony, co czyni
taką i grę [Luce, Raiffa, 1964, s. 415].
Los
Audioslave
Broadcast
mały rynek
p
m
=0,4
duŜy rynek
p
d
=0,6
a
1
a
1
a
2
a
2
b
2
b
2
b
2
b
2
b
1
b
1
b
1
b
1
(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)
Schemat 1.1. Dendryt gry „A vs B”
Ź
ródło: opracowanie własne na podstawie [Kreps, 1990]
8
Tabela 1.1. Macierz gry dwuosobowej
u
b
a
1
a
2
...
a
i
...
a
m
b
1
u
b
([a
1
,b
1
]) u
b
([a
2
,b
1
])
...
u
b
([a
i
,b
1
])
...
u
b
([a
m
,b
1
])
b
2
u
b
([a
1
,b
2
]) u
b
([a
2
,b
2
])
...
u
b
([a
i
,b
2
])
...
u
b
([a
m
,b
2
])
...
...
...
...
...
...
...
b
j
u
b
([a
1
,b
j
]) u
b
([a
2
,b
j
])
...
u
b
([a
i
,b
j
])
...
u
b
([a
m
,b
j
])
...
...
...
...
...
...
...
b
n
u
b
([a
1
,b
n
]) u
b
([a
2
,b
n
])
...
u
b
([a
i
,b
n
])
...
u
b
([a
m
,b
n
])
u
a
a
1
a
2
...
a
i
...
a
m
b
1
u
a
([a
1
,b
1
]) u
a
([a
2
,b
1
])
...
u
a
([a
i
,b
1
])
...
u
a
([a
m
,b
1
])
b
2
u
a
([a
1
,b
2
]) u
a
([a
2
,b
2
])
...
u
a
([a
i
,b
2
])
...
u
a
([a
m
,b
2
])
...
...
...
...
...
...
...
b
j
u
a
([a
1
,b
j
]) u
a
([a
2
,b
j
])
...
u
a
([a
i
,b
j
])
...
u
a
([a
m
,b
j
])
...
...
...
...
...
...
...
b
n
u
a
([a
1
,b
n
]) u
a
([a
2
,b
n
])
...
u
a
([a
i
,b
n
])
...
u
a
([a
m
,b
n
])
Ź
ródło: opracowanie własne
Drugą podstawową formą prezentacji gry jest jej postać macierzowa. Jakkolwiek jej
przydatność ogranicza się do gier dwuosobowych
6
, bardzo ułatwia poszukiwanie rozwiązań w
tej klasie gier. Postać macierzowa gry dwuosobowej to tabela, której wiersze odpowiadają
wyborom strategii czystych jednego gracza, a kolumny wyborom strategii czystych drugiego.
Na przecięciu kaŜdej pary strategii w tabeli pomieszczone są wartości wygranych obydwu
graczy, jakie osiągają oni przy koincydencji tych właśnie wyborów. Posługując się
oznaczeniami z definicji gry dwuosobowej moŜemy zbudować jej macierz, jaką pokazuje
Tabela 1.1. Macierz wygranych została przedstawiona w postaci dwumodułowej. Jej górny
moduł zawiera wygrane gracza, którego strategie zostały wymienione w wierszach tabeli.
Dolny moduł to wygrane drugiego gracza, którego strategie to nagłówki kolumn. Takie
podejście sprawiło, Ŝe niektórzy autorzy gry dwuosobowe o sumie róŜnej od zera i nie stałej
nazywają grami dwumacierzowymi [Drabik, 2005, s. 68]. MoŜna oczywiście informacje
zawarte w Tabeli 1.1 skoncentrować w jednym module, podając w kaŜdej komórce parę
wygranych. W takim wariancie prezentacji zawsze jako pierwsza podawana jest wypłata
gracza, którego strategie wymienione są w nagłówkach wierszy. Gry dwuosobowe o sumie
zerowej zapisuje się w postaci macierzy z wygranymi jednego z graczy. Taki skrócony zapis
w pełni przekazuje zaleŜność między wyborami strategii a wygranymi obydwu uczestników
gry. Gra o sumie stałej, choć toŜsama liniowo z grą o sumie zerowej, jest często
6
O ile moŜna jeszcze sobie wyobrazić prostopadłościan, podzielony na sześcianiki odpowiadające splotom
strategii w grach trzyosobowych, to gry o ilości graczy większej od trzech nie mogłyby znaleźć czytelnej
prezentacji macierzowej. UtoŜsamienie, o którym mowa jest tak silne w literaturze tematu, Ŝe niektórzy autorzy
nazywają gry dwuosobowe grami macierzowymi [Straffin, 2001].
9
przedstawiana w postaci dwumacierzowej, by ułatwić czytelnikowi orientację w zmienności
wygranych obydwu graczy.
Gra „A vs B” zawiera w swoich regułach wpływ czynnika losowego. Gdyby gracze
znali rozmiar rynku przed podjęciem decyzji mielibyśmy do czynienia z jedną lub drugą
jednoznacznie określoną macierzą wygranych. Tak nie jest, zatem wpływ ryzyka związanego
z kształtowaniem się czynnika losowego naleŜy uwzględnić poprzez wyznaczenie wartości
oczekiwanych wygranych obydwu graczy. Uprawnia nas do tego przyjęcie załoŜenia o
liniowej uŜyteczności liczbowej. Liczymy, więc na przykład: u
a
([a
1
,b
1
])=0,4·20+0,6·45=35 a
u
b
([a
1
,b
1
])=0,4·10+0,6·15=13.
Tabela 1.2. Macierz gry „A vs B”
Audioslave
u
a
a
1
a
2
b
1
35,0
24,4
Broadcast
b
2
29,2
29,6
Audioslave
u
b
a
1
a
2
b
1
13,0
23,6
Broadcast
b
2
18,8
18,4
Ź
ródło: opracowanie własne
Gra w postaci funkcji charakterystycznej jest obrazem wykreowanym dla potrzeb gier
n-osobowych. „Oznaczmy zbiór wszystkich graczy gry n-osobowej przez N={1,2,...,n}.
KaŜdy niepusty podzbiór zbioru N (łącznie z całym N i zbiorami jednoelementowymi)
nazwiemy koalicją. Przez funkcje charakterystyczną gry n-osobowej będziemy rozumieć
funkcję rzeczywistą v określoną dla wszystkich podzbiorów zbioru N, która kaŜdemu
podzbiorowi S
⊂
N przyporządkowuje wartość maksyminową
7
(dla S) w grze dwuosobowej
rozgrywanej między S a N-S, przy załoŜeniu, Ŝe utworzyły się właśnie dwie koalicje” [Owen,
1975, s. 136]. Wartość v(S) oznacza wartość uŜyteczności, jaką mogą osiągnąć uczestnicy
koalicji bez względu na decyzje podmiotów pozostających poza nią. Twórcy koncepcji
funkcji charakterystycznej wymienili trzy cechy, które musi spełniać [von Neumann,
Morgenstern, 1944, s. 241]:
v(Ø)=0; gdzie Ø to podzbiór pusty,
[1.6]
v(-S)=-v(S),
[1.7]
7
Pojęcie maksyminu gry o sumie zerowej zostanie przedstawione w dalszej części pracy. Tutaj wystarczy
powiedzieć, Ŝe jest to wartość wygranej v przynoszona przez parę strategii, która zapewnia, Ŝe jeden z graczy
wygra, co najmniej v a drugi przegra najwyŜej v.
10
v(S
∪
T)≥v(S)+v(T); jeśli S
∩
T=Ø.
[1.8]
W następnym kroku von Neumann i Morgenstern udowodnili, Ŝe funkcja
charakterystyczna spełnia warunki [1.6-1.8] dla kaŜdej gry. Prostą ilustracją koncepcji funkcji
charakterystycznej była następująca gra [von Neumann, Morgenstern, 1944, s. 222-223].
Gra w dobór koalicjanta
KaŜdy z trzech graczy (N={1,2,3}) podaje jednocześnie, numer jednego z
pozostałych. Jeśli dwóch poda, na wzajem, swoje numery to tworzą koalicję i dzielą po
połowie jednostkę, którą daje im gracz pozostający poza koalicją.
Zapis tej gry w postaci funkcji charakterystycznej spełnia wszystkie warunki
sformułowane przez von Neumanna i Morgensterna:
v(Ø)=v(123)=0,
[1.9]
v(1)=v(2)=v(3)=-1
[1.10]
v(12)=v(23)=v(13)=1.
[1.11]
Na ogół, nie zapisuje się gier dwuosobowych w postaci funkcji charakterystycznej.
Niemniej, dla porównania wszystkich trzech prezentowanych form zapisu gier strategicznych,
gra „A vs B” zostanie przedstawiona równieŜ w postaci funkcji charakterystycznej
8
.
v(Ø)=0; v(A)=29,41; v(B)=18,59; v(AB)=48.
[1.12]
Jak widać, dla gier dwuosobowych, warunek [1.8] przybiera postać równości.
Zapisanie gry n-osobowej w postaci funkcji charakterystycznej jest moŜliwe dopiero po
rozwiązaniu szeregu gier dwuosobowych. O metodach temu słuŜących będą traktowały dwie
kolejne części pracy.
Zanim jednak do nich przejdziemy, sprawdźmy, jak na reguły gry wpływa zakres
informacji, jakim dysponują gracze. W grze „A vs B” dokonywali oni wyborów strategii nie
znając, na wzajem, swoich posunięć ani rozmiarów rynku. Sprawdźmy, co stanie się, jeśli
zmienimy nieco warunki gry „A vs B”.
Gra „A przeciw B”
Ta gra opiera się na zachowaniu wszystkich, poza jedną reguł gry „A vs B”.
Zmienioną regułą jest jednoczesność wyboru strategii. Firma Broadcast, ze względu na
mniejsze rozmiary i, co za tym idzie, większą elastyczność, podejmuje decyzję później,
znając juŜ wybór firmy Audioslave.
Opisana modyfikacja warunków zmieni rozłoŜenie zbiorów informacyjnych postaci
ekstensywnej gry. Gracz B podejmuje decyzję wiedząc, czy A wybrał a
1
czy a
2
.
8
Sposób wyznaczenia v(A) i v(B) zostanie przedstawiony w następnej części pracy.
11
W porównaniu z grą „A vs B” sytuacja gracza A nie zmieniła się. Gracz B natomiast,
zamiast jednego, ma dwa zbiory informacyjne. Jeden łączy wierzchołki połączone z gałęziami
odpowiadającymi wyborom strategii a
1
(produkować tańszy odtwarzacz T), drugi to dwa
wierzchołki, do których dochodzą gałęzie a
2
(produkować droŜszy odtwarzacz D). Wiedza
dotycząca wyboru strategii przez gracza A modyfikuje zbiór strategii gracza B. Nie jest on juŜ
prostą alternatywą b
1
lub b
2
. W obecnej postaci gry, gracz B ma do wyboru cztery strategie:
b
3
– zawsze wybierać odtwarzacz tańszy („TT;DT”),
b
4
– wybierać ten sam profil produktu co A („TT;DD”),
b
5
– zawsze wybierać przeciwnie niŜ A („TD;DT”)
b
6
– zawsze wybierać odtwarzacz droŜszy („TD;DD”).
Strategia b
3
jest toŜsama ze strategią b
1
z poprzedniej wersji gry. Podobnie jest z parą
b
6
i b
2
. Niemniej dla zaakcentowania odmienności gier „A vs B” i „A przeciw B”
wprowadzono odmienne oznaczenia. Postać macierzowa gry „A przeciw B” musi uwzględnić
wzrost ilości strategii czystych gracza B oraz inne kombinacje wygranych brane do kalkulacji
wartości oczekiwanej wypłat graczy. Na przykład, wynik gry dla kombinacji strategii [a
1
,b
5
]
będzie następujący u
a
([a
1
,b
5
])=0,4·10+0,6·42=29,2 i u
b
([a
1
,b
5
])=0,4·20+0,6·18=18,8.
Los
Audioslave
Broadcast
mały rynek
p
m
=0,4
duŜy rynek
p
d
=0,6
a
1
a
1
a
2
a
2
b
2
b
2
b
2
b
2
b
1
b
1
b
1
b
1
(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)
Schemat 1.2. Dendryt gry „A przeciw B”
Ź
ródło: opracowanie własne na podstawie [Kreps, 1990]
12
Tabela 1.3. Macierz gry „A przeciw B”
Audioslave
u
a
a
1
a
2
b
3
35,0
24,4
b
4
35,0
29,6
b
5
29,2
24,4
Broadcast
b
6
29,2
29,6
Audioslave
u
b
a
1
a
2
b
3
13,0
23,6
b
4
13,0
18,4
b
5
18,8
23,6
Broadcast
b
6
18,8
18,4
Ź
ródło: opracowanie własne
Macierze gier „A vs B” i „A przeciw B” róŜnią się ze względu na pojawienie się
nowych wierszy b
4
i b
5
. Nowa macierz podległa istotnemu rozbudowaniu. Zmiany postaci
ekstensywnej gry nie są tak ewidentne. W niej, zmianie ulega tylko zakres zbioru
informacyjnego jednego gracza. Oczywiście to nie zmienia faktu, Ŝe obydwie postacie
przedstawiają tą samą grę.
Przykład wpływu zmiany zbiorów informacyjnych w grze „A przeciw B” ilustruje
dobrze metamorfozę, jaką przechodzi obraz gry od postaci ekstensywnej do macierzowej.
Wpływ czynnika losowego, który rozgałęział dendryt gry zostaje zredukowany do udziału
prawdopodobieństw w liczeniu wartości oczekiwanych wypłat graczy. KaŜdy moŜliwy
przebieg gry, czyli partia gracza zostaje zredukowana do postaci jednej strategii czystej i
jednego ruchu. Konstrukcja strategii nie wymaga jakiejkolwiek wiedzy o decyzjach
przeciwnika. Dopiero jej wybór, połączony ze znajomością decyzji przeciwnika, w sposób
automatyczny dobiera wygrane do policzenia odpowiedniej wartości oczekiwanej. Opisana
procedura to „redukcja kaŜdej gry do prostej postaci standardowej, zwanej postacią normalną
gry” [Luce, Raiffa, 1964, s. 58]. Postać normalna, o której mowa, róŜni się od postaci
macierzowej jedynie szczegółami technicznymi dotyczącymi konstrukcji tabeli.
Idąc dalej w przemianach zakresu informacji graczy, moŜemy zbudować kolejną grę.
Zmiana zbiorów informacyjnych gracza A powinna pociągnąć za sobą zwiększenie się liczby
jego strategii czystych.
Gra „A kontra B”
13
Przyjmijmy wszystkie reguły gry „A przeciw B” zmieniając tylko jedną. Firma
Audioslave zamówiła badanie rynku i poznała jego rozmiar przed podjęciem decyzji o profilu
produktu. Firma Broadcast wie, Ŝe badania zostały przeprowadzone, ale nie zna ich wyniku.
Postać rozwinięta gry „A kontra B” zmieni się w stosunku do poprzedniej wersji
analizowanej sytuacji rynkowej w zakresie zbioru informacyjnego gracza A. Wiedza o
rozmiarach rynku sprawi podzieli się on na dwa reprezentujące odpowiednio informacje:
„rynek jest duŜy” lub „rynek jest mały”.
W porównaniu z grą „A przeciw B”, zbiór strategii gracza B nie ulegnie zmianie.
Zbiór strategii gracza A musi zostać zbudowany z uwzględnieniem zmian w zakresie
informacji. Nowe strategie budowane są przed zdobyciem wiedzy o rozmiarach rynku, ale w
swojej istocie muszą ją uwzględniać. W obecnej postaci gry, gracz A ma do wyboru cztery
strategie:
a
3
– niezaleŜnie od rozmiarów rynku wybierać odtwarzacz tańszy („mT;dT”),
a
4
– wybrać tańszy na mały rynek i droŜszy na duŜy („mT;dD”),
a
5
– wybrać droŜszy na mały rynek i tańszy na duŜy („mD;dT”),
a
6
– zawsze wybierać odtwarzacz droŜszy („mD;dD”).
Nie potrzeba głębszej analizy, aby zauwaŜyć, Ŝe najniŜsze wygrane powinna przynosić
strategia a
4
. Polega ona na wejściu z tanim odtwarzaczem na mały rynek, na którym dominują
audiofile lub z drogim odtwarzaczem na rynek duŜy, który oczekuje tzw. „sprzętu dla
Los
Audioslave
Broadcast
mały rynek
p
m
=0,4
duŜy rynek
p
d
=0,6
a
1
a
1
a
2
a
2
b
2
b
2
b
2
b
2
b
1
b
1
b
1
b
1
(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)
Schemat 1.3. Dendryt gry „A kontra B”
Ź
ródło: opracowanie własne na podstawie [Kreps, 1990]
14
kaŜdego”. NajwyŜsze wygrane powinien, zatem przynieść graczowi A wybór strategii a
5
.
Zapis macierzowy gry „A kontra B” potwierdza te przypuszczenia.
Tabela 1.4. Macierz gry "A kontra B"
Audioslave
u
a
a
3
a
4
a
5
a
6
b
3
35,0
22,4
37,0
24,4
b
4
35,0
29,6
35,0
29,6
b
5
29,2
18,4
35,2
24,4
Broadcast
b
6
29,2
25,6
33,2
29,6
Audioslave
u
b
a
3
a
4
a
5
a
6
b
3
13,0
25,6
11,0
23,6
b
4
13,0
18,4
13,0
18,4
b
5
18,8
29,6
12,8
23,6
Broadcast
b
6
18,8
22,4
14,8
18,4
Ź
ródło: opracowanie własne
Podobnie, jak w przypadku przejścia od gry „A vs B” do gry „A przeciw B” macierz
gry „A kontra B” róŜni się od poprzedniej pojawieniem się dwóch dodatkowych kolumn a
4
i
a
5
9
. Gdybyśmy z tej macierzy usunęli wszystkie komórki poza naroŜnikowymi,
otrzymalibyśmy macierz gry, od której zaczynaliśmy („A vs B”).
1.
Gry o sumie zerowej
1.1.4.
Punkt siodłowy jako rozwiązanie w strategiach czystych
Natura gier o sumie zerowej
10
przejawia się w ich ściśle konkurencyjnym charakterze
[Luce, Raiffa, 1964, s. 64]. Jest on widoczny w czystej postaci, jeśli mamy do czynienia z grą
dwuosobową. Zwiększenie ilości graczy do n>2 stwarza moŜliwość dla budowania koalicji,
co zmienia naturę sytuacji strategicznych opisywanych grami o sumie zerowej. Ścisły konflikt
interesów ustępuje miejsca wyborowi między koalicjami. Oczywiście suma wygranych
koalicji i jej dopełnienia nadal jest zerowa, ale sytuacja pojedynczego gracza jest inna niŜ w
przypadku gry dwuosobowej. Z tej przyczyny, oraz ze względu na przedmiot zainteresowania
zasadniczej części pracy uwaga zostanie skoncentrowana na grach dwuosobowych.
Ś
cisły konflikt interesów połączony z dokonywaniem wyborów w warunkach
niepewności przynosi szczególną konstrukcję sytuacji decyzyjnej. DąŜąc do maksymalnej
9
Strategia a
3
jest toŜsama z a
1
a a
6
z a
2
. Analogicznie jak w przypadku gracza B.
10
Przypomnijmy, Ŝe prawie wszystkie obserwacje dotyczące tej klasy gier moŜna rozciągnąć na szerszą
kategorię gier o sumie stałej.
15
wygranej gracz moŜe doprowadzić do bardzo niepoŜądanego wyniku. Dokonując wyborów
strategii kaŜdy z graczy musi mieć świadomość tego, Ŝe przeciwnik pośrednio ma na celu
minimalizację jego wygranej. Racjonalnym jest zatem dokonywanie takich wyborów, które
uchronią od jak najwyŜszych przegranych. Gdyby posłuŜyć się terminologią wojskową, w
grach o sumie zerowej naleŜy stosować strategie minimalizacji strat. Przyjrzyjmy się
przykładowi następującej gry.
„Walka o rynek 1”
Dwa przedsiębiorstwa walczą o udział w rynku lokalnym. KaŜde z nich ma do wyboru
trzy strategie tzw. mixu marketingowego. W zaleŜności od tego, jakie wybiorą strategie,
mogą stracić lub zyskać kosztem konkurenta określoną część rynku mierzoną w punktach
procentowych. Wyniki przyporządkowania wygranych graczy parom strategii przedstawia
Tabela 1.5.
Tabela 1.5. Macierz gry "Walka o rynek 1"
u
b
a
1
a
2
a
3
b
1
2%
1%
2%
b
2
-4%
-1%
3%
b
3
2%
-2%
-1%
Ź
ródło: opracowanie własne
Gdyby gracz B postawił sobie za cel odebranie konkurentowi największej, moŜliwej w
tej grze, części rynku (u
b
=3%), musiałby wybrać strategię b
2
. Jednak, jeśli jednocześnie gracz
A wybierze strategię a
1
, udziałem B stanie się maksymalna moŜliwa utrata części rynku, czyli
u
b
=-4%. Gdyby podobnym dąŜeniem kierował się gracz A, mogłoby się skończyć utratą 2%
rynku. Teoria gier nie daje odpowiedzi jak powinien postąpić gracz, aby osiągnąć jak
najwyŜszą wygraną w grze o sumie zerowej. MoŜe jednak wskazać sposób wyboru strategii,
który zapewni pewien minimalny poziom wygranej, lub patrząc z innego punktu widzenia,
maksymalny poziom przegranej.
JuŜ von Neumann i Morgenstern w swoim kanonicznym dziele sformułowali
postulaty, których spełnienie powinno towarzyszyć odnajdywaniu rozwiązań w grach o sumie
zerowej. Jednym z nich jest dominacja strategii. Jeśli strategia
11
a
d
przynosi, co najmniej,
takie same wygrane jak inna strategia a
z
, niezaleŜnie od wyboru pozostałych graczy, a
11
Von Neumann i Morgenstern definiując dominację posłuŜyli się terminem „imputacja” czyli n-wymiarowy
wektor wypłat wszystkich graczy spełniający kryteria indywidualnej i zbiorowej racjonalności w grach n-
osobowych. W wielu pracach powstałych później, w przypadku gier dwuosobowych, operuje się definicją
dominacji strategii [Owen, 1975, s. 31] [Straffin,2001, s. 7] i to podejście zostało przyjęte przez autora.
16
przynajmniej w jednym wypadku wyŜszą to, moŜemy powiedzieć, Ŝe a
d
dominuje a
z
, lub a
z
jest zdominowane przez a
d
[von Neumann, Morgenstern, 1944, s. 37]. W przypadku gier
dwuosobowych, opisana dominacja ma miejsce wtedy, i tylko wtedy, gdy dla kaŜdego
b
j
∈
M
b
:
])
b
,
a
([
u
]
b
,
a
([
u
j
z
a
j
d
a
≥
,
[1.13]
i istnieje co najmniej jedno b
k
∈
M
b
, Ŝe:
])
b
,
a
([
u
]
b
,
a
([
u
k
z
a
k
d
a
>
.
[1.14]
Analogicznie moglibyśmy zdefiniować dominację w obrębie zbioru strategii gracza B.
Racjonalnie zachowujący się gracz nigdy nie wybierze strategii zdominowanej
12
. Postulat
dominacji pozwala na ograniczenie zbioru strategii podczas poszukiwania rozwiązania gry.
MoŜna z niego usunąć wszystkie strategie zdominowane.
Tabela 1.6. Wyznaczanie wartości gry "Walka o rynek 1"
u
b
a
1
a
2
a
3
a
M
i
a
min
∈
b
1
2%
1%
2%
1%
b
2
-4%
-1%
3%
-4%
a
M
i
a
b
M
j
b
min
max
∈
∈
b
3
2%
-2%
-1%
-2%
1%
b
M
bj
max
∈
2%
1%
3%
b
M
j
b
a
M
i
a
max
min
∈
∈
1%
Ź
ródło: opracowanie własne
Postulowany sposób rozwiązywania gier wykorzystuje pojęcie maksyminu
13
[von
Neumann, Morgenstern, 1944, s. 89-93]. Maksyminem gry dwuosobowej o sumie zerowej
nazywamy, taką wartość v
b
, Ŝe:
])
b
,
a
([
u
min
max
v
j
i
b
a
M
i
a
b
M
j
b
b
∈
∈
=
[1.15]
Maksymin gry jest wskazaniem strategii gracza B przynoszącym najwyŜszą z najniŜszych
wygranych, jakie poszczególne strategie tego gracza mogą przynieść. Innymi słowy, dla
kaŜdej strategii gracza B odnajdujemy najniŜszą wartość, zakładając, Ŝe gracz A będzie
odpowiadał w sposób najkorzystniejszy dla siebie. Spośród wszystkich, tak wskazanych
minimów, wybieramy największe. W grze „Walka o rynek 1” maksyminem jest
12
Niektórzy autorzy dzielą dominacje na słabą, zgodną z nierównością [1.13] i ostrą, w przypadku której ta
nierówność przybiera postać ostrą [Drabik, 2005, s. 34]. Nie zmienia to praktycznego wymiaru dominacji.
Strategia zdominowana nie wejdzie w skład rozwiązania niezaleŜnie od tego, czy jest to nierówność ostra czy
nieostra.
13
Matematyczną koncepcję maksyminu przedstawił po raz pierwszy E. Borel [Borel, 1921]. Von Neumannowi
przypisuje się jej pionierskie wykorzystanie w sformułowaniu twierdzenia maksyminowego dla gier o sumie
zerowej [von Neumann, 1928].
17
v
b
=u
b
([a
2
,b
1
])=1%. Gracz B, wybierając strategię b
1
, czyli swoją strategię maksyminową,
zapewnia sobie, Ŝe wygra, co najmniej, 1% rynku.
Z punktu widzenia gracza A, interesująca jest inna postać tej samej kategorii teorii
gier. śeby zapewnić sobie minimalny poziom wygranej A musi wybierać strategię tak, aby
gracz B wybierając najkorzystniej dla siebie, osiągnął najniŜszą z najwyŜszych wygranych.
Gracz A powinien się kierować kryterium minimaksu. Minimaksem gry dwuosobowej jest
taka wartość gry v
a
, Ŝe:
])
b
,
a
([
u
max
min
v
j
i
b
b
M
j
b
a
M
i
a
a
∈
∈
=
[1.16]
W grze „Walka o rynek 1”, minimaksem gry jest v
a
=u
b
([a
2
,b
1
])=1%. Gracz A
wybierając strategię minimaksową a
2
gwarantuje sobie, Ŝe nie przegra więcej niŜ 1% rynku.
Wyznaczenie maksyminu i minimaksu gry pozwala wyznaczyć poziomy bezpieczeństwa
obydwu graczy. Strategia maksyminowa jest nazywana równieŜ strategią bezpieczeństwa
[Luce, Raiffa, 1964, s. 70]. Wybierając ją, gracz zapewnia sobie bezpieczeństwo
maksymalizacji minimalnego poziomu wygranej równego v
b
. Wygrane v
a
i v
b
nazywane są
równieŜ, odpowiednio dolną i górną wartością gry [Drabik, 2005, s. 31-32].
Łatwo udowodnić, Ŝe minimaks gry dwuosobowej o sumie zerowej jest równy, co do
bezwzględnej wartości i przeciwny, co do znaku, jej maksyminowi na wygranych drugiego
gracza [von Neumann, Morgenstern, 1944, s. 109]:
])
b
,
a
([
u
min
max
])
b
,
a
([
u
max
min
v
j
i
a
a
M
i
a
b
M
j
b
j
i
b
b
M
j
b
a
M
i
a
a
∈
∈
∈
∈
−
=
=
,
[1.17]
])
b
,
a
([
u
max
min
])
b
,
a
([
u
min
max
v
j
i
a
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
b
∈
∈
∈
∈
−
=
=
.
[1.18]
Gra „Walka o rynek 1” jest przykładem konfliktu interesów, w którym maksymin
zrównuje się z minimaksem:
v
v
])
b
,
a
([
u
max
min
])
b
,
a
([
u
min
max
v
a
j
i
b
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
b
=
=
=
=
∈
∈
∈
∈
[1.19]
Jeśli mamy do czynienia z taką sytuacją, oznacza to, Ŝe gra posiada punkt siodłowy
[von Neumann, Morgenstern, 1944, s. 95]. Jednocześnie taką grę moŜna określić jako ściśle
określoną [von Neumann, Morgenstern, 1944, s. 106]. Punkt siodłowy w grach
dwuosobowych o sumie zerowej to taka para strategii, przy której zachodzi warunek [1.19].
Wygrana „v” w punkcie siodłowym nazywana jest wartością gry. Jest ona jednocześnie równa
lub wyŜsza od pozostałych w kolumnie i niŜsza lub równa od pozostałych w wierszu
14
. Punkt
siodłowy w grach o sumie zerowej traktujemy jako rozwiązanie gry w strategiach czystych, a
14
Oczywiście mówimy o macierzy wygranych gracza, którego strategie stanowią nagłówki wierszy.
18
strategię nań się składające jako optymalne strategie czyste graczy. Niektórzy autorzy
definiują rozwiązanie dwuosobowej gry o sumie zerowej jako trzyelementowy zbiór: wartość
gry oraz optymalne strategie graczy [Straffin, 2001, s. 17].
Wróćmy na moment do gry „A przeciw B”, którą pozostawiliśmy bez rozwiązania.
Jest to gra o sumie stałej toŜsama liniowo z grą o sumie zerowej opisaną Tabelą 1.7, która ma
punkt siodłowy w strategiach [a
1
,b
5
] (Audioslave produkuje odtwarzacz tańszy a Broadcast
wybiera inaczej od konkurenta). W tym rozwiązaniu gracze dzielą się oczekiwaną wartością
rynku w sposób następujący: u
a
([a
1
,b
5
])=29,2 i u
b
([a
1
,b
5
])=18,8. Te same wygrane staną się
udziałem graczy, jeśli wybiorą strategie [a
1
,b
6
]. Nie jest to jednak punkt siodłowy,
u
b
’([a
1
,b
6
])=-5,2 nie jest wartością najniŜszą w wierszu i najwyŜszą w kolumnie. Ponadto,
jeśli przed wyznaczeniem maksyminu i minimaksu wykorzystamy kryterium dominacji to
okaŜe się, Ŝe strategia b
5
dominuje wszystkie pozostałe, co czyni wybór gracza B trywialnym.
Gracz A zna macierz wygranych, zatem pozostaje mu wybór najlepszej odpowiedzi na b
5
,
czyli a
1
.
Tabela 1.7. Wyznaczenie punktu siodłowego gry "A przeciw B"
u
b
’
a
1
a
2
a
M
i
a
min
∈
b
3
-11
-0,4
-11
b
4
-11
-5,6
-11
b
5
-5,2
-0,4
-5,2
a
M
i
a
b
M
j
b
min
max
∈
∈
b
6
-5,2
-5,6
-5,6
-5,2
b
M
bj
max
∈
-5,2
-0,4
b
M
j
b
a
M
i
a
max
min
∈
∈
-5,2
Ź
ródło: opracowanie własne
Aby dopełnić powinności wyznaczenia punktu siodłowego w grze, która była
rozwinięciem „A przeciw B” ponownie dokonano przekształcenia liniowego macierzy
wygranych z Tabeli 4. Powstała gra o sumie zerowej ma jeden punkt siodłowy w strategiach
[a
5
,b
6
]. Wartością gry jest:
2
,
9
])
b
a
([
'
u
])
b
,
a
([
'
u
max
min
])
b
,
a
([
'
u
min
max
v
6
,
5
b
j
i
b
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
−
=
=
=
=
∈
∈
∈
∈
[1.20]
Taka wartość gry oznacza podział rynku: u
a
([a
5
,b
6
])=33,2 i u
b
([a
5
,b
6
])=14,8.
Wykorzystanie kryterium dominacji prowadzi, tym razem, gracza A do
jednoznacznego wyboru strategii a
5
, która dominuje wszystkie pozostałe. Graczowi B
pozostaje wybrać b
6
, która jest jego najlepszą odpowiedzią na a
5
. Znalezione rozwiązania gier
„A przeciw B” i „A kontra B” wskazują, Ŝe graczowi A, czyli firmie Audioslave, opłaca się
19
zapłacić za badania rynku tylko wtedy, gdy ich cena nie będzie większa od czterech
(u
a
([a
5
,b
6
])-u
a
([a
1
,b
5
])=33,2-29,2=4).
Tabela 1.8. Wyznaczenie punktu siodłowego w grze "A kontra B"
u
b
a
3
a
4
a
5
a
6
a
M
i
a
min
∈
b
3
-11
1,6
-13
-0,4
-13
b
4
-11
-5,6
-11
-5,6
-11
b
5
-5,2
5,6
-11,2
-0,4
-11,2
a
M
i
a
b
M
j
b
min
max
∈
∈
b
6
-5,2
-1,6
-9,2
-5,6
-9,2
-9,2
b
M
bj
max
∈
-5,2
5,6
-9,2
-0,4
b
M
j
b
a
M
i
a
max
min
∈
∈
-9,2
Ź
ródło: opracowanie własne
Zdarza się, Ŝe w grach dwuosobowych o sumie zerowej są dwa punkty siodłowe. Taka
sytuacja oczywiście moŜe mieć miejsce, ale zawsze są to rozwiązania ekwiwalentne i
zamienne. „KaŜde dwa punkty siodłowe tej samej gry, mają tą samą wartość. Jeśli zarówno
gracz A jak i gracz B wybiorą strategie zawierające punkty siodłowe, to wynik gry zawsze
będzie punktem siodłowym” [Straffin, s. 10].
Tabela 1.9. Wyznaczanie wartości gry "Walka o rynek 2"
u
b
a
1
a
2
a
3
a
M
i
a
min
∈
b
1
3%
1%
2%
1%
b
2
-4%
-1%
4%
-4%
a
M
i
a
b
M
j
b
min
max
∈
∈
b
3
2%
1%
3%
1%
1%
b
M
bj
max
∈
3%
1%
4%
b
M
j
b
a
M
i
a
max
min
∈
∈
1%
Ź
ródło: opracowanie własne
Poszukiwanie punktu siodłowego w grze „Walka o rynek 2”
15
przyniosło podwójne
wskazanie. Niezmieniona, w porównaniu z grą „Walka o rynek 1”, wartość gry v=1% pojawia
się dla dwóch par strategii:
%
1
])
b
a
([
u
])
b
a
([
u
])
b
,
a
([
u
max
min
])
b
,
a
([
u
min
max
v
3
,
2
b
1
,
2
b
j
i
b
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
=
=
=
=
=
∈
∈
∈
∈
[1.21]
Gra „Walka o rynek 2” ma dwa punkty siodłowe. Zgodnie z twierdzeniem o ekwiwalentności
i zamienności, graczom obojętne jest, w którym z punktów siodłowych przyjdzie im się
znaleźć.
15
„Walka o rynek 2” róŜni się od pierwszej wersji tylko macierzą wypłat.
20
Oczywiście, liczba punktów siodłowych równa dwa nie jest limitem ich liczebności w
jednej grze. Wystarczy wyobrazić sobie grę, w której nieparzyste wiersze macierzy
zawierałyby wyłącznie wypłaty większe od v w nieparzystych kolumnach lub równe v w
parzystych. Parzyste wiersze zaś powinny zawierać wyłącznie wygrane niŜsze od v. Liczba
punktów siodłowych
Ψ
, jakie posiada ta gra moŜna byłoby określić wzorem:
)
(
E
)
(
E
)
n
,
m
(
2
1
n
2
m
+
=
Ψ
,
[1.22]
gdzie m to liczba strategii gracza A (kolumny) a n to ilość strategii gracza B (wiersze), E zaś
jest funkcją przyporządkowującą kaŜdej liczbie rzeczywistej jej część całkowitą.
Wystarczyłoby, Ŝeby tylko jedna z liczby strategii zmierzała do nieskończoności, a taka gra
miałaby nieskończoną ilość punktów siodłowych.
1.1.5.
Rozwiązanie w strategiach mieszanych; twierdzenie maksyminowe
W praktyce moŜemy mówić o duŜym szczęściu, jeśli uda się znaleźć, chociaŜ jeden
punkt siodłowy. Większość gier, z jakimi mamy do czynienia, nie ma Ŝadnego punktu
siodłowego, toŜsamego z rozwiązaniem w strategiach czystych. Z taką grą juŜ mieliśmy do
czynienia. Przypomnijmy sobie grę „A vs B” w postaci macierzowej (Tabela 1.2). Odejmując
od wygranych obydwu graczy 24 (połowa wartości oczekiwanej rynku), otrzymamy grę o
sumie zerowej.
Warunek [1.19] nie jest spełniony w przypadku tej gry. Von Neumann i Morgenstern
zdefiniowali takie gry jako nie ściśle określone. W ich przypadku v
b
≤
v
a
[von Neumann,
Morgenstern, 1944, s. 110]. To nie oznacza, Ŝe nie posiadają one rozwiązań. NaleŜy ich
poszukiwać innymi metodami. NiezaleŜnie od tego, jaką wybierzemy metodę, w skład
rozwiązania nie będzie juŜ wchodzić para strategii czystych. Koniecznym będzie rozszerzenie
przynajmniej jednego zbioru strategii o ich mieszaną postać.
Tabela 1.10. Gra "A vs B" przekształcona liniowo
u
b
'
a
1
a
2
a
M
i
a
min
∈
b
1
-11
-0,4
-11
a
M
i
a
b
M
j
b
min
max
∈
∈
b
2
-5,2
-5,6
-5,6
-5,6
b
M
bj
max
∈
-5,2
-0,4
b
M
j
b
a
M
i
a
max
min
∈
∈
-5,2
Ź
ródło: obliczenia własne
21
Znalezienie optymalnej strategii mieszanej, dla kaŜdego z obydwu graczy, polega na
wyznaczeniu takiej, która spełniać będzie analogiczną rolę jak czysta strategia optymalna w
grach z punktem siodłowym. Aby tego dokonać naleŜy wyznaczyć zbiór prawdopodobieństw,
który wyznaczy taką strategię mieszaną, Ŝe nie będzie moŜna znaleźć innej, gwarantującej
wyŜszy poziom wygranej niezaleŜnie od wyborów drugiego gracza.
Dowolna strategia mieszana gracza A zbudowana z m strategii czystych i rozkładu
prawdopodobieństwa p
j
={p
j1
,p
j2
,...,p
jk
,...,p
jm
} takiego, Ŝe 0≤p
jk
≤
1 oraz
∑
=
=
m
1
k
jk
1
p
, to
a
pj
=[p
j1
a
1
,p
j2
a
2
,...,p
jk
a
k
,...,p
jm
a
m
]. Analogicznie moŜemy zdefiniować postać ogólną strategii
mieszanej gracza B (b
qi
∈
M
qb
) jako b
qi
=[q
i1
b
1
,q
i2
b
2
,...,q
il
b
l
,...,q
in
b
n
] (0≤q
il
≤
1 oraz
∑
=
=
n
1
l
il
1
q
).
Spośród wszystkich strategii mieszanych a
pj
∈
M
pa
i b
qi
∈
M
qb
, optymalnymi a
po
i b
qo
będą te,
które spełnią warunki:
])
b
,
a
([
u
inf
sup
])
b
,
a
([
u
v
qi
pj
b
pa
M
pj
a
qb
M
qi
b
qo
pj
b
qb
∈
∈
=
=
,
[1.23]
])
b
,
a
([
u
sup
inf
])
b
,
a
([
u
v
qi
pj
b
qb
M
qi
b
pa
M
pj
a
qi
po
b
pa
∈
∈
=
=
,
[1.24]
gdzie:
v
qb
– dolna wartość gry w strategiach mieszanych,
v
pa
– górna wartość gry w strategiach mieszanych,
sup – kres górny zbioru wypłat generowanych przez strategie mieszane,
inf – kres dolny zbioru wypłat generowanych przez strategie mieszane
16
.
Inaczej rzecz ujmując, moŜemy stwierdzić, Ŝe wyznaczenie optymalnej strategii
mieszanej polega na znalezieniu takich prawdopodobieństw losowania strategii, by drugi z
graczy nie mógł przekroczyć pewnego maksymalnego poziomu wygranej, niezaleŜnie od
tego, jaką strategię czystą wybierze. I odwrotnie, gracz, którego wygrane opisane są macierzą
gry będzie szukał takich prawdopodobieństw, by zapewnić sobie minimalny poziom wypłaty
niezaleŜnie od wyborów przeciwnika. Optymalna strategia mieszana wyznaczona w tym
drugim przypadku musi przynieść maksymalną v
qb
spełniającą układ warunków
przedstawiony niŜej.
16
W ślad za E. Drabik zastąpiono pojęcia „max” i „min” by zaakcentować odmienność gier ściśle określonych
od gier nie ściśle określonych [Drabik, 2005, s. 36].
22
≤
≤
=
+
+
+
+
+
≥
+
+
+
+
+
≥
+
+
+
+
+
≥
+
+
+
+
+
≥
+
+
+
+
+
1
q
0
1
q
...
q
...
q
q
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
...
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
...
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
il
in
il
i2
i1
qb
n
m
b
in
l
m
b
il
2
m
b
i2
1
m
b
i1
qb
n
k
b
in
l
k
b
il
2
k
b
i2
1
k
b
i1
qb
n
2
b
in
l
2
b
il
2
2
b
i2
1
2
b
i1
qb
n
1
b
in
l
1
b
il
2
1
b
i2
1
1
b
i1
[1.25]
Dwuosobowe gry o sumie zerowej, bez punktów siodłowych, o dwuelementowych
zbiorach
strategii
czystych,
moŜemy
zawsze
rozwiązać
wykorzystując
metodę
przyrównywania [Shubik, 1995, s. 222]. Wybierając swoją optymalną strategię mieszaną,
gracz zapewnia sobie, Ŝe przeciwnik nie odniesie Ŝadnej korzyści z poznania jej [Straffin,
2001, s. 15]. Postawmy się na miejscu gracza B w grze „A vs B”. Musi on wybrać takie
prawdopodobieństwa q
1
i q
2
losowania strategii b
1
i b
2
, aby gracz A nie mógł odnieść korzyści
z wiedzy o jego wyborze strategii mieszanej. Dzieje się tak wtedy, gdy:
≤
≤
=
+
+
=
+
⇒
=
1
q
0
1
q
q
])
b
,
a
([
'
u
q
])
b
,
a
([
'
u
q
])
b
,
a
([
'
u
q
])
b
,
a
([
'
u
q
)
a
(
EV
)
a
(
EV
i
2
1
2
2
b
2
1
2
b
1
2
1
b
2
1
1
b
1
2
1
[1.26]
W analizowanej grze ten warunek daje się sprowadzić do równania:
)
q
1
(
6
,
5
q
4
,
0
)
q
1
(
2
,
5
q
11
1
1
1
1
−
−
−
=
−
−
−
,
[1.27]
którego rozwiązaniem jest
55
2
1
q
=
. Optymalną strategią mieszaną gracza B jest
b
qo
=[
55
2
b
1
,
55
53
b
2
]. Przynosi ona dolną wartość gry w strategiach mieszanych:
41
,
5
)
6
,
5
(
)
4
,
0
(
)
2
,
5
(
)
11
(
v
55
53
55
2
55
53
55
2
qb
−
=
−
+
−
=
−
+
−
=
.
[1.28]
Wybór optymalnej strategii przez gracza B oznacza podział wartości oczekiwanej
rynku, przy którym firma Audioslave osiąga przychód u
a
=29,41 a firma Broadcast u
b
=18,59.
Wybierając optymalną strategię mieszaną gracz B gwarantuje sobie, Ŝe osiągnie przychód, co
najmniej równy 18,59, niezaleŜnie od wyboru strategii przez gracza A. Porównanie
uzyskanego wyniku z rozwiązaniem gry „A przeciw B” (u
b
=18,8) pokazuje, Ŝe znajomość
decyzji konkurenta pozwala firmie Broadcast zagwarantować sobie wygraną wyŜszą o 0,21.
23
Wykres 1.1. Graficzna interpretacja metody przyrównań dla gry "A vs
B" przekształconej liniowo (v
qb
)
-12
-11
-10
-9
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
q
1
EV
EV(a
1
)
EV(a
2
)
2
/
55
v
qb
Ź
ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]
Dolna wartość gry w strategiach mieszanych niesie z sobą podobną interpretację jak
maksymin w grach ściśle określonych. Jest to dobrze widoczne na wykresie obrazującym
działanie metody przyrównywania. Gracz A, znając wybraną przez B strategię mieszaną, dla
kaŜdego q
1
≠
55
2
, mógłby tak dobierać swoją strategię czystą, aby B osiągał wygrane mniejsze
od v
qb
=-5,41. Dla q
1
>
55
2
wybierałby a
1
, a gdy q
1
<
55
2
, a
2
. Tylko wybór optymalnej strategii
mieszanej, opartej na q
1
=
55
2
gwarantuje, Ŝe wygrana B nie będzie niŜsza niŜ v
qb
=-5,41.
Analogicznie wyznaczana jest górna wartość gry w strategiach mieszanych.
Optymalna strategia mieszana gracza musi spełniać warunek:
≤
≤
=
+
+
=
+
⇒
=
1
p
0
1
p
p
])
b
,
a
([
'
u
p
])
b
,
a
([
'
u
p
])
b
,
a
([
'
u
p
])
b
,
a
([
'
u
p
)
b
(
EV
)
b
(
EV
i
2
1
2
2
b
2
2
1
b
1
1
2
b
2
1
1
b
1
2
1
[1.29]
W grze „A vs B” warunek [1.29] przybiera postać:
)
p
1
(
6
,
5
p
2
,
5
)
p
1
(
4
,
0
p
11
1
1
1
1
−
−
−
=
−
−
−
,
[1.30]
którego rozwiązaniem jest
55
26
1
p
=
. Optymalną strategią mieszaną gracza A jest
a
po
=[
55
26
a
1
,
55
29
a
2
]. Przynosi ona dolną wartość gry w strategiach mieszanych:
41
,
5
)
6
,
5
(
)
2
,
5
(
)
4
,
0
(
)
11
(
v
55
29
55
26
55
29
55
26
pa
−
=
−
+
−
=
−
+
−
=
.
[1.31]
24
Wykres 1.2. Graficzna interpretacja metody przyrównań dla gry "A vs
B" przekształconej liniowo (v
pa
)
-12
-11
-10
-9
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
p
1
EV
EV(b
1
)
EV(b
2
)
26
/
55
v
pa
Ź
ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]
Grając swoją strategię optymalną A gwarantuje sobie, Ŝe B nie wygra więcej niŜ v
pa
,
niezaleŜnie od tego czy wybierze b
1
czy b
2
.
Wyniki obliczeń przeprowadzonych dla gry „A vs B” są ilustracją twierdzenia
von Neumanna. Zgodnie z nim, w kaŜdej dwuosobowej grze o sumie zerowej z pełną
informacją, moŜna znaleźć rozwiązanie składające się z optymalnych strategii mieszanych
takich, Ŝe:
w
])
b
,
a
([
u
v
])
b
,
a
([
u
v
qi
po
b
pa
qo
pj
b
qb
=
=
=
=
,
[1.32]
gdzie w jest wartością gry w strategiach mieszanych [von Neumann, Morgenstern, 1944,
s. 123]. Jeśli rozszerzymy zbiory strategii graczy dopuszczając ich mieszanie, kaŜda gra jest
ś
ciśle określona. Autorski dowód tego twierdzenia jest dość skomplikowany i opiera się na
twierdzeniu Brouwera o punkcie stałym. Wśród późniejszych wersji prostotą wyróŜnia się
dowód Nasha [Luce, Raiffa, 1964, s. 362-364]. NiezaleŜnie od sposobu dowodzenia,
twierdzenie minimaksowe von Neumanna ma fundamentalne znaczenie dla poszukiwania
rozwiązań w grach o sumie zerowej.
Wykres pokazujący metodę przyrównania, wykorzystaną w rozwiązaniu gry
dwuosobowej o sumie zerowej i macierzy wygranych 2x2, ma wyłącznie znaczenie
25
ilustracyjne. Jeśli rozszerzymy rozmiar macierzy do nx2, okaŜe się, Ŝe graficzna ilustracja
ułatwia i przyspiesza analityczne wyznaczenie rozwiązania metodą przyrównania
17
.
Tabela 1.11. Poszukiwanie punktu siodłowego gry "Walka o rynek 3"
u
b
a
1
a
3
a
M
i
a
min
∈
b
1
3%
2%
2%
b
2
-4%
4%
-4%
a
M
i
a
b
M
j
b
min
max
∈
∈
b
3
2%
3%
2%
2%
b
M
bj
max
∈
3%
4%
b
M
j
b
a
M
i
a
max
min
∈
∈
3%
Ź
ródło: opracowanie własne
„Walka o rynek 3”
Wróćmy do gry „Walka o rynek 2” redukując ją. Okazało się, bowiem Ŝe ze względu
na wysokie koszty, gracz A na pewno nie wybierze strategii a
2
.
Nowa gra nie ma punktu siodłowego. Nie moŜna teŜ, zacząć od metody przyrównania
w postaci analitycznej ze względu na nierówną liczebność zbiorów strategii czystych obydwu
graczy. Wybór optymalnej strategii mieszanej gracza A poprzedźmy konstrukcją
odpowiedniego wykresu.
Wykres 1.3. Graficzna interpretacja metody
przyrównań dla gry "Walka o rynek 3"
-5%
-4%
-3%
-2%
-1%
0%
1%
2%
3%
4%
5%
0,0
0,2
0,4
0,6
0,8
1,0
p
1
EV
EV(b
2
)
EV(b
1
)
EV(b
3
)
Ź
ródło: opracowanie własne
17
Williams idzie dalej w uznaniu znaczenia interpretacji graficznej twierdząc, Ŝe istnieje autonomiczna metoda
graficzna rozwiązywania gier o macierzach wygranych 2xm [Williams, 1965, s. 88].
26
Właściwy wykres, dla ułatwienia odczytu szukanych wartości naleŜy uzupełnić tabelą,
która pokazuje jak zmieniają się wartości oczekiwane wygranych gracza B w zaleŜności od
prawdopodobieństwa p
1
wyboru strategii a
1
przez gracza A.
Tabela 1.12. Wyznaczanie wartości gry "Walka o rynek 3" metodą przyrównania
p
1
0,0000
0,1429
0,2222
0,5000
1,0000
EV(b
1
)
2,000%
2,143%
2,222%
2,500%
3,000%
EV(b
2
)
4,000%
2,857%
2,222%
0,000%
-4,000%
EV(b
3
)
3,000%
2,857%
2,778%
2,500%
2,000%
Ź
ródło: opracowanie własne
Gracz A wie, Ŝe konkurent będzie dąŜył do osiągnięcia jak najwyŜszej wygranej przy
danym wyborze prawdopodobieństwa p
1
. Jeśli 0≤p
1
≤
0,1429, B wybierze strategię b
2
, gdy
0,1429≤p
1
≤
0,5 najwyŜszą wygraną przyniesie strategia b
3
i ostatecznie dla 0,5≤p
1
≤
1
najlepszym wyborem B będzie strategia b
1
(zob. Wykres 1.3). Graczowi A pozostaje wybór
takiego prawdopodobieństwa p
1
, by „osadzić” B w najniŜszym punkcie, najkorzystniejszej dla
niego, łamanej. Zarówno z wykresu jak i z Tabeli 1.12 wynika, Ŝe najkorzystniej dla A będzie
wybrać p
1
=0,5, gwarantując sobie tym, Ŝe B nie wygra więcej niŜ v
pa
=2,5%.
W takiej sytuacji B, z pewnością nie wybierze b
2
. Aby wyznaczyć jego optymalną
strategię mieszaną, naleŜy posłuŜyć się loterią strategii b
1
i b
3
. Musi ona zapewnić spełnienie
warunku [1.26], który w przypadku gry „Walka o rynek 3” daje się sprowadzić do postaci:
)
q
1
%(
3
q
%
2
)
q
1
%(
2
q
%
3
1
1
1
1
−
+
=
−
+
.
[1.33]
Rozwiązaniem tego równania jest q
1
=0,5. Dolna wartość gry w strategiach mieszanych
wynosi v
qb
=2,5%. MoŜemy juŜ wskazać rozwiązanie gry „Walka o rynek 3”. Składają się na
nie:
a)
optymalna strategia gracza A: a
po
=[
2
1
a
1
,
2
1
a
3
],
b)
optymalna strategia gracza B: b
qo
=[
2
1
b
1
,0b
2
,
2
1
b
3
],
c)
wartość gry v
pa
=v
qb
=w=2,5%.
Porównanie rozwiązań gier „Walka o rynek 2” i „Walka o rynek 3” wskazuje, Ŝe
usunięcie strategii a
2
, jakkolwiek konieczne ze względu na wysokie koszty, było niekorzystne
dla gracza A. Wartość gry wzrosła z v=1% do w=2,5%. MoŜna się tego było spodziewać,
wszak usunęliśmy strategię, która dominowała a
3
we wcześniejszej wersji gry. Jeśli zatem,
dodatkowe koszty związane z podjęciem realizacji strategii a
2
są niŜsze od wartości, jaką
moŜe przynieść utrzymanie 1,5% rynku, gracz A powinien pozostać przy „Walce o rynek 2”.
WyróŜnienie gier o sumie zerowej zawdzięczać naleŜy ich jednoznacznej naturze. W
grach tego typu konflikt interesów występuje w czystej postaci. „Główną ideą
27
niekooperacyjnego podejścia jest, jednym słowem, ‘egoizm’, nie mizantropijny lub
windykacyjny, ale polegający na obojętności wobec dąŜeń innych. Gra n-osobowa rozpada się
na n problemów jednoosobowych rozwiązywanych jednocześnie” [Shubik, 1995, s. 217].
Jednoznaczności związanej z nieodłącznym brakiem aspektu kooperacyjnego
towarzyszy jednoznaczność towarzysząca rozwiązywaniu gier o sumie zerowej. Twierdzenie
minimaksowe von Neumanna niesie z sobą przesłanie pozwalające nam przystępować do ich
rozwiązywania z przekonaniem o ostatecznym sukcesie. „Z powodu swojego determinizmu
skończone gry o sumie zerowej mogą być uznane za ‘kompletne’, w sensie moŜliwości
wyznaczenia optymalnych strategii. Prawdopodobnie z tych względów, teoria gier
przyciągnęła Ŝywe zainteresowanie, szczególnie w kręgach, w których problem wyznaczania
optymalnych decyzji w warunkach konfliktu lub konkurencji jest uznany za naczelny”
[Rapoport, 1989, s. 195]. Nawet, jeśli poziom rozbudowania bazy teoretycznej gier o sumie
zerowej moŜna uznać za umiarkowany w porównaniu z ogólną teorią gier, trudno wyobrazić
sobie dzisiejszy obraz tej ostatniej bez podstaw, jakie zbudowali von Neumann i Morgenstern.
15
1.3.
Niekooperacyjne gry o sumie róŜnej od zera
1.3.1.
Równowaga w strategiach czystych
Naturalnym dopełnieniem zbioru gier o sumie zerowej są gry o sumie róŜnej od zera
1
.
Jednocześnie moŜna powiedzieć, Ŝe zarówno gry o sumie zerowej jak i gry o sumie róŜnej od
zera są rozłącznymi podzbiorami gier o sumie dowolnej. Gry n-osobowe o sumie róŜnej od
zera to te, w przypadku których istnieje przynajmniej jedno m
j
naleŜące do M takie, Ŝe:
0
)
m
(
u
n
1
i
j
i
≠
∑
=
,
[1.34]
lub w przypadku gier dwuosobowych, istnieje przynajmniej jedno m
ij
naleŜącego do M, takie,
Ŝ
e:
u
a
(m
ij
)+u
b
(m
ij
)≠0.
[1.35]
W przypadku gier o sumie róŜnej od zera wygrane graczy w ramach określonego
zbioru wyników gry, przynajmniej w jednym przypadku, nie sumują się do zera. Powoduje to
niejednoznaczność sytuacji strategicznej. MoŜe być tak, Ŝe zmiana wskazania strategii, przez
co najmniej jednego gracza zwiększy wygrane wszystkich uczestników gry, albo tak, Ŝe
wygrane części graczy zwiększają się, części zmniejszają a pozostałych nie zmieniają się.
Brak powszechności konfliktu interesów moŜe w skrajnej sytuacji przybrać postać ich
pełnej zbieŜności. W takiej sytuacji, kaŜda zmiana strategii prowadzi do zmian wygranych
graczy o tym samym znaku. Z punktu widzenia teorii gier takie sytuacje są trywialne.
Ewentualność wystąpienia sytuacji, w której wszyscy gracze będą zainteresowani w
określonej zmianie strategii zdecydowanie wyróŜnia gry o sumie róŜnej od zera. Istnieje
waŜna klasa dwuosobowych gier o sumie róŜnej od zera zwana grami kooperacyjnymi. Ich
rozwiązanie polega na wyznaczeniu par strategii, co do przyjęcia których gracze podejmują
wiąŜące zobowiązanie i przynoszących obydwu wyŜsze wygrane niŜ przy niekooperacyjnym
wyborze strategii. Ich szczególne znaczenie sprawia, Ŝe wyznaczaniu rozwiązań
kooperacyjnych poświęcono odrębną część pracy.
W tej części pracy uwaga zostanie skoncentrowana na grach niekooperacyjnych. Są to
te gry o sumie zerowej, w przypadku których niedozwolone jest komunikowanie się graczy
przed grą i Ŝaden z nich nie zna wyboru strategii konkurenta przed dokonaniem własnego. W
przypadku niekooperacyjnych gier n-osobowych niedopuszczalne jest tworzenie koalicji.
1
Oczywiście, to samo dotyczy relacji między grami o sumie stałej a grami o sumie zmiennej.
16
RozwaŜania nad wyznaczaniem rozwiązań w grach niekooperacyjnych rozpocznijmy
od analizy prostej gry o nazwie „Ścisła”.
„Ścisła”
Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie
strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Jeśli jednocześnie wybiorą strategie
typu 1, osiągną parę najniŜszych z osiągalnych wygranych. Gdy zgodny wybór padnie na
strategie typu 2, udziałem graczy będą najwyŜsze dostępne im wygrane. Mieszanie typów
strategii przynosi wygrane mieszczące się wewnątrz dostępnych przedziałów, a ten z graczy,
który wybierze typ o wyŜszej numeracji wygrywa mniej niŜ gdyby było odwrotnie.
Tabela 1.13. Macierze wygranych gry „Ścisła”
2
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
5
5
8
0,5
Strategia
b
2
20
12
15
30
ź
ródło: opracowanie własne
Wyznaczenie pary strategii w tej grze nie nastręcza problemów nawet wtedy, gdy nie
miało się styczności z teorią gier. śadnemu z nich nie opłaca się grać strategii typu 1,
poniewaŜ, niezaleŜnie od wyboru konkurenta, strategia typu 2 zawsze przyniesie wyŜszą
wygraną. MoŜemy zatem wykorzystać, znane z teorii gier o sumie zerowej kryterium
dominacji. Eliminacja zdominowanych strategii typu 1 prowadzi do rozwiązania [a
2
,b
2
] i
wygranych u
a
([a
2
,b
2
])=25 i u
b
([a
2
,b
2
])=30.
Spójrzmy na inny aspekt tego rozwiązania zakładając, Ŝe kryterium dominacji nie
moŜe zostać zastosowane. Gracz A nie znając wyboru strategii przez konkurenta starać się
będzie znaleźć najlepsze na nie odpowiedzi. Zarówno na b
1
jak i na b
2
najlepszą odpowiedzią
jest a
2
. Analogicznie gracz B wybiera strategię b
2
. W ten sposób wyłonić się moŜe para
strategii, która jest najlepszą odpowiedzią na siebie nawzajem. Taką parę strategii
definiujemy jako równowagę w grze. Równowaga jako wskazanie rozwiązania w grze
niekooperacyjnej została zaproponowana po raz pierwszy przez Johna Nasha. Po raz pierwszy
zdefiniował ją bez wskazywania konkretnej pary wartości uŜyteczności opierając się na
2
Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o
sumie róŜnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].
17
relacjach między strategiami [Nash, 1950b, 1951]. KaŜdy z n graczy ma do wyboru określoną
liczbę strategii M
i
={m
i1
,m
i2
,...,m
ij
,...,m
im
}. Niech wygraną gracza i, przy określonym
wektorze strategii m
k
(kaŜdy z graczy wskazuje jedną), będzie u
i
([m
1k
,m
2k
,...,m
ik
,...,m
nk
]).
Określony wektor strategii m
r
=[m
1r
,m
2r
,...,m
ir
,...,m
nr
] nazwiemy równowagą wtedy, gdy dla
kaŜdego gracza i:
u
i
([m
1r
,m
2r
,...,m
ir
,...,m
nr
])=
ij
m
max
u
i
([m
1r
,m
2r
,...,m
ij
,...,m
nr
]).
[1.36]
ś
aden z graczy nie moŜe poprawić swojej sytuacji zmieniając swoją strategię m
ir
na
jakąkolwiek inną m
ij
, jeśli pozostali utrzymają wybory strategii, które złoŜyły się na
równowagę.
1.3.2.
Równowaga w strategiach mieszanych, twierdzenie Nasha
Nash, oprócz zdefiniowania równowagi w teorii gier, udowodnił, Ŝe kaŜda gra o sumie
róŜnej od zera ma, co najmniej jeden punkt równowagi [Nash, 1951]. Dowód cechował się
„wyjątkową elegancją” [Luce, Raiffa, 1964, s. 105] i opierał się na twierdzeniu Brouwera o
punkcie stałym. Równowaga, której istnienie dowiódł Nash moŜe opierać się zarówno na
wektorach strategii czystych jak i mieszanych. Znaczenie twierdzenia Nasha jest
porównywane do znaczenia twierdzenia minimaksowego von Neumanna. Niestety, jego
praktyczna przydatność dla wyznaczania rozwiązań gier jest mniejsza.
Powróćmy na chwilę do gier o sumie zerowej. Przywołanie definicji punktu
siodłowego pozwala na stwierdzenie, Ŝe jest on szczególnym przypadkiem równowagi dla tej
klasy gier. Idąc tym tropem Nash zaproponował równowagę jako rozwiązanie gier o sumie
róŜnej od zera. Związek z grami o sumie zerowej rozszerza się równieŜ na moŜliwość
poszukiwania rozwiązań w strategiach mieszanych. Jeśli gra nie ma równowagi w strategiach
czystych, istnieje moŜliwość wyznaczenia jej szukając optymalnych prawdopodobieństw
losowania strategii. W grach dwuosobowych o symetrycznych macierzach moŜemy posłuŜyć
się metodą przyrównania. Przyjrzyjmy się grze „Mix”
„Mix”
Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie
strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Wygrane zmieniają się zgodnie z
zapisami Tabeli 1.14.
18
Tabela 1.14. Macierze wygranych gry „Mix”
3
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
34
18
0
8
Strategia
b
2
6
28
36
0
ź
ródło: opracowanie własne
Gra nie ma równowag w strategiach czystych. Znalezienie równowagi w strategiach
mieszanych polega na znalezieniu takich prawdopodobieństw losowania strategii przez gracza
A {p,1-p} i przez gracza B {q,1-q}, Ŝe Ŝaden z nich nic nie zyska na zmianie swojej strategii
na inną. Innymi słowy, jeśli obydwaj gracze zastosują swoje optymalne strategie mieszane, to
Ŝ
aden z nich nie moŜe zwiększyć swojej wygranej zmieniając strategię. Wyznaczone
prawdopodobieństwa muszą spełniać warunki:
EVb
1
(p)=pu
b
([a
1
,b
1
])+(1-p)u
b
([a
2
,b
1
])=EVb
2
(p)=pu
b
([a
1
,b
2
])+(1-p)u
b
([a
2
,b
2
]),
[1.37]
EVa
1
(q)=qu
a
([a
1
,b
1
])+(1-q)u
a
([a
1
,b
2
])=EVa
2
(q)=qu
a
([a
2
,b
1
])+(1-q)u
a
([a
2
,b
2
]).
[1.38]
W grze “Mix” te warunki konkretyzują się do postaci:
18p+8(1-p)=28p,
[1.39]
34q+6(1-q)=36(1-q).
[1.40]
Rozwiązaniem równań [1.43] i [1.44] są p=
9
4
i q=
32
15
. Na równowagę w strategiach
mieszanych składają się a
r
=[
9
4
a
1
,
9
5
a
2
] i b
r
=[
32
15
b
1
,
32
17
b
2
]. Wartości wygranych w równowadze
to u
ar
=19
8
1
oraz u
br
=12
9
4
. Wybór optymalnych strategii mieszanych pozostających w
równowadze trudno uznać za satysfakcjonujący. Para strategii [a
1
,b
1
] przynosi wyŜsze
wygrane obydwu graczom.
Niestety gry podobne do „Mix” nie są jedynymi, w przypadku których trudno wskazać
równowagę jako rozwiązanie. Dzieje się tak równieŜ w przypadku równowag w strategiach
czystych. Kanonicznym przykładem jest „K lub P”. Jest to gra naleŜąca do typu „dylemat
więźnia”
4
.
„K lub P”
3
Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o
sumie róŜnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].
4
Szerzej o genezie i eksperymentalnej weryfikacji „dylematu więźnia” napisano w rozdziale poświęconym
historii zastosowania eksperymentów w ekonomii.
19
Dwa przedsiębiorstwa
5
mają do wyboru strategię konkurencji (1) lub porozumienia
(2). Jednoczesny wybór strategii konkurencji [a
1
,b
1
] przynosi graczom niŜsze zyski niŜ
jednoczesny wybór strategii porozumienia [[a
1
,b
1
]. Jeśli jednak któryś z graczy zerwie
porozumienie i wybierze strategię konkurencji przy lojalnej postawie konkurenta, osiągnie
wyŜszy zysk niŜ gdyby go dochował. Jednocześnie drugi z graczy traci wygrywając mniej niŜ
przy zgodnym wyborze strategii konkurencji. Na przykład, gdy porozumienie zrywa A
u
a
([a
1
,b
2
])>u
a
([a
2
,b
2
]) i jednocześnie u
b
([a
1
,b
2
])<u
b
([a
1
,b
1
]).
Tabela 1.15. Macierze wygranych gry „K lub P”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
15
20
8
35
Strategia
b
2
30
12
25
30
ź
ródło: opracowanie własne
Najlepszą odpowiedzią A na dowolną strategię B jest a
1
. Analogiczną rolę spełnia b
1
.
Zgodnie z definicją para strategii opartych na konkurencji stanowi równowagę w tej grze
[a
r
,b
r
]=[a
1
,b
1
]. Widać jednak, Ŝe jednoczesna zmiana wyboru strategii na [a
2
,b
2
] podnosi zyski
obydwu graczy. To wskazanie, z kolei, pozostaje pod istotnym zagroŜeniem jednostronnej
zmiany strategii na a
1
lub b
1
. Analizowana gra, podobnie jak inne reprezentujące typ „dylemat
więźnia”, jest najbardziej jaskrawym przykładem trudności, na jakie napotykamy podczas
wyznaczania rozwiązania gry niekooperacyjnej o sumie zerowej. KaŜdej propozycji
towarzyszy alternatywa korzystniejsza, przynajmniej dla jednego z graczy.
Przewaga pary strategii [a
2
,b
2
] nad [a
1
,b
1
], wynika z tego, Ŝe ta druga nie spełnia
kryterium optymalności, które łączy racjonalność indywidualną z racjonalnością zbiorową.
Opiera się ono postulacie sformułowanym ok. 1900 roku przez włoskiego ekonomistę
Vilfredo Pareto. Zgodnie z nim „nie powinien być akceptowany system ekonomiczny, jeśli
moŜliwy jest inny, korzystniejszy dla wszystkich uczestników” [Straffin, 2001, s. 86]. Ta
definicja moŜe zostać zaadaptowana dla potrzeb teorii gier z jednoczesną zamianą ostrej
nierówności na nieostrą. Optymalny w sensie Pareto będzie kaŜdy wektor strategii n graczy
5
Gra jest uproszczoną wersją duopolu Cournot’a, któremu więcej miejsca poświęcono w rozdziale dotyczącym
duopolu jako gry strategicznej.
20
m
p
=[m
1p
,m
2p
,...,m
ip
,...,m
nr
] taki, Ŝe nie będzie moŜna znaleźć innego dostępnego
m
k
=[m
1k
,m
2k
,...,m
ik
,...,m
nk
] takiego, Ŝe dla kaŜdego gracza i:
u
i
([m
1p
,m
2p
,...,m
ip
,...,m
np
])≤u
i
([m
1k
,m
2k
,...,m
ik
,...,m
nk
]),
[1.41]
i przynajmniej dla jednego:
u
i
([m
1p
,m
2p
,...,m
ip
,...,m
np
])<u
i
([m
1k
,m
2k
,...,m
ik
,...,m
nk
]).
[1.42]
Kryterium optymalności w sensie Pareto moŜemy wykorzystać jako postulat, który
spełniać powinno rozwiązanie gry o sumie róŜnej od zera. Nie będziemy wówczas
przyjmować jako rozwiązań tych wektorów strategii, które nie przynoszą Pareto optymalnych
kombinacji wygranych. Spełnienie tego postulatu jest dobrze widoczne na graficznym obrazie
zbioru wyników gry, czyli obszarze wygranych. W przypadku dwuosobowych gier o sumie
róŜnej od zera jest to część przestrzeni euklidesowej składająca się z punktów opisujących
pary wygranych dla wszystkich moŜliwych par strategii (po jednej kaŜdego z graczy),
zarówno czystych jak i mieszanych.
Ź
ródło: opracowanie własne
Ź
ródło: opracowanie własne
Wykres 1.4. Obszar wygranych gry
"Ścisła"
0
5
10
15
20
25
30
35
0
5
10
15
20
25
30
35
u
b
u
a
[a
1
,b
1
]
[a
1
,b
2
]
[a
2
,b
2
]
[a
2
,b
1
]
r
Wykres 1.5. Obszar wygranych gry "K lub P"
0
5
10
15
20
25
30
35
0
5
10
15
20
25
30
35
u
b
u
a
[a
1
,b
1
]
[a
2
,b
2
]
[a
2
,b
1
]
[a
1
,b
2
]
r
21
Wykres 1.4 pokazuje, Ŝe w grze „Ścisła” jedyna równowaga jest jednocześnie
optymalna w sensie Pareto
6
. JeŜeli jedyna równowaga w grze o sumie róŜnej od zera jest
jednocześnie optymalna w sensie Pareto, to mówimy o rozwiązaniu w sensie ścisłym
[Straffin, 2001, s. 90]. Jest to niesłychanie rzadki przypadek jednoznaczności wyznaczenia
rozwiązania gry o sumie róŜnej od zera.
Wykres 1.5 przedstawia sytuację stojącą na przeciwnym krańcu osi jednoznaczności.
Równowaga w grze „K lub P” występuje w jedynym nie optymalnym w sensie Pareto
wierzchołku obszaru wygranych. Rekomendacja równowagi jako rozwiązania tej gry moŜe
upaść pod zarzutem niespełnienia kryterium optymalności Pareto. Kontrowersja pomiędzy
kryterium równowagi i kryterium Pareto pojawiająca się w grach niekooperacyjnych
podzieliła w swoim czasie badaczy zajmujących się tą dziedziną. Nash obstawał przy swojej
propozycji nawet wtedy, gdy eksperymenty wskazywały na przewagę rozwiązania
optymalnego w sensie Pareto [Flood, 1958]. Poglądy innych były zgodne z wynikami tych
eksperymentów. Według nich, „na korzyść optymalności w sensie Pareto przemawia to, Ŝe
kaŜdy z graczy zachowując się racjonalnie, przypisuje racjonalność drugiemu. Jeśli jest wynik
gry inny od równowagi, który podnosi wygraną jednego z graczy, co najmniej nie
zmniejszając wygranej drugiego, to równowaga nie stanie się racjonalnym wynikiem gry”
[Rapoport, 1989, s.221].
1.3.3.
Wybór rozwiązania spośród wielu równowag tej samej gry
Niejednoznaczność wskazania rozwiązania gry niekooperacyjnej moŜe się pojawić
równieŜ wtedy, gdy mamy do czynienia z mnogością równowag optymalnych w sensie
Pareto. O ile rozwiązaniem w sensie ścisłym jest jedyna równowaga optymalna w sensie
Pareto, to ich większa liczba spełnia warunek ścisłości tylko wtedy, gdy są one ekwiwalentne
i wymienne [Straffin, 2001, s. 90]. Tak nie jest w przypadku gry „Dwie równowagi”.
„Dwie równowagi”
Dwa przedsiębiorstwa działające na tym samym rynku mają do wyboru po dwie
strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Jeśli jednocześnie wybiorą strategie
typu 1, osiągną rozwiązanie najkorzystniejsze dla gracza A. Gdy zgodny wybór padnie na
strategie typu 2, najwyŜszą wygraną cieszyć się będzie gracz B. Mieszanie typów strategii
przynosi najniŜszą z dostępnych wygranych temu z przedsiębiorstw, które wybierze typ 2.
6
Na wykresach zbiór Pareto optymalny składa się z punktów zaznaczonych romboidalnym powiększonym
znacznikiem oraz odcinków łączących te punkty. Te właśnie odcinki są obrazem wektorów mieszanych strategii
optymalnych w sensie Pareto. Równowagi oznaczono małą literą r.
22
Tabela 1.16. Macierze wygranych gry „Dwie równowagi”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
14
8
4
4
Strategia
b
2
6
-2
8
14
ź
ródło: opracowanie własne
Równowagi w tej grze to pary strategii [a
1
,b
1
] i [a
2
,b
2
]. Gracz A zdecydowanie
preferuje pierwszą z nich, gracz B drugą, nie są zatem ekwiwalentne i wymienne. Nawet jeśli
obydwie są optymalne w sensie Pareto, trudno przyjąć, Ŝe gracze zgodzą się na jedną z nich.
Konieczność wyboru między dwiema równowagami optymalnymi w sensie Pareto jest
naturalnym zaproszeniem do poszukiwania rozwiązania kooperacyjnego, o którym traktować
będzie następna część tego rozdział.
Wykres 1.6. Wielobok wygranych gry "Dwie
równowagi"
0
2
4
6
8
10
12
14
-4
-2
0
2
4
6
8
10
12
14
u
b
u
a
[a
1
,b
1
]
[a
2
,b
2
]
[a
2
,b
1
]
[a
1
,b
2
]
r
r
Ź
ródło: opracowanie własne
Bardzo istotną propozycję kryterium wyboru miedzy dwiema równowagami w ramach
gier niekooperacyjnych zgłosił John Harsanyi. Polegała ona na wykorzystaniu dwóch
kategorii: dominacji wypłat i dominacji ryzyka [Harsanyi, 1977, s. 274]. Pierwsze z nich
opiera się na wyborze tej równowagi, która przynosi wyŜszą wygraną przynajmniej jednemu z
graczy i nie niŜszą pozostałym. Racjonalność tego kryterium nie powinna budzić dyskusji,
wszak pokrywa się z kryterium optymalności Pareto.
23
Drugie z kryteriów Harsanyi’ego jest inspirowane koncepcją Luce’a i Raiffy
„dominacji psychologicznej”, jaka moŜe mieć miejsce w relacjach dwóch nieekwiwalentnych
i niewymiennych równowag [Luce, Raiffa, 1964, s. 108-109]. W pierwszym kroku naleŜy
sprawdzić, czy optymalna strategia mieszana moŜe zapewnić graczom wyŜsze wygrane, niŜ
gdyby wybrali strategię czystą korzystniejszą dla przeciwnika. Równowaga w strategiach
mieszanych w grze „Dwie równowagi” to para strategii a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
6
1
b
1
,
6
5
b
2
]
przynosząca wygrane u
ar
=7
3
1
oraz u
br
=6. Taki wynik gry jest zdominowany przez obydwie
równowagi. Racjonalnie zachowujący się gracz nie wybierze równowagi w strategiach
mieszanych nawet, jeśli przyszłoby mu wybrać strategię czystą umoŜliwiającą ustalenie się
równowagi mniej korzystnej dla niego.
Następnym krokiem w wykorzystaniu kryterium dominacji ryzyka jest wyznaczenie
indeksów ryzyka towarzyszących obydwu równowagom [Harsanyi, 1977, s. 276]. Dla
kaŜdego z graczy indeks zbudowany jest tak, Ŝe w liczniku znajduje się róŜnica jego
wygranych w alternatywnych równowagach liczona tak by zawsze miała znak dodatni, a w
mianowniku róŜnica jego wygranej w preferowanej równowadze i wygranej w sytuacji, gdy
przeciwnik odpowie najmniej korzystnie na próbę forsowania tej równowagi. W grze „Dwie
równowagi” odpowiednie indeksy będą miały następującą postać:
4
3
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
i
2
1
a
1
1
a
2
2
a
1
1
a
ar
=
−
−
=
[1.43]
8
3
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
i
2
1
b
2
2
b
1
1
b
2
2
b
br
=
−
−
=
[1.44]
WyŜsza wartość indeksu oznacza, Ŝe równowaga preferowana przez gracza A ([a
1
,b
1
])
dominuje w zakresie ryzyka równowagę [a
2
,b
2
] i ona powinna być wskazana jako unikalne
rozwiązanie w tej grze. Wskazana zostaje ta równowaga, której ewentualne odrzucenie przez
konkurenta wiąŜe się z mniejszą względną szkodą. Niestety dominacja ryzyka pozostaje
bezuŜytecznym narzędziem wyboru równowagi w strategiach czystych w szczególnym
przypadku, w którym liczniki i mianowniki indeksów ryzyka są sobie równe. Dzieje się tak w
przypadku gry „Tchórz”.
„Tchórz”
Dwa przedsiębiorstwa utworzyły konsorcjum dla realizacji pewnego kontraktu. KaŜde
z nich ma do wyboru dwie strategie. Mogą wykonać kontrakt (1) lub nie podejmować
Ŝ
adnych działań licząc na to, Ŝe druga strona wypełni go sama (2). Jeśli zgodnie kooperując
wykonają zlecone prace ([a
1
,b
1
]), osiągną zyski równe 2. Jeśli Ŝadne z przedsiębiorstw nie
24
podejmie wykonania kontraktu ([a
2
,b
2
]), wysokie kary umowne spowodują straty równe -8 u
obydwu. W sytuacji, gdy jeden wykona cały kontrakt a drugi osiągnie wypłatę bez ponoszenia
kosztów ([a
1
,b
2
] lub [a
2
,b
1
]), zyski wyniosą odpowiednio -4 i 6.
Tabela 1.17. Macierze wygranych gry „Tchórz”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
2
2
6
-4
Strategia
b
2
-4
6
-8
-8
ź
ródło: opracowanie własne
Gra „Tchórz” ma dwie, optymalne w sensie Pareto, równowagi w strategiach
czystych
7
. Przynoszą je pary strategii [a
1
,b
2
] (korzystniejsza dla B) i [a
2
,b
1
] (korzystniejsza dla
A). MoŜna teŜ w niej wyznaczyć równowagę w strategiach mieszanych. Jest nią para
a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
2
1
b
1
,
2
1
b
2
], która przynosi wygrane u
ar
=u
br
=-1. Równowagi te nie są
ekwiwalentne ani wymienne. Nie moŜna w tej grze skorzystać z kryterium dominacji wypłat.
ś
adna z równowag nie dominuje pozostałych.
Wykres 1.7. Wielobok wygranych gry "Tchórz"
-10
-8
-6
-4
-2
0
2
4
6
8
10
-10 -8
-6 -4
-2
0
2
4
6
8
10
u
b
u
a
[a1,b1]
[a2,b2]
[a2,b1]
[a1,b2]
r
r
Ź
ródło: opracowanie własne
7
Gra „Tchórz” jest modyfikacją archetypowej gry „Chicken” popularnej wśród amerykańskich nastolatków w
latach pięćdziesiątych ubiegłego stulecia. Dwa samochody jadą naprzeciw siebie z duŜą prędkością. Kierowca,
który pierwszy zahamuje „traci twarz” i przegrywa. Gracze mają do wyboru dwie strategie, hamować lub nie
hamować [Straffin, 2001, s. 103]. W polskich tłumaczeniach ksiąŜek dotyczących teorii gier, na ogół,
zachowana zostaje oryginalna nazwa tej gry, choć zdarzają się jej tłumaczenia nie oddające istoty rzeczy (np.
„kurczak” [Leibenstein, 1988, s. 301]).
25
Kryterium dominacji ryzyka równieŜ nie posłuŜy wskazaniu unikalnej równowagi w
strategiach czystych. Wyznaczenie indeksów ryzyka przynosi rezultat i
ar
=i
br
=
7
5
. Dramatyczny
brak moŜliwości wyznaczenia rozwiązania w strategiach czystych w grze „Tchórz” moŜna
wytłumaczyć następująco: „im bardziej jesteś przekonany do wyboru stchórzenia, tym
bardziej kusząca jest strategia przeciwna” [Raiffa, Metcalfe, Richardson, 2002, s. 69]. Jedynie
równowaga w strategiach mieszanych moŜe zostać wskazana jako rozwiązanie ze względu na
dominację ryzyka. Ten wybór jest oparty na toŜsamości indeksów ryzyka równowag w
strategiach czystych.
1.3.4.
Gry o sumie róŜnej od zera z asymetrią informacji
Wyznaczenie rozwiązania w grze „Tchórz” moŜe się stać trywialne, jeśli zmienimy
zakresy informacji, jakimi dysponują gracze. W pierwotnej wersji gry Ŝaden z nich nie wie,
co wybierze przeciwnik (zbiory informacyjne zaznaczone linią kreskowaną na Schemacie
1.5). Wybory strategii są dokonywane jednocześnie. Wyobraźmy sobie jednak, Ŝe jeden z
graczy decyduje jako drugi i wie, jaką strategię wybrał rywal. ZałóŜmy, Ŝe A wybiera
strategię jako pierwszy (zbiory informacyjne zaznaczone linią kropkowaną).
Pełen zakres informacji gracza B stwarza moŜliwość przedstawienia jeszcze jednej z
metod szukania rozwiązań w grach o sumie dowolnej. Metoda ta wykorzystuje ich postać
rozwiniętą. Polega na odrzucaniu przez gracza tych gałęzi, które przynoszą mu mniejsze
wygrane. Lewy węzeł, będący jednocześnie lewym zbiorem informacyjnym, zostanie
zredukowany przez gracza B o wybór b
1
(6>2). W przypadku prawego węzła odrzucona
zostanie gałąź b
2
(-4>-8). Gracz B wybierze więc strategię: „wybierać zawsze inaczej niŜ
przeciwnik”. Jeśli gracz A zakłada, Ŝe ma do czynienia z racjonalnym przeciwnikiem łatwo
A
B
a
1
a
2
b
2
b
2
b
1
b
1
(2,2)
(-4,6)
(6,-4)
(-8,-8)
Schemat 1.4. Dendryt gry „Tchórz”
Ź
ródło: opracowanie własne
26
moŜe zidentyfikować jego wybór. Najlepszą odpowiedzią A na strategię gracza B „wybierać
zawsze inaczej niŜ przeciwnik” będzie wybór strategii a
2
(6>-4). „Taka metoda znajdowania
dobrych strategii poprzez analizę drzewka gry od końca nazywa się indukcją wsteczną”
[Malawski, Wieczorek, Sosnowska, 1997, s. 30].
Gracz A wiedząc, Ŝe przeciwnik będzie podejmował decyzję znając jego wybór,
wybierze strategię biernego oczekiwania na zrealizowanie kontraktu przez gracza B.
Dokonywanie wyboru strategii w pierwszej kolejności przynosi przewagę w grze w
„Tchórza”. Jednocześnie większy zakres informacji stawia gracza B w mniej korzystnej
sytuacji. Sprawa ma się tutaj odwrotnie niŜ w przypadku gry „A przeciw B”, w której
znajomość decyzji rywala przyniosła firmie B wzrost wygranej w punkcie siodłowym.
MoŜliwość wyboru strategii w pierwszej kolejności stworzyła sytuację, w której gracz
A swoją decyzją moŜe sformułować skuteczną groźbę. Wybierając jako pierwszy bierne
oczekiwanie na wykonanie kontraktu przez partnera, wymusza na nim reakcję obronną w
postaci wyboru strategii „wykonanie kontraktu”. O groźbach mówimy wtedy, gdy:” (i) gracz
A deklaruje, Ŝe w wypadku jakiegoś działania gracza B sam podejmie określone działanie,
które (ii) będzie niekorzystne dla B, oraz (iii) będzie niekorzystne takŜe dla niego samego”
[Straffin, 2001, s. 111]. ZałóŜmy, Ŝe w grze „Tchórz” dopuszczamy moŜliwość kontaktu
między graczami przed jednoczesnym wyborem strategii. KaŜdy z nich moŜe sformułować
wówczas groźbę: „jeśli ty zagrasz swoją strategię (2) to ja zrobię to samo”. Wystosowanie
groźby rodzi problem wiarygodności. Ze względu na warunek (iii) adresat ma prawo wątpić
w jej realizację. Gdy dokona on swojego wyboru, wykonanie groźby nie przynosi juŜ Ŝadnej
korzyści jej autorowi. Próba rozwiązania tego problemu moŜe pojawić się w powtarzanej
wersji gry, w której dla uwiarygodnienia groźby gracz moŜe pozwolić sobie na niŜsze
wygrane w kilku pierwszych turach.
Tabela 1.18. Macierz gry „Tchórz: róŜnica wygranych”
Wygrane B = u
b
’
a
1
a
2
b
1
0
-10
b
2
10
0
Ź
ródło: opracowanie własne
Optymalne strategie gróźb są najlepszą odpowiedzią na siebie nawzajem.
Wyznaczamy je jako punkt siodłowy gry powstałej w wyniku odjęcia od siebie wygranych z
wyjściowej gry o sumie róŜnej od zera:
u
a
’([a
i
,b
j
])=u
a
([a
i
,b
j
])-u
b
([a
i
,b
j
] oraz u
b
’([a
i
,b
j
])=u
b
([a
i
,b
j
])-u
a
([a
i
,b
j
])).
[1.45]
W przypadku gry „Tchórz” punktem siodłowym takiej gry jest para strategii [a
2
,b
2
].
27
KaŜdy z graczy deklarując brak jakiegokolwiek działania na rzecz wykonania
kontraktu, formułuje groźbę, która jest najlepszą odpowiedzią na groźbę przeciwnika.
Optymalne groźby pozostają w równowadze. Pamiętać naleŜy jednak, Ŝe ich realizacja
przynosi jedyny wynik, który nie jest Pareto optymalny w zbiorze strategii czystych. Para
optymalnych strategii gróźb nie moŜe być traktowana jako propozycja rozwiązania gry o
sumie róŜnej od zera. Groźby stanowią jedynie narzędzie słuŜące osiągnięciu poŜądanego
wyniku gry. Ich przydatność widoczna jest w przypadku gier powtarzanych oraz przy
wyznaczaniu rozwiązań kooperacyjnych, o czym szerzej przeczytać będzie moŜna w
następnej części pracy.
1.3.5.
Poziomy bezpieczeństwa, wykorzystanie kryterium maksyminowego
Trudności w wyborze jednoznacznego rozwiązania gier o sumie róŜnej od zera
stwarzają pokusę wykorzystania narzędzi słuŜących wyznaczaniu optymalnego rozwiązania
gier o sumie zerowej. Ulegnięcie tej pokusie prowadzi nas do wyznaczenia optymalnych
strategii w grach o sumie róŜnej od zera zwanych strategiami bezpieczeństwa. Wartość gry
uzyskana w ten sposób to poziom bezpieczeństwa gracza. Z praktycznego punktu widzenia,
wyznaczenie poziomów bezpieczeństwa polega na znalezieniu maksyminów w grach o
wygranych kaŜdego z graczy z osobna. Macierze wygranych w grze o sumie róŜnej od zera
traktowane są jak macierze gry o sumie zerowej. Zakładamy tym samym, Ŝe wygrana
kaŜdego z graczy jest jednocześnie przegraną drugiego. Wyborowi strategii przyświeca
przekonanie, Ŝe przeciwnik jest zainteresowany w minimalizacji naszej wygranej.
Tabela 1.19. Gra "Tchórz: suma zero B"
u
b
a
1
a
2
a
M
i
a
min
∈
b
1
2
-4
-4
a
M
i
a
b
M
j
b
min
max
∈
∈
b
2
6
-8
-8
-4
b
M
bj
max
∈
6
-4
b
M
j
b
a
M
i
a
max
min
∈
∈
-4
Ź
ródło: obliczenia własne
Pozostańmy przy najczęściej analizowanej ostatnio grze w „Tchórza”. Macierz gry o
sumie zerowej na wygranych gracza B ma punkt siodłowy w strategiach czystych. Jest nim
para strategii [a
2
,b
1
]. Wartość tej gry to v=-4 i taki jest właśnie poziom bezpieczeństwa gracza
B. NiezaleŜnie od wyboru przeciwnika, wybierając strategię b
1
, gwarantuje on sobie, Ŝe
wygra, co najmniej -4.
28
Wyznaczony analogicznie poziom bezpieczeństwa gracza A wynosi równieŜ -4 i
gwarantowany jest wyborem strategii a
1
. Zwróćmy uwagę, Ŝe obustronny wybór strategii
bezpieczeństwa w grze „Tchórz” przynosi wynik gry, który nie jest równowagą, ale spełnia
kryterium optymalności Pareto. Wiedza o wyborze strategii bezpieczeństwa moŜe jednak
zostać wykorzystana przez przeciwnika, który ma sposobność wybrać strategię
kontrbezpieczną, czyli najlepszą na nią odpowiedź. Strategią kontrbezpieczną gracza A jest a
2
a gracza B b
2
. Wykorzystanie strategii bezpieczeństwa jako wskazania rozwiązania w grach o
sumie zerowej ma, jak widać, jedną podstawową wadę. Strategie bezpieczeństwa nie są w
równowadze i nie przynoszą rozwiązania stabilnego.
Tabela 1.20. Alternatywy dla równowag w grze „Tchórz”
Strategie A
Strategie B
u
a
u
b
bezpieczna
bezpieczna
2
2
bezpieczna
kontrbezpieczna
-4
6
kontrbezpieczna
bezpieczna
6
-4
kontrbezpieczna
kontrbezpieczna
-8
-8
Ź
ródło: opracowanie własne na podstawie [Straffin, 2001]
Wybierając swoje strategie bezpieczeństwa, kaŜdy z graczy umoŜliwia przeciwnikowi
osiągnięcie równowagi bardziej korzystnej dla niego. Nie moŜna zatem zaryzykować tezy o
przydatności narzędzi wyznaczania rozwiązań gier o sumie zerowej dla rozwiązywania gier o
sumie róŜnej od zera.
Wszechstronne próby znalezienia rozwiązania w grze „Tchórz” przyniosły jedynie
wskazanie równowagi w strategiach mieszanych a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
2
1
b
1
,
2
1
b
2
]. Przy
nieskończonej liczbie powtórzeń przyniesie ona wygrane u
ar
=u
br
=-1. Nie zapominajmy jednak
o sytuacji, jaka stoi za analizowaną grą. Jeśli w którymś z powtórzeń wylosowana zostanie
para strategii [a
2
,b
2
], nie będzie juŜ kolejnego kontraktu do zrealizowania. Podobnie moŜe być
równieŜ wtedy, gdy losowanie strategii przyniesie którąkolwiek z równowag w strategiach
czystych. Konsorcjum rozpadnie się z przyczyn oczywistych.
Wskazanie równowagi jako rozwiązania gry o sumie róŜnej od zera ma dwie zalety.
Po pierwsze, jest to propozycja wyróŜniająca się tym, Ŝe pojedynczy gracz nie moŜe poprawić
swojej sytuacji wyłącznie swoimi działaniami. Po drugie, jak dowiódł Nash, w kaŜdej grze
moŜna wskazać równowagę. Niestety, gdy mamy do czynienia z liczbą nie ekwiwalentnych i
nie wymiennych równowag większą niŜ jeden, pojawia się problem wskazania tej właściwej.
Harsanyi zaproponował wykorzystanie kryteriów dominacji wypłat i dominacji ryzyka. Ich
zastosowanie umoŜliwia wskazanie unikalnej równowagi jako rozwiązania gry. Jednak w
29
niektórych przypadkach uzyskane rozwiązanie w strategiach mieszanych nie spełnia
oczekiwań graczy. Są bowiem gry, w których praktyczny aspekt mieszania strategii kłóci się z
naturą sytuacji strategicznej.
Podjęcie próby wykorzystania narzędzi poszukiwania punktów siodłowych w grach o
sumie zerowej równieŜ nie przyniosło poŜądanych rezultatów. Pomijając trudności związane
z naturą poszczególnych przypadków, wystarczy powiedzieć, Ŝe strategie bezpieczeństwa
wyznaczone metodą maksyminu nie sprawdzą się w grach o sumie róŜnej od zera, poniewaŜ
nie są w równowadze.
Widać teraz, jak błahe były problemy, które pojawiały się podczas rozwiązywania gier
o sumie zerowej. Rozwiązując grę o sumie róŜnej od zera pozostaje nam jedynie zatęsknić za
jednoznacznością jej być moŜe mniej wyrafinowanej, ale jakŜe wdzięczniejszej siostry.
1.4.
Teoria gier powtarzalnych
1.4.1.
Natura gier iterowanych
Powtarzalność gry rodzi istotne konsekwencje strategiczne. Wybory graczy w
kolejnych turach pozostają pod wpływem znanych im wyników poprzednich iteracji. Gracza
poznają się i z czasem ich wybory uwzględniają „dopasowanie” do postawy przeciwnika.
Dodatkowo pojawia się czynnik uczenia się obejmujący nie tylko zachowania innych graczy,
ale równieŜ istotę i dynamikę gry. Wszystkie te względy przesuwają zainteresowanie badacza
w kierunku pozytywnej analizy zachowań graczy. Jest ona domeną empirycznych badań nad
zachowaniami podmiotów gospodarczych oraz przedmiotem ekonomii eksperymentalnej. W
tym rozdziale uwaga zostanie skoncentrowana na normatywnym aspekcie gier powtarzalnych.
Przedstawione zostaną próby wyznaczenia racjonalnych sposobów postępowania w tych
grach. Elementy analizy pozytywnej obejmujące skutki porozumiewania się graczy, ich
indywidualnych charakterystyk oraz wzajemnych przewidywań, co do kolejnych ruchów
pojawią się tylko wtedy, gdy będzie to konieczne.
Celem graczy w grze powtarzalnej jest uzyskanie maksymalnej sumy uŜyteczności
wygranych. Spełnienie załoŜenia o tym, Ŝe uŜyteczność sumy wygranych jest równa sumie
uŜyteczności jej składników jest moŜliwe tylko przy liniowej postaci tej funkcji. Formułując
bazowe załoŜenia dla modeli budowanych w tej pracy, taką właśnie funkcję przyjęto. To
daleko idące uproszczenie będzie przydatne jeszcze niejednokrotnie. MoŜna teŜ przyjąć inne
podejście zakładając, Ŝe gracze są „zainteresowani jedynie w maksymalizacji swych własnych
30
oczekiwanych wypłat pienięŜnych, i niech wtedy liczby macierzy wypłat przedstawiają
wypłaty pienięŜne” [Luce, Raiffa, 1964, s. 98].
1.4.2.
Powtarzanie jako metoda rozwiązywania gier o sumie zerowej
Powtarzanie gry o sumie zerowej przynosi supergrę o tej samej charakterystyce.
KaŜda powtarzalna gra o sumie zerowej, tak jak jej składowa, jest ściśle konkurencyjna. Jej
rozwiązaniem będzie wybór strategii maksyminowej w kaŜdej iteracji. Gry ściśle
konkurencyjne w wersji powtarzanej nie stwarzają istotnych problemów z teoretycznego
punktu widzenia. MoŜemy nawet stwierdzić, Ŝe stworzenie fikcyjnej gry, poprzez
powtarzanie bazowej gry o sumie zerowej, moŜe przynieść nową metodę jej rozwiązywania.
„Ekspansja”
8
Dwa przedsiębiorstwa produkują ten sam wyrób. Przedsiębiorstwo A charakteryzuje
się mniejszym udziałem w rynku i wyŜszymi kosztami marginalnymi niŜ przedsiębiorstwo B.
Otwierają się przed nimi dwa nowe rynki. Jeśli obydwa wejdą na ten sam rynek ([a
1
,b
1
] lub
[a
2
,b
2
]), słabsze przedsiębiorstwo A przegrywa zyski równe jedności na rzecz konkurenta.
Odwrotnie dzieje się wtedy, gdy wybierają róŜne rynki ([a
1
,b
2
] lub [a
2
,b
1
]), poniewaŜ A moŜe
wzmocnić się nie będąc atakowane przez konkurenta.
Tabela 1.21. Gra "Ekspansja"
u
b
a
1
a
2
a
M
i
a
min
∈
b
1
-1
1
-1
a
M
i
a
b
M
j
b
min
max
∈
∈
b
2
1
-1
-1
-1
b
M
bj
max
∈
1
1
b
M
j
b
a
M
i
a
max
min
∈
∈
1
Ź
ródło: obliczenia własne na podstawie [Shubik, 1995]
Gra nie ma punktu siodłowego w strategiach czystych, ale sprawdźmy, jak będzie się
zmieniać sytuacja, jeśli będzie powtarzana. ZałóŜmy, Ŝe gracze zaczynają od jednoczesnego
wyboru drugiego rynku. Przez cały czas, gracze monitorują częstość wyboru strategii przez
przeciwnika. W następnych turach wybierają odpowiednią strategię tak długo, dopóki drugi z
graczy nie zacznie częściej wybierać strategii, na którą najlepszą odpowiedzią będzie zmiana
własnej strategii. Gracz B powinien zmienić strategię juŜ w drugiej turze, poniewaŜ najlepszą
8
Gra jest odmianą archetypowej gry „Matching Pennies” polegającej na jednoczesnym wskazaniu jednej z
dwóch stron monety przez dwóch graczy. Jeśli wskaŜą tą samą stronę wygrywa jeden, jeśli róŜne wygrywa
drugi. Wygraną jest pokazywana moneta.
31
odpowiedzią na a
2
jest b
1
. Gracz A zmienia strategię na a
1
w turze czwartej, zaraz po tym jak
okazuje się, Ŝe gracz B zaczął częściej grać b
1
.
Tabela 1.22. Gra "Ekspansja" rozgrywana wielokrotnie
Wybór A
Częstość wyboru A
Wybór B
Częstość wyboru B
Tura
a
1
a
2
a
1
a
2
b
1
b
2
b
1
b
2
1
1
0,0000
1,0000
1
0,0000
1,0000
2
1
0,0000
1,0000
1
0,5000
0,5000
3
1
0,0000
1,0000
1
0,6667
0,3333
4
1
0,2500
0,7500
1
0,7500
0,2500
5
1
0,4000
0,6000
1
0,8000
0,2000
6
1
0,5000
0,5000
1
0,8333
0,1667
7
1
0,5714
0,4286
1
0,8571
0,1429
8
1
0,6250
0,3750
1
0,7500
0,2500
9
1
0,6667
0,3333
1
0,6667
0,3333
10
1
0,7000
0,3000
1
0,6000
0,4000
11
1
0,7273
0,2727
1
0,5455
0,4545
Ź
ródło: obliczenia własne na podstawie [Shubik, 1995]
Zgodnie z tą dynamiką gra moŜe się toczyć w nieskończoność. Robinson [1951]
udowodnił, Ŝe częstości wyboru strategii zmierzają w niej do wartości optymalnych
prawdopodobieństw mieszania strategii. W grze „Ekspansja” punkt siodłowy w strategiach
mieszanych to para a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
2
1
b
1
,
2
1
b
2
] przynosząca wartość gry v=0. JuŜ przy 250
powtórzeniach średnia wypłata gracza B wynosi 0,02. Zdaniem Robinsona, analizując grę o
sumie zerowej poprzez dokonywanie powtórzeń, moŜemy wyznaczyć optymalne strategie
mieszane graczy i jej wartość.
Wykres 1.8. Częstość wyboru strategii a
1
w powtarzanej grze "Ekspansja"
0,0
0,3
0,5
0,8
1,0
1,3
1
26
51
76
101
126
151
176
201
226
tury
Ź
ródło: opracowanie własne
32
Wykres 1.8 pokazuje jak wygasają oscylacje częstości wybierania strategii wokół
optymalnego prawdopodobieństwa jej losowania. W miarę, jak przyrasta ilość iteracji, ich
odchylenie od p=0,5 jest coraz mniejsze. Podobnie będzie wyglądać wykres dla kaŜdej z
pozostałych strategii czystych dostępnych graczom. Co prawda, wraz z gaśnięciem oscylacji
wydłuŜa się jej okres, ale nie zmienia to faktu, Ŝe częstość wyboru strategii zmierza do
optymalnego prawdopodobieństwa jej losowania.
1.4.3.
Powtarzane gry o sumie róŜnej od zera
Niestety metoda Robinsona nie znajduje zastosowania w grach o sumie róŜnej od zera.
Zbudowanie normatywnego modelu wskazującego na najlepszą strategię kaŜdego z graczy
wymaga przyjęcia szeregu załoŜeń upraszczających. Badacze chętniej zajmują się
konkretnymi przykładami gier niŜ uniwersalną teorią powtarzalnych gier o sumie niezerowej.
Najczęściej przedmiotem ich zainteresowania był „dylemat więźnia”. Zbiega się to
szczęśliwie z powinowactwem gier tego typu z modelem duopolu, którego uproszczoną
postacią była gra „K lub P”.
Zanim zajmiemy się metodami znajdowania rozwiązań w powtarzanym dylemacie
więźnia, przedstawmy ogólną postać tego typu gry w wersji jednoetapowej. KaŜdy z graczy
ma do wyboru dwie strategie: zdrada (z) lub kooperacja (k). ZałóŜmy, Ŝe macierze wygranych
obydwu graczy będą symetryczne. Nie będzie to miało wpływu na naturę wyznaczonego
rozwiązania.
Tabela 1.23. Macierze wygranych gry „Dylemat więźnia”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
z
z
f
c
Strategia
b
2
c
f
k
k
ź
ródło: opracowanie własne
Relacja pomiędzy wygranymi zawsze układać się będzie zgodnie z nierównościami
c>k>z>f oraz
2
f
c
k
+
≥
. Przypomnijmy, Ŝe równowaga w tej grze to para strategii [a
z
,b
z
].
Jednocześnie jest to jedyny wynik gry w strategiach czystych, który nie jest optymalny w
sensie Pareto.
33
ZałóŜmy, Ŝe gracze znają ilość powtórzeń, jaką przyjdzie im rozegrać. Analizując grę
z perspektywy ostatniej iteracji, uznają za racjonalne wybranie w niej strategii zdrady, która
dominuje kooperację. Wybór jest oczywisty, bowiem więcej powtórzeń nie będzie. To z kolei
sprawia, Ŝe tura przedostania, ze strategicznego punktu widzenia, upodabnia się do ostatniej.
Ponownie najbardziej racjonalnym wyborem dla obydwu graczy będzie zdrada. „Szanse na
kooperacje upadają jak kostki domina – równieŜ pierwszym wynikiem musi być para strategii
zdrady” [Straffin, 2001, s. 96]. Zgodnie z tą logiką równowaga w dylemacie więźnia jest
równocześnie równowagą w jego powtarzanej określoną ilość razy wersji. Jednak
doświadczenie uczy, Ŝe gracze nie zawsze z Ŝelazną konsekwencją stosują opisany sposób
myślenia, a i w teorii znaleziono sposób na odejście od tego zdeterminowanego rozwiązania.
Polega on na załoŜeniu, Ŝe gracze nie znają ilości powtórzeń, jaka będzie ich udziałem. Nie
znają ostatniej tury, więc nie mogą rozpocząć wstecznego odliczania strategii zdrady w
kolejnych powtórzeniach.
W literaturze wymienia się cztery metody wyboru strategii w przypadku dylematu
więźnia powtarzanego nieokreśloną ilość razy [Shubik, 1970]:
•
wprowadzenie dodatniego prawdopodobieństwa zakończenia gry na kaŜdym jej etapie,
•
wprowadzenie dodatniego współczynnika dyskontującego,
•
zastąpienie gry jej skończoną wersją z funkcją wartości końcowej,
•
optymalizacja średniej wypłaty dla pojedynczej iteracji.
Pierwszy ze sposobów zakłada, Ŝe kaŜda tura, następna po pierwszej, zostanie
rozegrana z prawdopodobieństwem 0≤p≤1 [Shubik, 1970]. Gdyby kaŜdy z graczy zawsze
wybierał strategię kooperacji, jego suma wygranych wyniosłaby:
p
1
k
k
p
k
p
pk
k
3
2
−
=
+
+
+
+
L
[1.46]
Mógłby jednak zdecydować się na zagranie zdrady w m-tej iteracji. Przeciwnik odpowie tą
samą zmianą w turze m+1 i dalej wybrane strategie pozostaną w równowadze. Suma
wygranych tego, który zdradzi pierwszy przybiera postać:
p
1
z
p
c
p
)
p
1
(
)
p
1
(
k
z
p
z
p
c
p
k
p
k
p
pk
k
m
1
m
1
m
1
m
m
1
m
2
m
2
−
+
−
+
−
=
+
+
+
+
+
+
+
+
−
−
+
−
−
L
L
[1.47]
Nie będzie się opłacało zdradzić, jeśli [1.50] będzie większe od [1.51].
p
1
z
p
c
p
)
p
1
(
)
p
1
(
k
p
1
k
m
1
m
1
m
−
+
−
+
−
>
−
−
−
[1.48]
Przekształcając tą nierówność otrzymujemy:
34
z
c
k
c
p
−
−
>
[1.49]
Gracze powinni grać kooperacyjnie pod warunkiem, Ŝe prawdopodobieństwo rozegrania
kolejnego powtórzenia jest większe od ilorazu róŜnic wygranych z nierówności [1.49].
Warunek jest niezaleŜny od tego, w którym powtórzeniu moŜe pojawić się zdrada.
Powróćmy na chwilę do gry „K lub P”. W przypadku obydwu graczy graniczna
wartość prawdopodobieństwa wynosi p=
3
1
. Jeśli w tej grze o wystąpieniu kolejnej iteracji
decydować będzie rzut monetą, zdrada nie będzie się opłacała Ŝadnemu z graczy. Na
przykład, stałe granie kooperacji przez gracza A przynosi mu oczekiwaną wartość sumy
wygranych równą 50. Jednocześnie ta sama suma osiąga wartość 48,75 w wypadku zdrady w
czwartym powtórzeniu. Jeśli w odmiennej sytuacji, o kolejnym powtórzeniu będzie
decydować wyrzucenie szóstki przy pomocy kości do gry, to stałe wybieranie kooperacji
przez obydwu graczy przynosi oczekiwaną wartość sumy wygranych równą 30, a zdrada w
czwartej iteracji przyniesie jej wzrost do 30,0139.
Druga z przedstawionych metod jest modyfikacją pierwszej. Prawdopodobieństwo
rozegrania kolejnej iteracji zostaje zastąpione przez współczynnik dyskontujący. Gracze,
oczekując na wygrane w kolejnych turach, ponoszą koszty alternatywne związane z
odroczeniem wypłaty w czasie. Ich miarą jest stopa dyskontowa d. Jeśli pierwsza tura
rozgrywana jest dziś, a kolejne z interwałem rocznym, to wartość obecna wygranej gracza A
otrzymanej w etapie m jest warta:
1
m
am
am
m
)
d
1
(
u
)
u
(
PV
−
+
=
[1.50]
Nierówność [1.52] przybiera teraz postać:
1
m
1
m
2
m
)
d
1
(
d
1
z
)
d
1
(
1
c
)
d
1
(
d
1
d
1
1
k
d
1
1
k
−
−
−
+
+
+
+
+
−
+
>
+
,
[1.51]
a nierówność [1.53]:
k
c
z
k
d
−
−
<
[1.52]
W grze „K lub P” górną granicą wartości stopy dyskontowej, poniŜej której nie opłaca
się zdradzać, jest d=200%. Jest to na tyle duŜa wartość, Ŝe moŜna być spokojnym o trwałość
kooperacji. Przy zdecydowanie częściej spotykanej d=10%, strategia trwałej kooperacji
35
przynosi graczowi A wartość oczekiwaną sumy wygranych równą 275, a zdrada w czwartym
powtórzeniu to jedynie 203,6
9
.
Graniczne prawdopodobieństwo rozegrania kolejnej tury i maksymalna stopa
dyskontowa są koncepcjami wskazującymi warunki dla opłacalności zdrady w dowolnym
powtórzeniu gry w przyszłości. Trzeba jednak pamiętać o ograniczonym zastosowaniu tych
propozycji. Opierają się one na daleko idących załoŜeniach upraszczających. Gracze
zaczynają od jednoczesnego wyboru kooperacji, a zdrada jednego z graczy przynosi mu
jednorazową korzyść i od następnego powtórzenia prowadzi do trwałego wyboru zdrady
przez obydwu. Nie trzeba specjalnie wysilać wyobraźni, by dostrzec moŜliwość pojawienia
się ponownie odmiennego scenariusza, na przykład kooperacji po paru kolejnych
obustronnych wyborach zdrady.
Trzecia z wymienionych przez Shubika metod wyboru strategii w powtarzanym
dylemacie więźnia polega na wyznaczeniu wartości końcowej. „Pozwala ona na zamianę
nieskończonego horyzontu czasowego gry moŜliwością jej zakończenia przez gracza „i” w
okresie T i uzyskania wypłaty końcowej Q
i
, która ma zrekompensować mu odstąpienie
uczestnictwa sukcesorowi. Q
i
moŜe być dowolną ogólną funkcją gry do etapu T” [Shubik,
1995, s. 289]. Technika wyznaczania wartości końcowej opiera się na takim modelowaniu
gry, Ŝe konkretną rolę spełnia w niej określona sekwencja graczy, w której kaŜdy odstępuje
od gry w zamian za opłatę końcową. Horyzont czasowy gry kolejnych graczy jest, tym
samym, skończony. „Wartość końcowa dla kaŜdego z nich moŜe być określona przez
czynniki introspektywne takie jak, altruizm lub skłonność do pozostawienia spuścizny, albo
zewnętrzne takie jak, podatki, subsydia, prawa i zwyczaje [Shubik, 1980, 1981].
Wróćmy ponownie do gry „K lub P”. ZałóŜmy, Ŝe dodatkowy bonus o wartości 25 jest
wypłacany graczowi A w wypadku jednoczesnego wyboru kooperacji w powtórzeniu T.
9
Graniczna wartość stopy dyskontowej d=10% występuje w tych wariantach dylematu więźnia, w których
róŜnica wygranych między zgodnymi wyborami zdrady i kooperacji jest dziesięciokrotnie mniejsza od
relatywnej korzyści ze zdrady partnera wybierającego kooperację:
Wygrane A = u
a
a
z
a
k
b
z
21,8
10,0
b
k
35,0
23,0
Wygrane B = u
b
a
z
a
k
b
z
21,8
35,0
b
k
10,0
23,0
Ź
ródło: opracowanie własne
Obustronny wybór strategii kooperacji przynosi relatywnie niewielki przyrost wygranych w stosunku do
równowagi w tej grze. Zdrada partnera gotowego do współpracy jest dalece korzystniejsza. Dodać naleŜy, Ŝe
minimalną wartością prawdopodobieństwa rozegrania kolejnej tury w tej grze gwarantującą trwałość kooperacji
jest p=10/11.
36
Gracz B, w tej samej sytuacji, otrzymuje wypłatę końcową równą 30. KaŜda inna para
strategii sprawia, Ŝe wypłata końcowa wynosi -23 dla gracza B i -22 dla gracza A. Takie
ustalenie sprawia, Ŝe para strategii [a
k
,b
k
] staje się równowagą w iterowanej wersji gry „K lub
P”. Dodatkowo powoduje to zmniejszenie się prawdopodobieństwa wystąpienia wyniku
[a
z
,b
z
], który jest równowagą w jednoetapowej wersji gry. Zwróćmy uwagę, Ŝe ustanowienie
wypłaty końcowej w powtarzanym dylemacie więźnia umoŜliwia wyznaczenie rozwiązania
bez konieczności przejścia do sfery gier kooperacyjnych.
Czwarta z wyróŜnionych przez Shubika metod, optymalizacja średniej wygranej z
jednego powtórzenia polega na takim skonstruowaniu optymalnej strategii by uzyskać
moŜliwie najwyŜszą granicę, do której zmierzać będzie średnia wypłata przy nieskończonej
ilości powtórzeń. Jeśli wygrane w kaŜdym powtórzeniu są mniejsze od stałej C, to ich średnia
wartość równieŜ. Ta metoda, zaproponowana przez Aumanna [1959], prowadzi do uzyskania
nowej gry, w której wygranymi są średnie z nieskończonej ilości powtórzeń, a strategiami
sekwencje dostępnych strategii czystych. Rozwiązaniem będzie równowaga tak zbudowanej
gry.
Propozycje rozwiązań gier powtarzanych swoją poprawność formalną opierają na
załoŜeniach upraszczających, które często budzą wątpliwości u autorów zajmujących się tą
dziedziną
10
. W sposób naturalny pojawiła się potrzeba eksperymentalnej weryfikacji
zachowań podmiotów decyzyjnych w grach typu „dylemat więźnia” lub podobnych. Wiele
studiów o tym charakterze istotnie uzupełniło naszą wiedzę. O ich wynikach będzie moŜna
przeczytać w rozdziale 3.5.2.
10
Poza przedstawionymi dobrym przykładem jest wskazanie rozwiązania w dylemacie więźnia poprzez
odwołanie do metagry drugiego stopnia. Idea ta, znana wcześniej, została sformalizowana przez Howarda
[1971]. Wymaga się w niej, aby jeden z graczy wybierał spośród strategii uwzględniających trafne
przewidywanie wyboru zdrady lub kooperacji przez drugiego. Jednocześnie ten drugi wybiera spośród strategii
zakładających, Ŝe trafnie przewiduje jak wybierze pierwszy opierający się na własnej antycypacji. Na przykład,
gracz A moŜe wybrać strategię „zz”, czyli zdradę niezaleŜnie od tego, co zagra gracz B. Gracz B natomiast, ma
do wyboru między innymi, strategię „zzzk” czyli wybór zdrady gdy A wybiera „zz” i kooperacji w pozostałych
przypadkach. Za wyborem rozwiązania metodą metagry drugiego stopnia stoi załoŜenie o zdolności graczy do
trafnego przewidywania wyborów przeciwnika. Jego realność wydaje się, co najmniej, dyskusyjna.