background image

Wybrane eksperymenty z TOU 

 

Metoda  eksperymentalna  służyła  również  jako  narzędzie  testowania  teorii 

oczekiwanej  użyteczności  von  Neumanna  i  Morgensterna.  Znacznie  więcej  eksperymentów 

ujawniło  zachowania  stojące  w  sprzeczności  z  jej  treścią

1

.  Najbardziej  znany  jest  paradoks 

Allaisa  polegający  na  sprzeczności  miedzy  dwoma  wyborami.  Poprosił  on  uczestników 

eksperymentu  by  dokonali  wyboru  pomiędzy  dwiema  alternatywami,  których  opcje  mogą 

zostać opisane jako wartości oczekiwane w postaci ogólnej: 

n

n

2

2

1

1

A

p

A

p

A

p

EV

+

+

+

=

L

 

 

1

p

p

p

n

2

1

=

+

+

+

L

 

gdzie: 

p

i

 – prawdopodobieństwo otrzymania kwoty A

i

Pierwszy  wybór,  miedzy  opcją  A  (p

1

=1,  A

1

=100  mln  franków)  i  B  (p

1

=0,1,  B

1

=500 

mln;  p

2

=0,89,  B

2

=100  mln;  p

3

=0,01,  B

3

=0),  uczestnicy  eksperymentu  rozstrzygali  w  istotnej 

większości na rzecz opcji A. Jednocześnie, w drugim wyborze, ci sami uczestnicy preferowali 

opcję D (p

1

=0,1, D

1

=500 mln; p

2

=0,9, D

2

=0) bardziej niż C (p

1

=0,11, C

1

=100 mln; p

2

=0,89, 

C

2

=0).  Hipotetyczny  podmiot,  dla  którego  U(A)>U(B)

2

  powinien  przejawiać  preferencję 

odwrotną  U(C)>U(D).  Wyniki  tego  eksperymentu,  opartego  na  hipotetycznych  wyborach, 

znalazły  potwierdzenie  w  późniejszych  badaniach  z  realnymi  wypłatami,  oczywiście 

mniejszych kwot. 

Przedmiotem eksperymentalnego testu były nie tylko aksjomaty TOU, ale również jej 

aspekt deskryptywny. Wiele testów poświęcono analizie procesów dokonywania wyborów w 

warunkach ryzyka. Jedno z późniejszych studiów badało przechodniość preferencji [Loomes,. 

Starmer,  Sugden].  Uczestnicy  eksperymentu,  w  wielu  przypadkach,  bardziej  preferowali 

możliwość wygrania 8£ z prawdopodobieństwem 0,6 (p

a

=0,6;a=8£) niż opcję (p

b

=0,3;b=18£). 

Pewność  otrzymania  4£  (p

c

=1;c=4£)  była  dla  tych  samych  podmiotów  cenniejsza  niż  opcja 

(p

a

=0,6;a=8£).  Jednocześnie  jednak,  preferowali  oni  możliwość  (p

b

=0,3;b=18£)  bardziej  niż 

pewność  wygrania  4£.  Tą  nieprzechodniość  preferencji,  autorzy  tłumaczyli  preferowaniem 

bardziej prawdopodobnej wygranej, gdy różnice w ich wartości były relatywnie nieduże. Gdy 

różnica  w  wygranych  stała  się  wysoka,  górę  wziął  wybór  przynoszący  wyższą  wartość 

oczekiwaną. 

                                                 

1

  Przytoczone  niżej  wyniki  eksperymentów  pochodzą  zarówno  z  prac  psychologów  jak  i  ekonomistów. 

Eksperymenty częściej przynosiły wyniki sprzeczne z TOU niezależnie, czy przeprowadzali je ekonomiści, czy 
psychologowie. 

2

  Taka  preferencja  charakteryzuje  podmiot  unikający  ryzyka,  wybierający  mniejszą  wartość  oczekiwaną,  jeśli 

związana jest z wyższym prawdopodobieństwem osiągnięcia. 

background image

Inny 

eksperyment 

testował 

efekt 

istotności 

prawdopodobieństw. 

Gdy 

prawdopodobieństwa  wygranych  są  tak  niewielkie,  że  wydają  się  niemożliwe,  podmioty 

wybierają wygraną o wyższej wartości pomijając różnice w prawdopodobieństwach. W teście 

eksperymentalnym 

86% 

podmiotów 

wybrało 

opcję 

(p

a

=0,9;a=3 000) 

kosztem 

(p

b

=0,45;b=6 000),  jednocześnie  ci  sami  gracze  w  73%  preferowali  (p

c

=0,001;c=6 000) 

zamiast  (p

d

=0,002;d=3 000)  [Kahneman,  Tversky].  Podobne  wyniki  uzyskano  również  w 

innych eksperymentach [MacCrimmon, Larsson]. 

background image

 

Gra strategiczna i jej opis 

 

1.

 

Definicja gry 

Najpowszechniej  stosowanym  podejściem  do  definiowania  gry  strategicznej  jest 

wymienienie jej elementów składowych. Ich jednoczesne wystąpienie uprawnia do nazwania 

jakiejś sytuacji  grą strategiczną  ([Shubik, 1995, s. 1-16], [Straffin, 2001, s. 1], [Drabik, 2005, 

s. 18]  oraz  przede  wszystkim  [von  Neumann,  Morgenstern,  1944, s. 48-55])

1

.  Zgodnie  z 

powszechnie uznaną definicją z grą strategiczną (Γ) mamy do czynienia zawsze wtedy, gdy: 

a.

 

bierze w niej udział, co najmniej, dwóch graczy; zbiór graczy to N={1,2,…,n}, 

gdzie n jest liczbą naturalną nie mniejszą od dwóch, 

b.

 

kaŜdy  z  graczy  dysponuje  zbiorem  strategii  określających  jego  sposób 

rozgrywania  gry  M

i

;  zbiór  strategii  wszystkich  graczy  M  składa  się  z 

elementów  m

j

,  w  ramach  których  kaŜdy  z  graczy  jest  reprezentowany  przez 

jedną strategię; M=M

1

xM

2

x…xM

n

m

j

=[m

1j

,m

2j,…,

m

nj

c.

 

kaŜdemu  elementowi  zbioru  M  przyporządkowany  jest  n-wymiarowy  wektor 

wypłat  u(m

j

)=[u

1

(m

j

),u

2

(m

j

),…,u

n

(m

j

)];  wektor  ten  jest  nazywany  równieŜ 

wynikiem gry. 

Konkretyzacja tej definicji dla gry dwuosobowej będzie miała postać: 

a.

 

bierze w niej udział dwóch graczy; zbiór graczy to N={A,B}, 

b.

 

kaŜdy  z  graczy  dysponuje  zbiorem  strategii  określających  jego  sposób 

rozgrywania  gry:  M

a

={a

1

,a

2

,…,a

i

,…,a

m

}  i  M

b

={b

1

,b

2

,…,b

j

,…,b

n

};  zbiór 

strategii  obydwu  graczy  M  składa  się  z  elementów  m

ij

,  w  których  kaŜdy  z 

graczy jest reprezentowany przez jedną strategię; M=M

a

xM

b

m

ij

=[a

i

,b

j

], 

c.

 

kaŜdemu  elementowi  zbioru  M  przyporządkowany  jest  wynik  gry  w  postaci 

punktu  dwuwymiarowej  przestrzeni  euklidesowej  określającego  wypłaty

2

 

graczy u(m

ij

)=(u

a

(m

ij

),u

b

(m

ij

)). 

Gracze,  którzy  są  nieodzownymi  podmiotami  gry  muszą  spełniać  określoną 

charakterystykę. 

„KaŜdy 

gracz 

powinien 

dysponować 

zdefiniowanymi 

zasobami 

obejmującymi równieŜ informacje, mieć do wyboru określoną ilość sposobów postępowania, 

                                                 

1

  Alternatywnym  podejściem  jest  zdefiniowanie  gry  jako  drzewa  topologicznego  [Owen, 1975, s. 12].  Aby 

niepotrzebnie  nie  komplikować  zagadnień,  których  analiza  ma  spełniać  funkcje  pomocnicze,  autor  postanowił 
zrezygnować z tego podejścia. 

2

  W  dalszej  części  wywodu,  przez  wypłaty  graczy  naleŜy  rozumieć  doświadczane  przez  nich  uŜyteczności. 

Prezentacja  alternatywnych  koncepcji  uŜyteczności  zysków  oraz  przyjęte  załoŜenie  w  tym  zakresie  zostały 
przedstawione  w  rozdziale  2.1.1.  Rozdział  3.5.1.  został  poświęcony  znaczeniu  ekonomii  eksperymentalnej  dla 
rozwoju teorii uŜyteczności. 

background image

 

ze  szczególnym  uwzględnieniem  moŜliwości  komunikowania  się  i  porozumiewania  oraz 

wewnętrznie  spójny  system  preferencji  lub  uŜyteczności  odnoszący  się  do  uzyskiwanych 

wypłat”  [Shubik, 1995, s. 16].  Wszystkie  te  cechy  powinny  być  uwzględnione  w  obrębie 

reguł gry. Nie moŜe być tak, Ŝe istotne zróŜnicowanie graczy nie zostanie objęte regułami gry. 

Graczami mogą być osoby fizyczne, przedsiębiorstwa, instytucje, związki zawodowe, związki 

pracodawców,  państwa.  Tak  duŜe  zróŜnicowanie  jakościowe  moŜe  powodować  problemy 

metodologiczne. Jeśli na przeciw siebie staje osoba fizyczna i organizacja nieodzownym jest 

przyjęcie  załoŜenia,  Ŝe  ta  druga  równieŜ  obdarzona  jest  wolną  wolą  i  nie  ma  problemu  z  jej 

jednoznacznym wyraŜeniem. 

Niezwykle  istotnym  załoŜeniem  jest  racjonalność  graczy,  z  których  kaŜdy  „analizuje 

grę w poszukiwaniu sposobu uzyskania poŜądanego wyniku, uwzględniając fakt, Ŝe pozostali 

robią  to  samo”  [Straffin, 2001, s. 2].  Na  ogół,  racjonalność  graczy  ma  postać  występującą  w 

przypadku  podejmowania  decyzji  w  warunkach  niepewności  [Luce,  Raiffa,  1964,  s. 22]. 

Rzadziej  jest  to  racjonalność  związana  z  podejmowaniem  decyzji  w  warunkach  ryzyka. 

Dzieje się tak jedynie w przypadku tzw. gier przeciwko Naturze, w których jednym z graczy 

jest  przyroda  „dokonująca  wyborów  strategii”  z  załoŜonymi  prawdopodobieństwami 

[Straffin, 2001, ss. 74-81].  W  grach  przeciwko  Naturze  róŜnica  między  charakterem 

podmiotowym  graczy  polega  równieŜ  na  tym,  Ŝe  gracz  aktywny  osiąga  określone  wypłaty  a 

Natura  nie  [Rapoport, 1989, s. 177].  Przykładem  takiej  gry  jest  sytuacja  opisana  w  artykule 

Davenporta o rybołówstwie na Jamajce [Davenport, 1960]. 

Zdarza  się,  Ŝe  w  określonych  wynikach  gry  bardziej  lub  mniej  zainteresowany  jest 

tzw. „gracz statysta” (dummy player), który nie ma moŜliwości wpływania swoimi decyzjami 

na  nie  [Shubik, 1995, s. 18].  Dobrym  przykładem  jest  zbiorowy  konsument,  który  w  grze 

rynkowej  moŜe  osiągnąć  wyŜszą  lub  niŜszą  kwotę  nadwyŜki,  w  zaleŜności  od  wyborów 

strategii dokonywanych przez przedsiębiorstwa. Rola konsumentów sprowadza się jedynie do 

wpływu preferencji na krzywą popytu rynkowego, która z kolei staje się elementem reguł gry. 

Strategie, jakie stoją do wyboru przed kaŜdym graczem naleŜy rozumieć jako sposoby 

rozegrania gry w kompletnym zakresie, od jej rozpoczęcia aŜ do końca [Shubik, 1995, s. 34]. 

Gra  moŜe  bowiem  polegać  na  sekwencji  ruchów  decyzyjnych  przeplatanych  niekiedy 

wpływem zmiennych losowych lub na jednorazowym wyborze strategii przez graczy. 

Strategie  gracza  mogą  mieć  postać  czystą  i  występować  jako  jeden  z  elementów 

zbioru  M

i

  (np.  m

i1

  lub  m

in

).  Strategia  gracza  i  moŜe  teŜ  się  pojawić  w  postaci  mieszanej

3

                                                 

3

 O metodach wyznaczania strategii mieszanych i problemach z ich praktyczną aplikacją traktują rozdziały 1.2.2 

i 1.2.3. 

background image

 

której obraz powstaje w wyniku losowania wszystkich spośród dostępnych graczowi strategii 

„czystych”  zgodnie  z  określonym  rozkładem  prawdopodobieństwa  p

j

={p

j1

,p

j2

,...,p

jk

,...,p

jm

takim, Ŝe 0≤p

jk

1 oraz: 

=

=

m

1

k

jk

1

p

 

 

 

 

[1.1] 

gdzie  m  jest  liczbą  dostępnych  strategii  czystych.  Dla  gracza  A  strategia  mieszana  a

pj

M

pa

 

(M

pa

 to zbiór jego wszystkich strategii mieszanych), to: 

a

pj

=[p

j1

a

1

,p

j2

a

2

,...,p

jk

a

k

,...,p

jm

a

m

]. 

 

 

 

[1.2] 

Przy  takim  zdefiniowaniu  strategii  mieszanej  kaŜda  strategia  czysta  a

k

  jest  jej 

szczególną postacią, w przypadku której tylko jeden składnik rozkładu prawdopodobieństwa 

p

jk

  jest  większy  od  zera.  Wygrana  gracza  A,  jaką  uzyska  wybierając  strategię  mieszaną  a

pj

 

przy jednoczesnym wyborze strategii czystej b

j

 przez gracza B wyraŜa się formułą: 

u

a

([a

pj

,b

j

])=p

j1

u

a

([a

1

,b

j

])+p

j2

u

a

([a

2

,b

j

])+...+p

jk

u

a

([a

k

,b

j

])+...+p

jm

u

a

([a

m

,b

j

]).   

[1.3] 

Konstrukcja  strategii  mieszanej,  poŜyteczna  i  poprawna  pod  względem  formalnym, 

nastręcza  pewnych  trudności  z  praktycznego  punktu  widzenia.  Dla  ustalenia  strategii 

mieszanej  a

pj

  moŜemy  przeprowadzić  eksperyment,  w  którym  dzielimy  zbiór  moŜliwych 

wyników  pomiędzy 

m  wzajemnie  niezaleŜnych  i  wzajemnie  wykluczających  się  zdarzeń  o 

rozkładzie  prawdopodobieństwa  p

j

  [Luce, Raiffa, 1964,  s. 77].  MoŜna  do  tego  uŜyć  tablic 

losowych  lub  zaprojektować  loterię,  w  której  kolejnych 

m  zdarzeń  wystąpi  odpowiednio  z 

prawdopodobieństwami  {p

j1

,p

j2

,...,p

jk

,...,p

jm

}.  W  kolejnym  kroku  gracz  powinien  dokonać 

losowania. W losowaniu tym moŜe się okazać, Ŝe wskazana przezeń strategia czysta przynosi 

niŜszy  poziom  wygranej  niŜ  u

a

([a

pj

,b

j

])  lub  niŜszy  niŜ  inne  strategie  czyste

4

.  Osiągnięcie 

ś

redniej  wartości  wygranej  równej  u

a

([a

pj

,b

j

])  byłoby  moŜliwe  dopiero  po  przeprowadzeniu 

nieskończonej  ilości  losowań  w  opisanej  loterii.  Obrońcy  koncepcji  strategii  mieszanych 

wskazują na ich dwie istotne cechy. Po pierwsze, poszukiwanie rozwiązania gry w strategiach 

mieszanych  odbywa  się  dopiero  wtedy,  gdy  nie  moŜna  go  znaleźć  wśród  strategii  czystych. 

Po drugie, operowanie strategiami mieszanymi nie daje przeciwnikowi Ŝadnych informacji o 

tym, jakiej uŜyjemy strategii czystej [Luce, Raiffa, 1964, s. 78]. 

Teoria  gier  bada  zachowania  podmiotów  w  sytuacji  konfliktu  i  kooperacji 

[Straffin, 2001, s. 1].  Podstawowym  obszarem  zainteresowania  są  oczywiście  sytuacje 

konfliktu interesów [Malawski, Wieczorek, Sosnowska, 1997, s.12]. O konflikcie interesów w 

                                                 

4

  Luce  i  Raiffa  dają  kilka  bardzo  ciekawych  przykładów  na  praktyczne  problemy  z  wykorzystaniem  strategii 

mieszanych [Luce, Raiffa, 1964, s. 79] 

background image

 

postaci  pełnej  moŜemy  mówić  w  przypadku  gier  o  sumie  stałej

5

.  Podstawową  klasę 

reprezentującą  ten  typ  gier,  gry  o  sumie  zerowej  moŜna  zdefiniować  jako  te,  w  przypadku 

których dla kaŜdego m

j

 naleŜącego do M: 

0

)

m

(

u

j

n

1

i

i

=

=

 

 

 

 

[1.4] 

lub w przypadku gier dwuosobowych: 

u

a

(

m

ij

)+u

b

(

m

ij

)=0. 

 

 

 

 

[1.5] 

W przypadku gier o sumie zerowej wygrane graczy w ramach określonego wyniku gry 

zawsze  sumują  się  do  zera.  Związane  jest  to  z  naturalnym  konfliktem  interesów 

wykluczającym  jakiekolwiek  formy  kooperacji.  Wygrana  jednego  gracza  wiąŜe  się 

nierozerwalnie  z  przegraną  drugiego  toŜsamą,  co  do  wartości  bezwzględnej.  W 

dwuosobowych  grach  o  sumie  zerowej  nie  ma  pola  do  kooperacji.  KaŜdy  z  graczy  pragnie 

osiągnąć  jak  najwyŜszą  wygraną  uwzględniając  to  samo  dąŜenie  u  przeciwnika.  Jedynie  w 

przypadku  liczby  graczy  większej  niŜ  dwa,  moŜliwa  jest  kooperacja  poprzez  tworzenie 

koalicji pozostającej w konflikcie interesów z graczami pozostającymi poza nią. 

Alternatywa  pomiędzy  kooperacją  a  konfliktem  ma  równieŜ  szansę  pojawić  się  w 

przypadku  gier  o  sumie  róŜnej  od  zera  (lub  nie  stałej).  Jeśli  gracze  nie  mają  w  nich 

moŜliwości porozumiewania się ani zawierania wiąŜących umów przybierają one postać gier 

niekooperacyjnych  [Luce, Raiffa, 1964, s. 112],  jeśli  pojawia  się  taka  moŜliwość  moŜna 

mówić o grze kooperacyjnej. 

 

2.

 

Formy prezentacji gier 

Prezentacja  reguł  gry  moŜe  mieć  postać  opisową,  która  zawiera  wszystkie  istotne 

fakty,  zaleŜności  i  charakterystyki  istotne  dla  jej  rozegrania.  WyraŜona  zwartym  tekstem 

postać  gry  znajduje  najczęściej  zastosowanie  w  przypadku  prostych  gier,  których  reguły  nie 

wymagają  skomplikowanych  zapisów.  Przykładem  moŜe  być  gra  rynkowa  wzorowana  na 

grach rynkowych o zmiennym zakresie informacji [Kreps, 1990]. Nazwijmy ją „A vs B”. 

Gra „A vs B” 

                                                 

5

  Podstawową  klasą  tego  typu  gier  są  gry  o  sumie  zerowej,  i  tak  je  pierwotnie  nazwali  von  Neumann  i 

Morgenstern [von Neumann, Morgenstern, 1944]. Niektórzy autorzy pozostali wierni tej nazwie [Straffin, 2001], 
[Drabik, 2005],  [Luce, Raiffa, 1964],  [Owen,  1975].  Niektórzy  przyjęli  szerszy  znaczeniowo  termin  „gry  o 
sumie  stałej”  [Rapoport, 1989].  KaŜdą  grę  o  sumie  stałej  moŜna  przekształcić  liniowo  w  grę  o  sumie  zerowej 
odejmując,  od  wygranych  poszczególnych  graczy,  iloraz  stałej  sumy  wygranych  i  liczby  graczy.  Takie 
przekształcenie  pozostaje  bez  wpływu  na  wyznaczenie  równowagi  w  grze.  Ze  względu  na  powszechność 
stosowania, autor będzie posługiwał się terminem „gra o sumie zerowej”. 

background image

 

Rynek przenośnych odtwarzaczy muzyki z internetu jest opanowany przez dwie firmy 

Audioslave  i  Broadcast.  Pierwsza  specjalizuje  się  w  odtwarzaczach  popularnych,  o  niŜszej 

cenie  i  gorszych  parametrach  jakościowych.  Posiada  w  swojej  ofercie  równieŜ  bardziej 

zaawansowane technologicznie produkty. Firma Broadcast jest wyspecjalizowana w wysokiej 

jakości sprzęcie dla wyrobionych słuchaczy. Obydwie firmy pracują nad wprowadzeniem na 

rynek  nowego  mobilnego  odtwarzacza  umoŜliwiającego  ściąganie  plików  muzycznych  z 

internetu.  KaŜdy  z  konkurentów  ma  do  wyboru  produkowanie  tańszego,  ale  gorszego 

jakościowo odtwarzacza (T) lub zaawansowanego technologicznie, ale droŜszego (D). 

W sytuację rynkową wpisany jest czynnik losowy. śadna z firm nie wie czy przyszły 

popyt  na  nowy  produkt  będzie  duŜy,  czy  mały.  Mały  popyt  to  sytuacja,  w  której  udział 

koneserów zainteresowanych sprzętem wysokiej jakości w całkowitym zapotrzebowaniu jest 

większy.  O  perspektywach  rynkowych  wiadomo  jedynie,  Ŝe  duŜy  popyt  pojawi  się  z 

prawdopodobieństwem  p

d

=0,6  i  zapewni  obroty  w  wysokości  u

a

+u

b

=60  (u

a

  i  u

b

  to 

odpowiednio  wygrane  firm  Audioslave  i  Broadcast  toŜsame  ich  poziomowi  przychodów). 

Mały  popyt  moŜe  przynieść  graczom  sumę  przychodów  u

a

+u

b

=30.  Zmienna  losowa  moŜe 

wskazać  tylko  na  jeden  lub  na  drugi  z  wymienionych  rozmiarów  rynku.  Obydwie  firmy 

podejmują  decyzję  o  wyborze  profilu  produkcyjnego  jednocześnie,  nie  znając  oczywiście 

wyboru konkurenta. 

Jeśli  na  małym  rynku,  obydwie  firmy  wybiorą  strategie  a

1

=T  i  b

1

=T,  to  osiągną 

wygrane u

a

([a

1

,b

1

])=20 i u

b

([a

1

,b

1

])=10. W sytuacji, gdy na tym samym rynku zgodny wybór 

strategii  wskaŜe  na  produkowanie  wysokiej  jakości  sprzętu  (a

2

=D  i  b

2

=D),  ich  przychody 

równieŜ  będą  wynosić  u

a

([a

2

,b

2

])=20  i  u

b

([a

2

,b

2

])=10.  Wygrane  firm  w  pozostałych 

przypadkach osiągają wartości: u

a

([a

2

,b

1

])=25, u

b

([a

2

,b

1

])=5 i u

a

([a

1

,b

2

])=10, u

b

([a

1

,b

2

])=20. 

Jeśli firmom przyjdzie operować na rynku o duŜym popycie, te same wybory strategii 

przyniosą  wyŜszą  sumę  wygranych  do  podziału.  Wygrane  we  wszystkich  moŜliwych 

kombinacjach  strategii  wynosić  będą:  u

a

([a

1

,b

1

])=45  i  u

b

([a

1

,b

1

])=15,  u

a

([a

2

,b

2

])=36  i 

u

b

([a

2

,b

2

])=24, u

a

([a

2

,b

1

])=24, u

b

([a

2

,b

1

])=36 i u

a

([a

1

,b

2

])=42, u

b

([a

1

,b

2

])=18. 

Tak  zapisane  reguły  gry  podziału  rynku  miedzy  dwóch  konkurentów  zawierają  w 

sobie  wszystkie  istotne  informacje.  Gdyby  jednak  przyszło  nam  poszukać  najwłaściwszych 

strategii dla obydwu graczy, nawet bez posiadania koniecznej wiedzy na ten temat, posiłkując 

się  wyłącznie  intuicją,  sama  postać  opisowa  gry  nie  ułatwi  nam  specjalnie  zadania.  Ze 

względu  na  przydatność  w  poszukiwaniu  rozwiązań  gier  o  róŜnych  cechach  jakościowych, 

obowiązują trzy metody ich zapisu. Są to postać ekstensywna (rozwinięta), macierzowa oraz 

postać funkcji charakterystycznej. 

background image

 

Pierwsza  z  nich,  postać  ekstensywna,  to  ta,  której  podstawowym  elementem  jest 

drzewko  lub  dendryt  gry  [Malawski,  Wieczorek,  Sosnowska, 1997, s. 16].  Dendryt  gry  jest 

układem gałęzi i wierzchołków (węzłów), pokazujących wybory graczy i wskazania zmiennej 

losowej w całej partii gry. MoŜliwości, jakie stoją przed graczem w momencie dokonywania 

wyboru  nazywamy  ruchem.  Ciąg  wyborów  od  początku  gry  do  jej  końca  to  partia 

[Luce, Raiffa, 1964, s. 46]. Ten wierzchołek, do którego nie dochodzi Ŝadna gałąź to początek 

gry  a  ten,  od  którego  nie  wychodzą  juŜ  gałęzie  jest  wynikiem  gry  [ibidem,  s. 50].  Poziom 

dendrytu  gry  zawierający  jej  wyniki  oznacza  jej  koniec.  Aby  określona  konstrukcja 

topologiczna mogła być nazwana drzewkiem gry musi spełniać wyznaczone kryteria: 

a)

 

kaŜdy  wewnętrzny  węzeł  przypisany  jest  któremuś  z  graczy  (włączając  Los), 

wykonującemu z niego ruch, 

b)

 

kaŜda  z  gałęzi  wyprowadzona  w  dół  z  danego  węzła  reprezentuje  moŜliwy  wybór 

gracza, 

c)

 

kaŜdej  gałęzi  odpowiadającej  „wyborowi”  w  ramach  ruchu  Losu  przypisane  jest 

prawdopodobieństwo z jakim los dokona określonych wyborów, 

d)

 

kaŜdemu węzłowi końcowemu przypisane są wypłaty graczy, 

e)

 

wierzchołki naleŜące do danego gracza w ramach jednego ruchu podzielone są na zbiory 

informacyjne;  dokonując  wyboru  gracz  wie,  w  którym  zbiorze  informacyjnym  się 

znajduje ale nie wie, w którym z jego węzłów, 

f)

 

z kaŜdego z węzłów naleŜących do tego samego zbioru informacyjnego wyprowadzana 

jest taka sama liczba gałęzi, oznaczanych w taki sam sposób. 

Ilustrację opisu postaci ekstensywnej gry oparto na przykładzie „A vs B”. Dendryt gry 

wygląda, w tym przypadku, następująco: 

background image

 

 

Kolejność,  w  jakiej  gracze  zostali  przedstawieni  w  dendrycie  gry  nie  ma  znaczenia, 

gdy tak jak w opisywanej grze, Ŝaden z nich nie zna ani „wyboru”  Losu  ani wyboru drugiej 

strony.  Wyniki  gry,  które  pojawiają  się  na  ostatnim  poziomie  byłyby  takie  same  gdybyśmy, 

na  przykład,  zaczęli  od  węzła  firmy  Broadcast  a  skończyli  na  „wyborach”  Losu.  Wszystkie 

wierzchołki gracza Audioslave (A) tworzą jeden zbiór informacyjny, poniewaŜ nie zna on ani 

rozmiarów  rynku  ani  decyzji  konkurenta,  w  momencie  dokonywania  własnego  wyboru. 

Podobnie jest z graczem Broadcast (B). 

Dendryt gry pokazuje wszystkie ścieŜki, jakimi moŜe potoczyć się gra. Wyniki gry na 

samym  dole  dendrytu  informują  o  wygranych  graczy  według  porządku  (u

a

,u

b

).  W  naszym 

przykładzie,  jeśli  rynek  będzie  duŜy  a  obydwaj  gracze  wybiorą  produkcję  tańszego 

odtwarzacza  ([a

1

,b

1

]),  ich  wygrane  (przychody  ze  sprzedaŜy)  wyniosą  odpowiednio  u

a

=20  i 

u

b

=10. Gracz A, w ramach swojego ruchu moŜe  dokonać wyboru  a

1

 lub a

2

. Podobnie jest w 

przypadku  gracza  B.  Splot  dokonanych  przez  graczy  wyborów,  poprzedzony  nieznanym 

„wyborem” losu, decyduje o tym, która para wygranych stanie się ich udziałem. 

Prezentowany  przykład  dendrytu  gry  jest  obrazem  gry  skończonej.  Mówimy  o  grze 

skończonej wtedy, gdy jej dendryt zawiera tylko skończoną ilość wierzchołków [Owen, 1975, 

s. 15].  W  grze  skończonej  gracz  ma  równieŜ  skończoną  liczbę  strategii.  Przykład  gry 

nieskończonej to sytuacja, w której gracze podają dowolne liczby całkowite i ten, który poda 

niŜszą  płaci  jedną  jednostkę  drugiemu.  Zbiór  strategii  czystych  jest  nieskończony,  co  czyni 

taką i grę [Luce, Raiffa, 1964, s. 415]. 

 

Los 

Audioslave 

Broadcast 

mały rynek 
p

m

=0,4 

duŜy rynek 
       p

d

=0,6 

a

1

 

a

1

 

a

2

 

a

2

 

b

2

 

b

2

 

b

2

 

b

2

 

b

1

 

b

1

 

b

1

 

b

1

 

(20,10)       (10,20)       (25,5)           (20,10)       (45,15)        (42,18)    (24,36)     (36,24) 

Schemat 1.1. Dendryt gry „A vs B” 

 

Ź

ródło: opracowanie własne na podstawie [Kreps, 1990] 

background image

 

Tabela 1.1. Macierz gry dwuosobowej 
u

b

 

a

1

 

a

2

 

... 

a

i

 

... 

a

m

 

b

1

  u

b

([a

1

,b

1

])  u

b

([a

2

,b

1

]) 

... 

u

b

([a

i

,b

1

]) 

... 

u

b

([a

m

,b

1

]) 

b

2

  u

b

([a

1

,b

2

])  u

b

([a

2

,b

2

]) 

... 

u

b

([a

i

,b

2

]) 

... 

u

b

([a

m

,b

2

]) 

... 

... 

... 

... 

... 

... 

... 

b

j

  u

b

([a

1

,b

j

])  u

b

([a

2

,b

j

]) 

... 

u

b

([a

i

,b

j

]) 

... 

u

b

([a

m

,b

j

]) 

... 

... 

... 

... 

... 

... 

... 

b

n

  u

b

([a

1

,b

n

])  u

b

([a

2

,b

n

]) 

... 

u

b

([a

i

,b

n

]) 

... 

u

b

([a

m

,b

n

]) 

 

 

 

 

 

 

 

u

a

 

a

1

 

a

2

 

... 

a

i

 

... 

a

m

 

b

1

  u

a

([a

1

,b

1

])  u

a

([a

2

,b

1

]) 

... 

u

a

([a

i

,b

1

]) 

... 

u

a

([a

m

,b

1

]) 

b

2

  u

a

([a

1

,b

2

])  u

a

([a

2

,b

2

]) 

... 

u

a

([a

i

,b

2

]) 

... 

u

a

([a

m

,b

2

]) 

... 

... 

... 

... 

... 

... 

... 

b

j

  u

a

([a

1

,b

j

])  u

a

([a

2

,b

j

]) 

... 

u

a

([a

i

,b

j

]) 

... 

u

a

([a

m

,b

j

]) 

... 

... 

... 

... 

... 

... 

... 

b

n

  u

a

([a

1

,b

n

])  u

a

([a

2

,b

n

]) 

... 

u

a

([a

i

,b

n

]) 

... 

u

a

([a

m

,b

n

]) 

Ź

ródło: opracowanie własne

 

Drugą  podstawową  formą  prezentacji  gry  jest  jej  postać  macierzowa.  Jakkolwiek  jej 

przydatność ogranicza się do gier dwuosobowych

6

, bardzo ułatwia poszukiwanie rozwiązań w 

tej  klasie  gier.  Postać  macierzowa  gry  dwuosobowej  to  tabela,  której  wiersze  odpowiadają 

wyborom strategii czystych jednego gracza, a kolumny wyborom strategii czystych drugiego. 

Na  przecięciu  kaŜdej  pary  strategii  w  tabeli  pomieszczone  są  wartości  wygranych  obydwu 

graczy,  jakie  osiągają  oni  przy  koincydencji  tych  właśnie  wyborów.  Posługując  się 

oznaczeniami  z  definicji  gry  dwuosobowej  moŜemy  zbudować  jej  macierz,  jaką  pokazuje 

Tabela  1.1.  Macierz  wygranych  została  przedstawiona  w  postaci  dwumodułowej.  Jej  górny 

moduł  zawiera  wygrane  gracza,  którego  strategie  zostały  wymienione  w  wierszach  tabeli. 

Dolny  moduł  to  wygrane  drugiego  gracza,  którego  strategie  to  nagłówki  kolumn.  Takie 

podejście sprawiło, Ŝe niektórzy autorzy gry dwuosobowe o sumie róŜnej od zera i nie stałej 

nazywają  grami  dwumacierzowymi  [Drabik,  2005,  s. 68].  MoŜna  oczywiście  informacje 

zawarte  w  Tabeli  1.1  skoncentrować  w  jednym  module,  podając  w  kaŜdej  komórce  parę 

wygranych.  W  takim  wariancie  prezentacji  zawsze  jako  pierwsza  podawana  jest  wypłata 

gracza,  którego  strategie  wymienione  są  w  nagłówkach  wierszy.  Gry  dwuosobowe  o  sumie 

zerowej zapisuje się w postaci macierzy z wygranymi jednego z graczy. Taki skrócony zapis 

w  pełni  przekazuje  zaleŜność  między  wyborami  strategii  a  wygranymi  obydwu  uczestników 

gry.  Gra  o  sumie  stałej,  choć  toŜsama  liniowo  z  grą  o  sumie  zerowej,  jest  często 

                                                 

6

  O  ile  moŜna  jeszcze  sobie  wyobrazić  prostopadłościan,  podzielony  na  sześcianiki  odpowiadające  splotom 

strategii  w  grach  trzyosobowych,  to  gry  o  ilości  graczy  większej  od  trzech  nie  mogłyby  znaleźć  czytelnej 
prezentacji macierzowej. UtoŜsamienie, o którym mowa jest tak silne w literaturze tematu, Ŝe niektórzy autorzy 
nazywają gry dwuosobowe grami macierzowymi [Straffin, 2001]. 

background image

 

przedstawiana  w  postaci  dwumacierzowej,  by  ułatwić  czytelnikowi  orientację  w  zmienności 

wygranych obydwu graczy. 

Gra  „A  vs  B”  zawiera  w  swoich  regułach  wpływ  czynnika  losowego.  Gdyby  gracze 

znali  rozmiar  rynku  przed  podjęciem  decyzji  mielibyśmy  do  czynienia  z  jedną  lub  drugą 

jednoznacznie określoną macierzą wygranych. Tak nie jest, zatem wpływ ryzyka związanego 

z  kształtowaniem  się  czynnika  losowego  naleŜy  uwzględnić  poprzez  wyznaczenie  wartości 

oczekiwanych  wygranych  obydwu  graczy.  Uprawnia  nas  do  tego  przyjęcie  załoŜenia  o 

liniowej  uŜyteczności  liczbowej.  Liczymy,  więc  na  przykład:  u

a

([a

1

,b

1

])=0,4·20+0,6·45=35  a 

u

b

([a

1

,b

1

])=0,4·10+0,6·15=13. 

Tabela 1.2. Macierz gry „A vs B” 

Audioslave 

u

a

 

a

1

 

a

2

 

b

1

 

35,0 

24,4 

Broadcast 

b

2

 

29,2 

29,6 

 

Audioslave 

u

b

 

a

1

 

a

2

 

b

1

 

13,0 

23,6 

Broadcast 

b

2

 

18,8 

18,4 

Ź

ródło: opracowanie własne 

Gra w postaci funkcji charakterystycznej jest obrazem wykreowanym dla potrzeb gier 

n-osobowych.  „Oznaczmy  zbiór  wszystkich  graczy  gry  n-osobowej  przez  N={1,2,...,n}. 

KaŜdy  niepusty  podzbiór  zbioru  N  (łącznie  z  całym  N  i  zbiorami  jednoelementowymi) 

nazwiemy  koalicją.  Przez  funkcje  charakterystyczną  gry  n-osobowej  będziemy  rozumieć 

funkcję  rzeczywistą  v  określoną  dla  wszystkich  podzbiorów  zbioru  N,  która  kaŜdemu 

podzbiorowi  S

N  przyporządkowuje  wartość  maksyminową

7

  (dla  S)  w  grze  dwuosobowej 

rozgrywanej między S a N-S, przy załoŜeniu, Ŝe utworzyły się właśnie dwie koalicje” [Owen, 

1975,  s. 136].  Wartość  v(S)  oznacza  wartość  uŜyteczności,  jaką  mogą  osiągnąć  uczestnicy 

koalicji  bez  względu  na  decyzje  podmiotów  pozostających  poza  nią.  Twórcy  koncepcji 

funkcji  charakterystycznej  wymienili  trzy  cechy,  które  musi  spełniać  [von  Neumann, 

Morgenstern, 1944, s. 241]: 

v(Ø)=0; gdzie Ø to podzbiór pusty,   

 

 

[1.6] 

v(-S)=-v(S),   

 

 

 

 

[1.7] 

                                                 

7

  Pojęcie  maksyminu  gry  o  sumie  zerowej  zostanie  przedstawione  w  dalszej  części  pracy.  Tutaj  wystarczy 

powiedzieć,  Ŝe  jest  to  wartość  wygranej  v  przynoszona  przez  parę  strategii,  która  zapewnia,  Ŝe  jeden  z  graczy 
wygra, co najmniej v a drugi przegra najwyŜej v

background image

 

10 

v(S

T)≥v(S)+v(T); jeśli S

T=Ø.   

 

 

[1.8] 

W  następnym  kroku  von  Neumann  i  Morgenstern  udowodnili,  Ŝe  funkcja 

charakterystyczna spełnia warunki [1.6-1.8] dla kaŜdej gry. Prostą ilustracją koncepcji funkcji 

charakterystycznej była następująca gra [von Neumann, Morgenstern, 1944, s. 222-223]. 

Gra w dobór koalicjanta 

KaŜdy  z  trzech  graczy  (N={1,2,3})  podaje  jednocześnie,  numer  jednego  z 

pozostałych.  Jeśli  dwóch  poda,  na  wzajem,  swoje  numery  to  tworzą  koalicję  i  dzielą  po 

połowie jednostkę, którą daje im gracz pozostający poza koalicją. 

Zapis  tej  gry  w  postaci  funkcji  charakterystycznej  spełnia  wszystkie  warunki 

sformułowane przez von Neumanna i Morgensterna: 

v(Ø)=v(123)=0, 

 

 

 

 

[1.9] 

v(1)=v(2)=v(3)=-1 

 

 

 

 

[1.10] 

v(12)=v(23)=v(13)=1.  

 

 

 

[1.11] 

Na  ogół,  nie  zapisuje  się  gier  dwuosobowych  w  postaci  funkcji  charakterystycznej. 

Niemniej, dla porównania wszystkich trzech prezentowanych form zapisu gier strategicznych, 

gra „A vs B” zostanie przedstawiona równieŜ w postaci funkcji charakterystycznej

8

v(Ø)=0; v(A)=29,41; v(B)=18,59; v(AB)=48. 

 

 

[1.12] 

Jak  widać,  dla  gier  dwuosobowych,  warunek  [1.8]  przybiera  postać  równości. 

Zapisanie  gry  n-osobowej  w  postaci  funkcji  charakterystycznej  jest  moŜliwe  dopiero  po 

rozwiązaniu szeregu gier dwuosobowych. O metodach temu słuŜących będą traktowały dwie 

kolejne części pracy. 

Zanim  jednak  do  nich  przejdziemy,  sprawdźmy,  jak  na  reguły  gry  wpływa  zakres 

informacji, jakim dysponują gracze. W grze „A vs B” dokonywali oni wyborów strategii nie 

znając,  na  wzajem,  swoich  posunięć  ani  rozmiarów  rynku.  Sprawdźmy,  co  stanie  się,  jeśli 

zmienimy nieco warunki gry „A vs B”. 

Gra „A przeciw B” 

Ta  gra  opiera  się  na  zachowaniu  wszystkich,  poza  jedną  reguł  gry  „A  vs  B”. 

Zmienioną  regułą  jest  jednoczesność  wyboru  strategii.  Firma  Broadcast,  ze  względu  na 

mniejsze  rozmiary  i,  co  za  tym  idzie,  większą  elastyczność,  podejmuje  decyzję  później, 

znając juŜ wybór firmy Audioslave. 

Opisana  modyfikacja  warunków  zmieni  rozłoŜenie  zbiorów  informacyjnych  postaci 

ekstensywnej gry. Gracz B podejmuje decyzję wiedząc, czy A wybrał a

1

 czy a

2

                                                 

8

 Sposób wyznaczenia v(A) i v(B) zostanie przedstawiony w następnej części pracy. 

background image

 

11 

 

W porównaniu z grą „A vs B” sytuacja gracza A nie zmieniła się. Gracz B natomiast, 

zamiast jednego, ma dwa zbiory informacyjne. Jeden łączy wierzchołki połączone z gałęziami 

odpowiadającymi  wyborom  strategii  a

1

  (produkować  tańszy  odtwarzacz  T),  drugi  to  dwa 

wierzchołki,  do  których  dochodzą  gałęzie  a

2

  (produkować  droŜszy  odtwarzacz  D).  Wiedza 

dotycząca wyboru strategii przez gracza A modyfikuje zbiór strategii gracza B. Nie jest on juŜ 

prostą alternatywą b

1

 lub b

2

. W obecnej postaci gry, gracz B ma do wyboru cztery strategie: 

b

3

 – zawsze wybierać odtwarzacz tańszy („TT;DT”), 

b

4

 – wybierać ten sam profil produktu co A („TT;DD”), 

b

5

 – zawsze wybierać przeciwnie niŜ A („TD;DT”) 

b

6

 – zawsze wybierać odtwarzacz droŜszy („TD;DD”). 

Strategia b

3

 jest toŜsama ze strategią b

1

 z poprzedniej wersji gry. Podobnie jest z parą 

b

6

  i  b

2

.  Niemniej  dla  zaakcentowania  odmienności  gier  „A vs B”  i  „A przeciw B” 

wprowadzono odmienne oznaczenia. Postać macierzowa gry „A przeciw B” musi uwzględnić 

wzrost ilości strategii czystych gracza B oraz inne kombinacje wygranych brane do kalkulacji 

wartości oczekiwanej wypłat graczy. Na przykład, wynik gry dla kombinacji strategii [a

1

,b

5

będzie następujący u

a

([a

1

,b

5

])=0,4·10+0,6·42=29,2 i u

b

([a

1

,b

5

])=0,4·20+0,6·18=18,8. 

Los 

Audioslave 

Broadcast 

mały rynek 
p

m

=0,4 

duŜy rynek 
       p

d

=0,6 

a

1

 

a

1

 

a

2

 

a

2

 

b

2

 

b

2

 

b

2

 

b

2

 

b

1

 

b

1

 

b

1

 

b

1

 

(20,10)       (10,20)       (25,5)           (20,10)       (45,15)        (42,18)    (24,36)     (36,24) 

Schemat 1.2. Dendryt gry „A przeciw B” 

 

Ź

ródło: opracowanie własne na podstawie [Kreps, 1990] 

background image

 

12 

 

Tabela 1.3. Macierz gry „A przeciw B” 

Audioslave 

u

a

 

a

1

 

a

2

 

b

3

 

35,0 

24,4 

b

4

 

35,0 

29,6 

b

5

 

29,2 

24,4 

Broadcast 

b

6

 

29,2 

29,6 

 

Audioslave 

u

b

 

a

1

 

a

2

 

b

3

 

13,0 

23,6 

b

4

 

13,0 

18,4 

b

5

 

18,8 

23,6 

Broadcast 

b

6

 

18,8 

18,4 

Ź

ródło: opracowanie własne 

Macierze  gier  „A  vs  B”  i  „A  przeciw  B”  róŜnią  się  ze  względu  na  pojawienie  się 

nowych  wierszy  b

4

  i  b

5

.  Nowa  macierz  podległa  istotnemu  rozbudowaniu.  Zmiany  postaci 

ekstensywnej  gry  nie  są  tak  ewidentne.  W  niej,  zmianie  ulega  tylko  zakres  zbioru 

informacyjnego  jednego  gracza.  Oczywiście  to  nie  zmienia  faktu,  Ŝe  obydwie  postacie 

przedstawiają tą samą grę. 

Przykład  wpływu  zmiany  zbiorów  informacyjnych  w  grze  „A  przeciw  B”  ilustruje 

dobrze  metamorfozę,  jaką  przechodzi  obraz  gry  od  postaci  ekstensywnej  do  macierzowej. 

Wpływ  czynnika  losowego,  który  rozgałęział  dendryt  gry  zostaje  zredukowany  do  udziału 

prawdopodobieństw  w  liczeniu  wartości  oczekiwanych  wypłat  graczy.  KaŜdy  moŜliwy 

przebieg  gry,  czyli  partia  gracza  zostaje  zredukowana  do  postaci  jednej  strategii  czystej  i 

jednego  ruchu.  Konstrukcja  strategii  nie  wymaga  jakiejkolwiek  wiedzy  o  decyzjach 

przeciwnika.  Dopiero  jej  wybór,  połączony  ze  znajomością  decyzji  przeciwnika,  w  sposób 

automatyczny  dobiera  wygrane  do  policzenia  odpowiedniej  wartości  oczekiwanej.  Opisana 

procedura to „redukcja kaŜdej gry do prostej postaci standardowej, zwanej postacią normalną 

gry”  [Luce,  Raiffa,  1964,  s. 58].  Postać  normalna,  o  której  mowa,  róŜni  się  od  postaci 

macierzowej jedynie szczegółami technicznymi dotyczącymi konstrukcji tabeli. 

Idąc dalej w przemianach zakresu informacji graczy, moŜemy zbudować kolejną grę. 

Zmiana zbiorów informacyjnych gracza A powinna pociągnąć za sobą zwiększenie się liczby 

jego strategii czystych. 

Gra „A kontra B” 

background image

 

13 

Przyjmijmy  wszystkie  reguły  gry  „A  przeciw  B”  zmieniając  tylko  jedną.  Firma 

Audioslave zamówiła badanie rynku i poznała jego rozmiar przed podjęciem decyzji o profilu 

produktu. Firma Broadcast wie, Ŝe badania zostały przeprowadzone, ale nie zna ich wyniku. 

 

 

Postać  rozwinięta  gry  „A  kontra  B”  zmieni  się  w  stosunku  do  poprzedniej  wersji 

analizowanej  sytuacji  rynkowej  w  zakresie  zbioru  informacyjnego  gracza  A.  Wiedza  o 

rozmiarach  rynku  sprawi  podzieli  się  on  na  dwa  reprezentujące  odpowiednio  informacje: 

„rynek jest duŜy” lub „rynek jest mały”. 

W  porównaniu  z  grą  „A  przeciw  B”,  zbiór  strategii  gracza  B  nie  ulegnie  zmianie. 

Zbiór  strategii  gracza  A  musi  zostać  zbudowany  z  uwzględnieniem  zmian  w  zakresie 

informacji. Nowe strategie budowane są przed zdobyciem wiedzy o rozmiarach rynku, ale w 

swojej  istocie  muszą  ją  uwzględniać.  W  obecnej  postaci  gry,  gracz  A  ma  do  wyboru  cztery 

strategie: 

a

3

 – niezaleŜnie od rozmiarów rynku wybierać odtwarzacz tańszy („mT;dT”), 

a

4

 – wybrać tańszy na mały rynek i droŜszy na duŜy („mT;dD”), 

a

5

 – wybrać droŜszy na mały rynek i tańszy na duŜy („mD;dT”), 

a

6

 – zawsze wybierać odtwarzacz droŜszy („mD;dD”). 

Nie  potrzeba  głębszej  analizy,  aby  zauwaŜyć,  Ŝe  najniŜsze  wygrane  powinna  przynosić 

strategia a

4

. Polega ona na wejściu z tanim odtwarzaczem na mały rynek, na którym dominują 

audiofile  lub  z  drogim  odtwarzaczem  na  rynek  duŜy,  który  oczekuje  tzw.  „sprzętu  dla 

Los 

Audioslave 

Broadcast 

mały rynek 
p

m

=0,4 

duŜy rynek 
       p

d

=0,6 

a

1

 

a

1

 

a

2

 

a

2

 

b

2

 

b

2

 

b

2

 

b

2

 

b

1

 

b

1

 

b

1

 

b

1

 

(20,10)       (10,20)       (25,5)           (20,10)       (45,15)        (42,18)    (24,36)     (36,24) 

Schemat 1.3. Dendryt gry „A kontra B” 

 

Ź

ródło: opracowanie własne na podstawie [Kreps, 1990] 

background image

 

14 

kaŜdego”.  NajwyŜsze  wygrane  powinien,  zatem  przynieść  graczowi  A  wybór  strategii  a

5

Zapis macierzowy gry „A kontra B” potwierdza te przypuszczenia. 

Tabela 1.4. Macierz gry "A kontra B" 

Audioslave 

u

a

 

a

3

 

a

4

 

a

5

 

a

6

 

b

3

 

35,0 

22,4 

37,0 

24,4 

b

4

 

35,0 

29,6 

35,0 

29,6 

b

5

 

29,2 

18,4 

35,2 

24,4 

Broadcast 

b

6

 

29,2 

25,6 

33,2 

29,6 

Audioslave 

u

b

 

a

3

 

a

4

 

a

5

 

a

6

 

b

3

 

13,0 

25,6 

11,0 

23,6 

b

4

 

13,0 

18,4 

13,0 

18,4 

b

5

 

18,8 

29,6 

12,8 

23,6 

Broadcast 

b

6

 

18,8 

22,4 

14,8 

18,4 

Ź

ródło: opracowanie własne 

Podobnie, jak w przypadku przejścia od gry „A vs B” do gry „A przeciw B” macierz 

gry „A kontra B” róŜni się od poprzedniej pojawieniem się dwóch dodatkowych kolumn a

4

 i 

a

5

9

.  Gdybyśmy  z  tej  macierzy  usunęli  wszystkie  komórki  poza  naroŜnikowymi, 

otrzymalibyśmy macierz gry, od której zaczynaliśmy („A vs B”). 

 

1.

 

Gry o sumie zerowej 

 

1.1.4.

 

Punkt siodłowy jako rozwiązanie w strategiach czystych 

Natura gier o sumie zerowej

10

 przejawia się w ich ściśle konkurencyjnym charakterze 

[Luce, Raiffa, 1964, s. 64]. Jest on widoczny w czystej postaci, jeśli mamy do czynienia z grą 

dwuosobową.  Zwiększenie  ilości  graczy  do  n>2  stwarza  moŜliwość  dla  budowania  koalicji, 

co zmienia naturę sytuacji strategicznych opisywanych grami o sumie zerowej. Ścisły konflikt 

interesów  ustępuje  miejsca  wyborowi  między  koalicjami.  Oczywiście  suma  wygranych 

koalicji i jej dopełnienia nadal jest zerowa, ale sytuacja pojedynczego gracza jest inna niŜ w 

przypadku gry dwuosobowej. Z tej przyczyny, oraz ze względu na przedmiot zainteresowania 

zasadniczej części pracy uwaga zostanie skoncentrowana na grach dwuosobowych. 

Ś

cisły  konflikt  interesów  połączony  z  dokonywaniem  wyborów  w  warunkach 

niepewności  przynosi  szczególną  konstrukcję  sytuacji  decyzyjnej.  DąŜąc  do  maksymalnej 

                                                 

9

 Strategia a

3

 jest toŜsama z a

1

 a a

6

 z a

2

. Analogicznie jak w przypadku gracza B. 

10

  Przypomnijmy,  Ŝe  prawie  wszystkie  obserwacje  dotyczące  tej  klasy  gier  moŜna  rozciągnąć  na  szerszą 

kategorię gier o sumie stałej. 

background image

 

15 

wygranej  gracz  moŜe  doprowadzić  do  bardzo  niepoŜądanego  wyniku.  Dokonując  wyborów 

strategii  kaŜdy  z  graczy  musi  mieć  świadomość  tego,  Ŝe  przeciwnik  pośrednio  ma  na  celu 

minimalizację  jego  wygranej.  Racjonalnym  jest  zatem  dokonywanie  takich  wyborów,  które 

uchronią  od  jak  najwyŜszych  przegranych.  Gdyby  posłuŜyć  się  terminologią  wojskową,  w 

grach  o  sumie  zerowej  naleŜy  stosować  strategie  minimalizacji  strat.  Przyjrzyjmy  się 

przykładowi następującej gry. 

„Walka o rynek 1” 

Dwa przedsiębiorstwa walczą o udział w rynku lokalnym. KaŜde z nich ma do wyboru 

trzy  strategie  tzw.  mixu  marketingowego.  W  zaleŜności  od  tego,  jakie  wybiorą  strategie, 

mogą  stracić  lub  zyskać  kosztem  konkurenta  określoną  część  rynku  mierzoną  w  punktach 

procentowych.  Wyniki  przyporządkowania  wygranych  graczy  parom  strategii  przedstawia 

Tabela 1.5. 

 

Tabela 1.5. Macierz gry "Walka o rynek 1" 

u

b

 

a

1

 

a

2

 

a

3

 

b

1

 

2% 

1% 

2% 

b

2

 

-4% 

-1% 

3% 

b

3

 

2% 

-2% 

-1% 

Ź

ródło: opracowanie własne 

Gdyby gracz B postawił sobie za cel odebranie konkurentowi największej, moŜliwej w 

tej grze, części rynku (u

b

=3%), musiałby wybrać strategię b

2

. Jednak, jeśli jednocześnie gracz 

A wybierze strategię a

1

, udziałem B stanie się maksymalna moŜliwa utrata części rynku, czyli 

u

b

=-4%. Gdyby podobnym dąŜeniem kierował się gracz A, mogłoby się skończyć utratą 2% 

rynku.  Teoria  gier  nie  daje  odpowiedzi  jak  powinien  postąpić  gracz,  aby  osiągnąć  jak 

najwyŜszą wygraną w grze o sumie zerowej. MoŜe jednak wskazać sposób wyboru strategii, 

który  zapewni  pewien  minimalny  poziom  wygranej,  lub  patrząc  z  innego  punktu  widzenia, 

maksymalny poziom przegranej. 

JuŜ  von  Neumann  i  Morgenstern  w  swoim  kanonicznym  dziele  sformułowali 

postulaty, których spełnienie powinno towarzyszyć odnajdywaniu rozwiązań w grach o sumie 

zerowej.  Jednym  z  nich  jest  dominacja  strategii.  Jeśli  strategia

11

  a

d

  przynosi,  co  najmniej, 

takie  same  wygrane  jak  inna  strategia  a

z

,  niezaleŜnie  od  wyboru  pozostałych  graczy,  a 

                                                 

11

  Von  Neumann  i  Morgenstern  definiując  dominację  posłuŜyli  się  terminem  „imputacja”  czyli  n-wymiarowy 

wektor  wypłat  wszystkich  graczy  spełniający  kryteria  indywidualnej  i  zbiorowej  racjonalności  w  grach  n-
osobowych.  W  wielu  pracach  powstałych  później,  w  przypadku  gier  dwuosobowych,  operuje  się  definicją 
dominacji strategii [Owen, 1975, s. 31] [Straffin,2001, s. 7] i to podejście zostało przyjęte przez autora. 

background image

 

16 

przynajmniej  w  jednym  wypadku  wyŜszą  to,  moŜemy  powiedzieć,  Ŝe  a

d

  dominuje  a

z

,  lub  a

z

 

jest  zdominowane  przez  a

d

  [von Neumann, Morgenstern, 1944, s. 37].  W  przypadku  gier 

dwuosobowych,  opisana  dominacja  ma  miejsce  wtedy,  i  tylko  wtedy,  gdy  dla  kaŜdego 

b

j

M

b

])

b

,

a

([

u

]

b

,

a

([

u

j

z

a

j

d

a

 

 

 

 

[1.13] 

i istnieje co najmniej jedno b

k

M

b

, Ŝe: 

])

b

,

a

([

u

]

b

,

a

([

u

k

z

a

k

d

a

>

.   

 

 

 

[1.14] 

Analogicznie  moglibyśmy  zdefiniować  dominację  w  obrębie  zbioru  strategii  gracza  B. 

Racjonalnie  zachowujący  się  gracz  nigdy  nie  wybierze  strategii  zdominowanej

12

.  Postulat 

dominacji  pozwala  na  ograniczenie  zbioru  strategii  podczas  poszukiwania  rozwiązania  gry. 

MoŜna z niego usunąć wszystkie strategie zdominowane. 

Tabela 1.6. Wyznaczanie wartości gry "Walka o rynek 1" 

u

b

 

a

1

 

a

2

 

a

3

 

a

M

i

a

min

 

b

1

 

2% 

1% 

2% 

1% 

b

2

 

-4% 

-1% 

3% 

-4% 

a

M

i

a

b

M

j

b

min

max

 

b

3

 

2% 

-2% 

-1% 

-2% 

1% 

b

M

bj

max

 

2% 

1% 

3% 

b

M

j

b

a

M

i

a

max

min

 

1% 

 

Ź

ródło: opracowanie własne 

Postulowany  sposób  rozwiązywania  gier  wykorzystuje  pojęcie  maksyminu

13

  [von 

Neumann,  Morgenstern,  1944,  s. 89-93].  Maksyminem  gry  dwuosobowej  o  sumie  zerowej 

nazywamy, taką wartość v

b

, Ŝe: 

])

b

,

a

([

u

min

max

v

j

i

b

a

M

i

a

b

M

j

b

b

=

   

 

 

 

[1.15] 

Maksymin  gry  jest  wskazaniem  strategii  gracza  B  przynoszącym  najwyŜszą  z  najniŜszych 

wygranych,  jakie  poszczególne  strategie  tego  gracza  mogą  przynieść.  Innymi  słowy,  dla 

kaŜdej  strategii  gracza  B  odnajdujemy  najniŜszą  wartość,  zakładając,  Ŝe  gracz  A  będzie 

odpowiadał  w  sposób  najkorzystniejszy  dla  siebie.  Spośród  wszystkich,  tak  wskazanych 

minimów,  wybieramy  największe.  W  grze  „Walka  o  rynek  1”  maksyminem  jest 
                                                 

12

  Niektórzy  autorzy  dzielą  dominacje  na  słabą,  zgodną  z  nierównością  [1.13]  i  ostrą,  w  przypadku  której  ta 

nierówność  przybiera  postać  ostrą  [Drabik,  2005,  s. 34].  Nie  zmienia  to  praktycznego  wymiaru  dominacji. 
Strategia  zdominowana  nie  wejdzie  w  skład  rozwiązania  niezaleŜnie  od  tego,  czy  jest  to  nierówność  ostra  czy 
nieostra. 

13

 Matematyczną koncepcję maksyminu przedstawił po raz pierwszy E. Borel [Borel, 1921]. Von Neumannowi 

przypisuje  się  jej  pionierskie  wykorzystanie  w  sformułowaniu  twierdzenia  maksyminowego  dla  gier  o  sumie 
zerowej [von Neumann, 1928]. 

background image

 

17 

v

b

=u

b

([a

2

,b

1

])=1%.  Gracz  B,  wybierając  strategię  b

1

,  czyli  swoją  strategię  maksyminową, 

zapewnia sobie, Ŝe wygra, co najmniej, 1% rynku. 

Z  punktu  widzenia  gracza  A,  interesująca  jest  inna  postać  tej  samej  kategorii  teorii 

gier.  śeby  zapewnić  sobie  minimalny  poziom  wygranej  A  musi  wybierać  strategię  tak,  aby 

gracz  B  wybierając  najkorzystniej  dla  siebie,  osiągnął  najniŜszą  z  najwyŜszych  wygranych. 

Gracz  A  powinien  się  kierować  kryterium  minimaksu.  Minimaksem  gry  dwuosobowej  jest 

taka wartość gry v

a

, Ŝe: 

])

b

,

a

([

u

max

min

v

j

i

b

b

M

j

b

a

M

i

a

a

=

   

 

 

[1.16] 

W  grze  „Walka  o  rynek  1”,  minimaksem  gry  jest  v

a

=u

b

([a

2

,b

1

])=1%.  Gracz  A 

wybierając strategię minimaksową a

2

  gwarantuje sobie, Ŝe nie przegra więcej niŜ 1% rynku. 

Wyznaczenie  maksyminu  i  minimaksu  gry  pozwala  wyznaczyć  poziomy  bezpieczeństwa 

obydwu  graczy.  Strategia  maksyminowa  jest  nazywana  równieŜ  strategią  bezpieczeństwa 

[Luce,  Raiffa,  1964,  s. 70].  Wybierając  ją,  gracz  zapewnia  sobie  bezpieczeństwo 

maksymalizacji  minimalnego  poziomu  wygranej  równego  v

b

.  Wygrane  v

a

  i  v

b

  nazywane  są 

równieŜ, odpowiednio dolną i górną wartością gry [Drabik, 2005, s. 31-32]. 

Łatwo udowodnić, Ŝe minimaks gry dwuosobowej o sumie zerowej jest równy, co do 

bezwzględnej  wartości  i  przeciwny,  co  do  znaku,  jej  maksyminowi  na  wygranych  drugiego 

gracza [von Neumann, Morgenstern, 1944, s. 109]: 

])

b

,

a

([

u

min

max

])

b

,

a

([

u

max

min

v

j

i

a

a

M

i

a

b

M

j

b

j

i

b

b

M

j

b

a

M

i

a

a

=

=

 

[1.17] 

])

b

,

a

([

u

max

min

])

b

,

a

([

u

min

max

v

j

i

a

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

b

=

=

 

[1.18] 

Gra  „Walka  o  rynek  1”  jest  przykładem  konfliktu  interesów,  w  którym  maksymin 

zrównuje się z minimaksem: 

v

v

])

b

,

a

([

u

max

min

])

b

,

a

([

u

min

max

v

a

j

i

b

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

b

=

=

=

=

 

 

[1.19] 

Jeśli  mamy  do  czynienia  z  taką  sytuacją,  oznacza  to,  Ŝe  gra  posiada  punkt  siodłowy 

[von Neumann,  Morgenstern,  1944,  s. 95].  Jednocześnie  taką  grę  moŜna  określić  jako  ściśle 

określoną  [von Neumann,  Morgenstern,  1944,  s. 106].  Punkt  siodłowy  w  grach 

dwuosobowych  o  sumie  zerowej  to  taka  para  strategii,  przy  której  zachodzi  warunek  [1.19]. 

Wygrana „v” w punkcie siodłowym nazywana jest wartością gry. Jest ona jednocześnie równa 

lub wyŜsza od pozostałych w kolumnie i niŜsza lub równa od pozostałych w wierszu

14

. Punkt 

siodłowy w grach o sumie zerowej traktujemy jako rozwiązanie gry w strategiach czystych, a 

                                                 

14

 Oczywiście mówimy o macierzy wygranych gracza, którego strategie stanowią nagłówki wierszy. 

background image

 

18 

strategię  nań  się  składające  jako  optymalne  strategie  czyste  graczy.  Niektórzy  autorzy 

definiują rozwiązanie dwuosobowej gry o sumie zerowej jako trzyelementowy zbiór: wartość 

gry oraz optymalne strategie graczy [Straffin, 2001, s. 17]. 

Wróćmy  na  moment  do  gry  „A  przeciw  B”,  którą  pozostawiliśmy  bez  rozwiązania. 

Jest to gra o sumie stałej toŜsama liniowo z grą o sumie zerowej opisaną Tabelą 1.7, która ma 

punkt  siodłowy  w  strategiach  [a

1

,b

5

]  (Audioslave  produkuje  odtwarzacz  tańszy  a  Broadcast 

wybiera inaczej od konkurenta). W tym rozwiązaniu gracze dzielą się oczekiwaną wartością 

rynku  w  sposób  następujący:  u

a

([a

1

,b

5

])=29,2  i  u

b

([a

1

,b

5

])=18,8.  Te  same  wygrane  staną  się 

udziałem  graczy,  jeśli  wybiorą  strategie  [a

1

,b

6

].  Nie  jest  to  jednak  punkt  siodłowy, 

u

b

’([a

1

,b

6

])=-5,2  nie  jest  wartością  najniŜszą  w  wierszu  i  najwyŜszą  w  kolumnie.  Ponadto, 

jeśli  przed  wyznaczeniem  maksyminu  i  minimaksu  wykorzystamy  kryterium  dominacji  to 

okaŜe się, Ŝe strategia b

5

 dominuje wszystkie pozostałe, co czyni wybór gracza B trywialnym. 

Gracz  A  zna  macierz  wygranych,  zatem  pozostaje  mu  wybór  najlepszej  odpowiedzi  na  b

5

czyli a

1

Tabela 1.7. Wyznaczenie punktu siodłowego gry "A przeciw B" 

u

b

’ 

a

1

 

a

2

 

a

M

i

a

min

 

b

3

 

-11 

-0,4 

-11 

b

4

 

-11 

-5,6 

-11 

b

5

 

-5,2 

-0,4 

-5,2 

a

M

i

a

b

M

j

b

min

max

 

b

6

 

-5,2 

-5,6 

-5,6 

-5,2 

b

M

bj

max

 

-5,2 

-0,4 

b

M

j

b

a

M

i

a

max

min

 

-5,2 

 

Ź

ródło: opracowanie własne

 

Aby  dopełnić  powinności  wyznaczenia  punktu  siodłowego  w  grze,  która  była 

rozwinięciem  „A  przeciw  B”  ponownie  dokonano  przekształcenia  liniowego  macierzy 

wygranych z Tabeli 4. Powstała gra o sumie zerowej ma jeden punkt siodłowy w strategiach 

[a

5

,b

6

]. Wartością gry jest: 

2

,

9

])

b

a

([

'

u

])

b

,

a

([

'

u

max

min

])

b

,

a

([

'

u

min

max

v

6

,

5

b

j

i

b

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

=

=

=

=

  

[1.20] 

Taka wartość gry oznacza podział rynku: u

a

([a

5

,b

6

])=33,2 i u

b

([a

5

,b

6

])=14,8. 

Wykorzystanie  kryterium  dominacji  prowadzi,  tym  razem,  gracza  A  do 

jednoznacznego  wyboru  strategii  a

5

,  która  dominuje  wszystkie  pozostałe.  Graczowi  B 

pozostaje wybrać b

6

, która jest jego najlepszą odpowiedzią na a

5

. Znalezione rozwiązania gier 

„A przeciw B” i „A kontra B” wskazują, Ŝe graczowi A, czyli firmie Audioslave, opłaca się 

background image

 

19 

zapłacić  za  badania  rynku  tylko  wtedy,  gdy  ich  cena  nie  będzie  większa  od  czterech 

(u

a

([a

5

,b

6

])-u

a

([a

1

,b

5

])=33,2-29,2=4). 

Tabela 1.8. Wyznaczenie punktu siodłowego w grze "A kontra B" 

u

b

 

a

3

 

a

4

 

a

5

 

a

6

 

a

M

i

a

min

 

b

3

 

-11 

1,6 

-13 

-0,4 

-13 

b

4

 

-11 

-5,6 

-11 

-5,6 

-11 

b

5

 

-5,2 

5,6 

-11,2 

-0,4 

-11,2 

a

M

i

a

b

M

j

b

min

max

 

b

6

 

-5,2 

-1,6 

-9,2 

-5,6 

-9,2 

-9,2 

b

M

bj

max

 

-5,2 

5,6 

-9,2 

-0,4 

 

 

b

M

j

b

a

M

i

a

max

min

 

-9,2 

 

 

Ź

ródło: opracowanie własne 

Zdarza się, Ŝe w grach dwuosobowych o sumie zerowej są dwa punkty siodłowe. Taka 

sytuacja  oczywiście  moŜe  mieć  miejsce,  ale  zawsze  są  to  rozwiązania  ekwiwalentne  i 

zamienne.  „KaŜde  dwa  punkty  siodłowe  tej  samej  gry,  mają  tą  samą  wartość.  Jeśli  zarówno 

gracz  A  jak  i  gracz  B  wybiorą  strategie  zawierające  punkty  siodłowe,  to  wynik  gry  zawsze 

będzie punktem siodłowym” [Straffin, s. 10]. 

Tabela 1.9. Wyznaczanie wartości gry "Walka o rynek 2" 

u

b

 

a

1

 

a

2

 

a

3

 

a

M

i

a

min

 

b

1

 

3% 

1% 

2% 

1% 

b

2

 

-4% 

-1% 

4% 

-4% 

a

M

i

a

b

M

j

b

min

max

 

b

3

 

2% 

1% 

3% 

1% 

1% 

b

M

bj

max

 

3% 

1% 

4% 

b

M

j

b

a

M

i

a

max

min

 

1% 

 

Ź

ródło: opracowanie własne 

Poszukiwanie  punktu  siodłowego  w  grze  „Walka  o  rynek  2”

15

  przyniosło  podwójne 

wskazanie. Niezmieniona, w porównaniu z grą „Walka o rynek 1”, wartość gry v=1% pojawia 

się dla dwóch par strategii: 

%

1

])

b

a

([

u

])

b

a

([

u

])

b

,

a

([

u

max

min

])

b

,

a

([

u

min

max

v

3

,

2

b

1

,

2

b

j

i

b

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

=

=

=

=

=

       [1.21] 

Gra „Walka o rynek 2” ma dwa punkty siodłowe. Zgodnie z twierdzeniem o ekwiwalentności 

i  zamienności,  graczom  obojętne  jest,  w  którym  z  punktów  siodłowych  przyjdzie  im  się 

znaleźć. 

                                                 

15

 „Walka o rynek 2” róŜni się od pierwszej wersji tylko macierzą wypłat. 

background image

 

20 

Oczywiście, liczba punktów siodłowych równa dwa nie jest limitem ich liczebności w 

jednej  grze.  Wystarczy  wyobrazić  sobie  grę,  w  której  nieparzyste  wiersze  macierzy 

zawierałyby  wyłącznie  wypłaty  większe  od  v  w  nieparzystych  kolumnach  lub  równe  v  w 

parzystych.  Parzyste  wiersze  zaś  powinny  zawierać  wyłącznie  wygrane  niŜsze  od  v.  Liczba 

punktów siodłowych 

Ψ

, jakie posiada ta gra moŜna byłoby określić wzorem: 

)

(

E

)

(

E

)

n

,

m

(

2

1

n

2

m

+

=

Ψ

 

 

 

 

[1.22] 

gdzie m to liczba strategii gracza A (kolumny) a n to ilość strategii gracza B (wiersze), E zaś 

jest  funkcją  przyporządkowującą  kaŜdej  liczbie  rzeczywistej  jej  część  całkowitą. 

Wystarczyłoby,  Ŝeby  tylko  jedna  z  liczby  strategii  zmierzała  do  nieskończoności,  a  taka  gra 

miałaby nieskończoną ilość punktów siodłowych. 

 

1.1.5.

 

Rozwiązanie w strategiach mieszanych; twierdzenie maksyminowe 

W  praktyce  moŜemy  mówić  o  duŜym  szczęściu,  jeśli  uda  się  znaleźć,  chociaŜ  jeden 

punkt  siodłowy.  Większość  gier,  z  jakimi  mamy  do  czynienia,  nie  ma  Ŝadnego  punktu 

siodłowego,  toŜsamego  z  rozwiązaniem  w  strategiach  czystych.  Z  taką  grą  juŜ  mieliśmy  do 

czynienia. Przypomnijmy sobie grę „A vs B” w postaci macierzowej (Tabela 1.2). Odejmując 

od  wygranych  obydwu  graczy  24  (połowa  wartości  oczekiwanej  rynku),  otrzymamy  grę  o 

sumie zerowej. 

Warunek [1.19] nie jest spełniony w przypadku tej gry. Von Neumann i Morgenstern 

zdefiniowali  takie  gry  jako  nie  ściśle  określone.  W  ich  przypadku  v

b

v

a

  [von Neumann, 

Morgenstern,  1944,  s. 110].  To  nie  oznacza,  Ŝe  nie  posiadają  one  rozwiązań.  NaleŜy  ich 

poszukiwać  innymi  metodami.  NiezaleŜnie  od  tego,  jaką  wybierzemy  metodę,  w  skład 

rozwiązania nie będzie juŜ wchodzić para strategii czystych. Koniecznym będzie rozszerzenie 

przynajmniej jednego zbioru strategii o ich mieszaną postać. 

 

Tabela 1.10. Gra "A vs B" przekształcona liniowo 

u

b

a

1

 

a

2

 

a

M

i

a

min

 

b

1

 

-11 

-0,4 

-11 

a

M

i

a

b

M

j

b

min

max

 

b

2

 

-5,2 

-5,6 

-5,6 

-5,6 

b

M

bj

max

 

-5,2 

-0,4 

 

 

b

M

j

b

a

M

i

a

max

min

 

-5,2 

 

 

Ź

ródło: obliczenia własne 

background image

 

21 

Znalezienie  optymalnej  strategii  mieszanej,  dla  kaŜdego  z  obydwu  graczy,  polega  na 

wyznaczeniu  takiej,  która  spełniać  będzie  analogiczną  rolę  jak  czysta  strategia  optymalna  w 

grach z punktem siodłowym. Aby tego dokonać naleŜy wyznaczyć zbiór prawdopodobieństw, 

który  wyznaczy  taką  strategię  mieszaną,  Ŝe  nie  będzie  moŜna  znaleźć  innej,  gwarantującej 

wyŜszy poziom wygranej niezaleŜnie od wyborów drugiego gracza. 

Dowolna  strategia  mieszana  gracza  A  zbudowana  z  m  strategii  czystych  i  rozkładu 

prawdopodobieństwa  p

j

={p

j1

,p

j2

,...,p

jk

,...,p

jm

}  takiego,  Ŝe  0≤p

jk

1  oraz 

=

=

m

1

k

jk

1

p

,  to 

a

pj

=[p

j1

a

1

,p

j2

a

2

,...,p

jk

a

k

,...,p

jm

a

m

].  Analogicznie  moŜemy  zdefiniować  postać  ogólną  strategii 

mieszanej  gracza  B  (b

qi

M

qb

)  jako  b

qi

=[q

i1

b

1

,q

i2

b

2

,...,q

il

b

l

,...,q

in

b

n

]  (0≤q

il

1  oraz 

=

=

n

1

l

il

1

q

). 

Spośród  wszystkich  strategii  mieszanych  a

pj

M

pa

  i  b

qi

M

qb

,  optymalnymi  a

po

  i  b

qo

  będą  te, 

które spełnią warunki: 

])

b

,

a

([

u

inf

sup

])

b

,

a

([

u

v

qi

pj

b

pa

M

pj

a

qb

M

qi

b

qo

pj

b

qb

=

=

,   

 

[1.23] 

])

b

,

a

([

u

sup

inf

])

b

,

a

([

u

v

qi

pj

b

qb

M

qi

b

pa

M

pj

a

qi

po

b

pa

=

=

,   

 

[1.24] 

gdzie: 

v

qb

 – dolna wartość gry w strategiach mieszanych, 

v

pa

 – górna wartość gry w strategiach mieszanych, 

sup – kres górny zbioru wypłat generowanych przez strategie mieszane, 

inf – kres dolny zbioru wypłat generowanych przez strategie mieszane

16

Inaczej  rzecz  ujmując,  moŜemy  stwierdzić,  Ŝe  wyznaczenie  optymalnej  strategii 

mieszanej  polega  na  znalezieniu  takich  prawdopodobieństw  losowania  strategii,  by  drugi  z 

graczy  nie  mógł  przekroczyć  pewnego  maksymalnego  poziomu  wygranej,  niezaleŜnie  od 

tego, jaką strategię czystą wybierze. I odwrotnie, gracz, którego wygrane opisane są macierzą 

gry będzie szukał takich prawdopodobieństw, by zapewnić sobie minimalny poziom wypłaty 

niezaleŜnie  od  wyborów  przeciwnika.  Optymalna  strategia  mieszana  wyznaczona  w  tym 

drugim  przypadku  musi  przynieść  maksymalną  v

qb

  spełniającą  układ  warunków 

przedstawiony niŜej. 

                                                 

16

 W ślad za E. Drabik zastąpiono pojęcia „max” i „min” by zaakcentować odmienność gier ściśle określonych 

od gier nie ściśle określonych [Drabik, 2005, s. 36]. 

background image

 

22 



=

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

1

q

0

1

q

...

q

...

q

q

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

...

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

...

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

il

in

il

i2

i1

qb

n

m

b

in

l

m

b

il

2

m

b

i2

1

m

b

i1

qb

n

k

b

in

l

k

b

il

2

k

b

i2

1

k

b

i1

qb

n

2

b

in

l

2

b

il

2

2

b

i2

1

2

b

i1

qb

n

1

b

in

l

1

b

il

2

1

b

i2

1

1

b

i1

        [1.25] 

Dwuosobowe  gry  o  sumie  zerowej,  bez  punktów  siodłowych,  o  dwuelementowych 

zbiorach 

strategii 

czystych, 

moŜemy 

zawsze 

rozwiązać 

wykorzystując 

metodę 

przyrównywania  [Shubik, 1995, s. 222].  Wybierając  swoją  optymalną  strategię  mieszaną, 

gracz  zapewnia  sobie,  Ŝe  przeciwnik  nie  odniesie  Ŝadnej  korzyści  z  poznania  jej  [Straffin, 

2001,  s. 15].  Postawmy  się  na  miejscu  gracza  B  w  grze  „A  vs  B”.  Musi  on  wybrać  takie 

prawdopodobieństwa q

1

 i q

2

 losowania strategii b

1

 i b

2

, aby gracz A nie mógł odnieść korzyści 

z wiedzy o jego wyborze strategii mieszanej. Dzieje się tak wtedy, gdy: 



=

+

+

=

+

=

1

q

0

1

q

q

])

b

,

a

([

'

u

q

])

b

,

a

([

'

u

q

])

b

,

a

([

'

u

q

])

b

,

a

([

'

u

q

)

a

(

EV

)

a

(

EV

i

2

1

2

2

b

2

1

2

b

1

2

1

b

2

1

1

b

1

2

1

[1.26] 

W analizowanej grze ten warunek daje się sprowadzić do równania: 

)

q

1

(

6

,

5

q

4

,

0

)

q

1

(

2

,

5

q

11

1

1

1

1

=

,   

 

 

[1.27] 

którego  rozwiązaniem  jest 

55

2

1

q

=

.  Optymalną  strategią  mieszaną  gracza  B  jest 

b

qo

=[

55

2

b

1

,

55

53

b

2

]. Przynosi ona dolną wartość gry w strategiach mieszanych: 

41

,

5

)

6

,

5

(

)

4

,

0

(

)

2

,

5

(

)

11

(

v

55

53

55

2

55

53

55

2

qb

=

+

=

+

=

.   

 

[1.28] 

Wybór  optymalnej  strategii  przez  gracza  B  oznacza  podział  wartości  oczekiwanej 

rynku, przy którym firma Audioslave osiąga przychód u

a

=29,41 a firma Broadcast u

b

=18,59. 

Wybierając optymalną strategię mieszaną gracz B gwarantuje sobie, Ŝe osiągnie przychód, co 

najmniej  równy  18,59,  niezaleŜnie  od  wyboru  strategii  przez  gracza  A.  Porównanie 

uzyskanego  wyniku  z  rozwiązaniem  gry  „A  przeciw  B”  (u

b

=18,8)  pokazuje,  Ŝe  znajomość 

decyzji konkurenta pozwala firmie Broadcast zagwarantować sobie wygraną wyŜszą o 0,21. 

background image

 

23 

Wykres 1.1. Graficzna interpretacja metody przyrównań dla gry "A vs 

B" przekształconej liniowo (v

qb

)

-12

-11

-10

-9

-8

-7

-6

-5

-4

-3

-2

-1

0

1

2

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

q

1

EV

EV(a

1

)

EV(a

2

)

2

/

55

v

qb

 

Ź

ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366] 

Dolna  wartość  gry  w  strategiach  mieszanych  niesie  z  sobą  podobną  interpretację  jak 

maksymin  w  grach  ściśle  określonych.  Jest  to  dobrze  widoczne  na  wykresie  obrazującym 

działanie metody przyrównywania. Gracz A, znając wybraną przez B strategię mieszaną, dla 

kaŜdego q

1

55

2

, mógłby tak dobierać swoją strategię czystą, aby B osiągał wygrane mniejsze 

od  v

qb

=-5,41.  Dla  q

1

>

55

2

  wybierałby  a

1

,  a  gdy  q

1

<

55

2

,  a

2

.  Tylko  wybór  optymalnej  strategii 

mieszanej, opartej na q

1

=

55

2

 gwarantuje, Ŝe wygrana B nie będzie niŜsza niŜ v

qb

=-5,41. 

Analogicznie  wyznaczana  jest  górna  wartość  gry  w  strategiach  mieszanych. 

Optymalna strategia mieszana gracza musi spełniać warunek: 



=

+

+

=

+

=

1

p

0

1

p

p

])

b

,

a

([

'

u

p

])

b

,

a

([

'

u

p

])

b

,

a

([

'

u

p

])

b

,

a

([

'

u

p

)

b

(

EV

)

b

(

EV

i

2

1

2

2

b

2

2

1

b

1

1

2

b

2

1

1

b

1

2

1

[1.29] 

W grze „A vs B” warunek [1.29] przybiera postać: 

)

p

1

(

6

,

5

p

2

,

5

)

p

1

(

4

,

0

p

11

1

1

1

1

=

,   

 

 

[1.30] 

którego  rozwiązaniem  jest 

55

26

1

p

=

.  Optymalną  strategią  mieszaną  gracza  A  jest 

a

po

=[

55

26

a

1

,

55

29

a

2

]. Przynosi ona dolną wartość gry w strategiach mieszanych: 

41

,

5

)

6

,

5

(

)

2

,

5

(

)

4

,

0

(

)

11

(

v

55

29

55

26

55

29

55

26

pa

=

+

=

+

=

 

 

[1.31] 

background image

 

24 

Wykres 1.2. Graficzna interpretacja metody przyrównań dla gry "A vs 

B" przekształconej liniowo (v

pa

)

-12

-11

-10

-9

-8

-7

-6

-5

-4

-3

-2

-1

0

1

2

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

p

1

EV

EV(b

1

)

EV(b

2

)

26

/

55

v

pa

 

Ź

ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366] 

Grając  swoją  strategię  optymalną  A  gwarantuje  sobie,  Ŝe  B  nie  wygra  więcej  niŜ  v

pa

niezaleŜnie od tego czy wybierze b

1

 czy b

2

Wyniki  obliczeń  przeprowadzonych  dla  gry  „A  vs  B”  są  ilustracją  twierdzenia 

von Neumanna.  Zgodnie  z  nim,  w  kaŜdej  dwuosobowej  grze  o  sumie  zerowej  z  pełną 

informacją,  moŜna  znaleźć  rozwiązanie  składające  się  z  optymalnych  strategii  mieszanych 

takich, Ŝe: 

w

])

b

,

a

([

u

v

])

b

,

a

([

u

v

qi

po

b

pa

qo

pj

b

qb

=

=

=

=

 

 

[1.32] 

gdzie  w  jest  wartością  gry  w  strategiach  mieszanych  [von Neumann,  Morgenstern,  1944, 

s. 123]. Jeśli  rozszerzymy  zbiory  strategii  graczy  dopuszczając  ich  mieszanie,  kaŜda  gra  jest 

ś

ciśle  określona.  Autorski  dowód  tego  twierdzenia  jest  dość  skomplikowany  i  opiera  się  na 

twierdzeniu  Brouwera  o  punkcie  stałym.  Wśród  późniejszych  wersji  prostotą  wyróŜnia  się 

dowód  Nasha  [Luce,  Raiffa,  1964,  s. 362-364].  NiezaleŜnie  od  sposobu  dowodzenia, 

twierdzenie  minimaksowe  von  Neumanna  ma  fundamentalne  znaczenie  dla  poszukiwania 

rozwiązań w grach o sumie zerowej. 

Wykres  pokazujący  metodę  przyrównania,  wykorzystaną  w  rozwiązaniu  gry 

dwuosobowej  o  sumie  zerowej  i  macierzy  wygranych  2x2,  ma  wyłącznie  znaczenie 

background image

 

25 

ilustracyjne.  Jeśli  rozszerzymy  rozmiar  macierzy  do  nx2,  okaŜe  się,  Ŝe  graficzna  ilustracja 

ułatwia i przyspiesza analityczne wyznaczenie rozwiązania metodą przyrównania

17

Tabela 1.11. Poszukiwanie punktu siodłowego gry "Walka o rynek 3" 

u

b

 

a

1

 

a

3

 

a

M

i

a

min

 

b

1

 

3% 

2% 

2% 

b

2

 

-4% 

4% 

-4% 

a

M

i

a

b

M

j

b

min

max

 

b

3

 

2% 

3% 

2% 

2% 

b

M

bj

max

 

3% 

4% 

 

 

b

M

j

b

a

M

i

a

max

min

 

3% 

 

 

Ź

ródło: opracowanie własne 

„Walka o rynek 3” 

Wróćmy do gry „Walka o rynek 2” redukując ją. Okazało się, bowiem Ŝe ze względu 

na wysokie koszty, gracz A na pewno nie wybierze strategii a

2

Nowa gra nie ma punktu siodłowego. Nie moŜna teŜ, zacząć od metody przyrównania 

w postaci analitycznej ze względu na nierówną liczebność zbiorów strategii czystych obydwu 

graczy.  Wybór  optymalnej  strategii  mieszanej  gracza  A  poprzedźmy  konstrukcją 

odpowiedniego wykresu. 

Wykres 1.3. Graficzna interpretacja metody 

przyrównań dla gry "Walka o rynek 3"

-5%

-4%

-3%

-2%

-1%

0%

1%

2%

3%

4%

5%

0,0

0,2

0,4

0,6

0,8

1,0

p

1

EV

EV(b

2

)

EV(b

1

)

EV(b

3

)

 

Ź

ródło: opracowanie własne 

                                                 

17

 Williams idzie dalej w uznaniu znaczenia interpretacji graficznej twierdząc, Ŝe istnieje autonomiczna metoda 

graficzna rozwiązywania gier o macierzach wygranych 2xm [Williams, 1965, s. 88]. 

background image

 

26 

Właściwy wykres, dla ułatwienia odczytu szukanych wartości naleŜy uzupełnić tabelą, 

która  pokazuje  jak  zmieniają  się  wartości  oczekiwane  wygranych  gracza  B  w  zaleŜności  od 

prawdopodobieństwa p

1

 wyboru strategii a

1

 przez gracza A. 

Tabela 1.12. Wyznaczanie wartości gry "Walka o rynek 3" metodą przyrównania 

p

1

 

0,0000 

0,1429 

0,2222 

0,5000 

1,0000 

EV(b

1

2,000% 

2,143% 

2,222% 

2,500% 

3,000% 

EV(b

2

4,000% 

2,857% 

2,222% 

0,000% 

-4,000% 

EV(b

3

3,000% 

2,857% 

2,778% 

2,500% 

2,000% 

Ź

ródło: opracowanie własne 

Gracz A wie, Ŝe konkurent będzie dąŜył do osiągnięcia jak najwyŜszej wygranej przy 

danym  wyborze  prawdopodobieństwa  p

1

.  Jeśli  0≤p

1

0,1429,  B  wybierze  strategię  b

2

,  gdy 

0,1429≤p

1

0,5  najwyŜszą  wygraną  przyniesie  strategia  b

3

  i  ostatecznie  dla  0,5≤p

1

najlepszym  wyborem  B  będzie  strategia  b

1

  (zob. Wykres  1.3).  Graczowi  A  pozostaje  wybór 

takiego prawdopodobieństwa p

1

, by „osadzić” B w najniŜszym punkcie, najkorzystniejszej dla 

niego, łamanej. Zarówno z wykresu jak i z Tabeli 1.12 wynika, Ŝe najkorzystniej dla A będzie 

wybrać p

1

=0,5, gwarantując sobie tym, Ŝe B nie wygra więcej niŜ v

pa

=2,5%. 

W  takiej  sytuacji  B,  z  pewnością  nie  wybierze  b

2

.  Aby  wyznaczyć  jego  optymalną 

strategię mieszaną, naleŜy posłuŜyć się loterią strategii b

1

 i b

3

. Musi ona zapewnić spełnienie 

warunku [1.26], który w przypadku gry „Walka o rynek 3” daje się sprowadzić do postaci: 

)

q

1

%(

3

q

%

2

)

q

1

%(

2

q

%

3

1

1

1

1

+

=

+

 

 

 

[1.33] 

Rozwiązaniem  tego  równania  jest  q

1

=0,5.  Dolna  wartość  gry  w  strategiach  mieszanych 

wynosi v

qb

=2,5%. MoŜemy juŜ wskazać rozwiązanie gry „Walka o rynek 3”. Składają się na 

nie: 

a)

 

optymalna strategia gracza A: a

po

=[

2

1

a

1

,

2

1

a

3

], 

b)

 

optymalna strategia gracza B: b

qo

=[

2

1

b

1

,0b

2

,

2

1

b

3

], 

c)

 

wartość gry v

pa

=v

qb

=w=2,5%. 

Porównanie  rozwiązań  gier  „Walka  o  rynek  2”  i  „Walka  o  rynek  3”  wskazuje,  Ŝe 

usunięcie strategii a

2

, jakkolwiek konieczne ze względu na wysokie koszty, było niekorzystne 

dla  gracza  A.  Wartość  gry  wzrosła  z  v=1%  do  w=2,5%.  MoŜna  się  tego  było  spodziewać, 

wszak  usunęliśmy  strategię,  która  dominowała  a

3

  we  wcześniejszej  wersji  gry.  Jeśli  zatem, 

dodatkowe  koszty  związane  z  podjęciem  realizacji  strategii  a

2

  są  niŜsze  od  wartości,  jaką 

moŜe przynieść utrzymanie 1,5% rynku, gracz A powinien pozostać przy „Walce o rynek 2”. 

WyróŜnienie gier o sumie zerowej zawdzięczać naleŜy ich jednoznacznej  naturze. W 

grach  tego  typu  konflikt  interesów  występuje  w  czystej  postaci.  „Główną  ideą 

background image

 

27 

niekooperacyjnego  podejścia  jest,  jednym  słowem,  ‘egoizm’,  nie  mizantropijny  lub 

windykacyjny, ale polegający na obojętności wobec dąŜeń innych. Gra n-osobowa rozpada się 

na n problemów jednoosobowych rozwiązywanych jednocześnie” [Shubik, 1995, s. 217]. 

Jednoznaczności  związanej  z  nieodłącznym  brakiem  aspektu  kooperacyjnego 

towarzyszy jednoznaczność towarzysząca rozwiązywaniu gier o sumie zerowej. Twierdzenie 

minimaksowe von Neumanna niesie z sobą przesłanie pozwalające nam przystępować do ich 

rozwiązywania  z  przekonaniem  o  ostatecznym  sukcesie.  „Z  powodu  swojego  determinizmu 

skończone  gry  o  sumie  zerowej  mogą  być  uznane  za  ‘kompletne’,  w  sensie  moŜliwości 

wyznaczenia  optymalnych  strategii.  Prawdopodobnie  z  tych  względów,  teoria  gier 

przyciągnęła Ŝywe zainteresowanie, szczególnie w kręgach, w których problem wyznaczania 

optymalnych  decyzji  w  warunkach  konfliktu  lub  konkurencji  jest  uznany  za  naczelny” 

[Rapoport,  1989,  s. 195].  Nawet,  jeśli  poziom  rozbudowania  bazy  teoretycznej  gier  o  sumie 

zerowej moŜna uznać za umiarkowany w porównaniu z ogólną teorią gier, trudno wyobrazić 

sobie dzisiejszy obraz tej ostatniej bez podstaw, jakie zbudowali von Neumann i Morgenstern. 

 

background image

 

15 

1.3.

 

Niekooperacyjne gry o sumie róŜnej od zera 

 

1.3.1.

 

Równowaga w strategiach czystych 

Naturalnym dopełnieniem zbioru gier o sumie zerowej są gry o sumie róŜnej od zera

1

Jednocześnie moŜna powiedzieć, Ŝe zarówno gry o sumie zerowej jak i gry o sumie róŜnej od 

zera  są  rozłącznymi  podzbiorami  gier  o  sumie  dowolnej.  Gry  n-osobowe  o  sumie  róŜnej  od 

zera to te, w przypadku których istnieje przynajmniej jedno m

j

 naleŜące do M takie, Ŝe: 

0

)

m

(

u

n

1

i

j

i

=

 

 

 

 

[1.34] 

lub w przypadku gier dwuosobowych, istnieje przynajmniej jedno m

ij

 naleŜącego do M, takie, 

Ŝ

e: 

u

a

(m

ij

)+u

b

(m

ij

)≠0. 

 

 

 

 

[1.35] 

W  przypadku  gier  o  sumie  róŜnej  od  zera  wygrane  graczy  w  ramach  określonego 

zbioru wyników gry, przynajmniej w jednym przypadku, nie sumują się do zera. Powoduje to 

niejednoznaczność sytuacji strategicznej. MoŜe być tak, Ŝe zmiana wskazania strategii, przez 

co  najmniej  jednego  gracza  zwiększy  wygrane  wszystkich  uczestników  gry,  albo  tak,  Ŝe 

wygrane części graczy zwiększają się, części zmniejszają a pozostałych nie zmieniają się. 

Brak powszechności konfliktu interesów moŜe w skrajnej sytuacji przybrać postać ich 

pełnej  zbieŜności.  W  takiej  sytuacji,  kaŜda  zmiana  strategii  prowadzi  do  zmian  wygranych 

graczy o tym samym znaku. Z punktu widzenia teorii gier takie sytuacje są trywialne. 

Ewentualność  wystąpienia  sytuacji,  w  której  wszyscy  gracze  będą  zainteresowani  w 

określonej  zmianie  strategii  zdecydowanie  wyróŜnia  gry  o  sumie  róŜnej  od  zera.  Istnieje 

waŜna  klasa  dwuosobowych  gier  o  sumie  róŜnej  od  zera  zwana  grami  kooperacyjnymi.  Ich 

rozwiązanie  polega  na  wyznaczeniu  par  strategii,  co  do  przyjęcia  których  gracze  podejmują 

wiąŜące zobowiązanie i przynoszących obydwu wyŜsze wygrane niŜ przy niekooperacyjnym 

wyborze  strategii.  Ich  szczególne  znaczenie  sprawia,  Ŝe  wyznaczaniu  rozwiązań 

kooperacyjnych poświęcono odrębną część pracy. 

W tej części pracy uwaga zostanie skoncentrowana na grach niekooperacyjnych. Są to 

te  gry  o  sumie  zerowej,  w  przypadku  których  niedozwolone  jest  komunikowanie  się  graczy 

przed grą i Ŝaden z nich nie zna wyboru strategii konkurenta przed dokonaniem własnego. W 

przypadku niekooperacyjnych gier n-osobowych niedopuszczalne jest tworzenie koalicji. 

                                                 

1

 Oczywiście, to samo dotyczy relacji między grami o sumie stałej a grami o sumie zmiennej. 

background image

 

16 

RozwaŜania  nad  wyznaczaniem  rozwiązań  w  grach  niekooperacyjnych  rozpocznijmy 

od analizy prostej gry o nazwie „Ścisła”. 

„Ścisła” 

Dwa  działające  na  tym  samym  rynku  przedsiębiorstwa  mają  do  wyboru  po  dwie 

strategie  rynkowe:  typu  1  i  2.  Wygranymi  są  ich  zyski.  Jeśli  jednocześnie  wybiorą  strategie 

typu  1,  osiągną  parę  najniŜszych  z  osiągalnych  wygranych.  Gdy  zgodny  wybór  padnie  na 

strategie  typu  2,  udziałem  graczy  będą  najwyŜsze  dostępne  im  wygrane.  Mieszanie  typów 

strategii przynosi wygrane mieszczące się wewnątrz dostępnych przedziałów, a ten z graczy, 

który wybierze typ o wyŜszej numeracji wygrywa mniej niŜ gdyby było odwrotnie. 

 

Tabela 1.13. Macierze wygranych gry „Ścisła”

2

 

Strategia 

a

1

 

Strategia 

a

2

 

Strategia 

b

1

 

0,5 

Strategia 

b

2

 

20 

12 

15 

30 

ź

ródło: opracowanie własne 

Wyznaczenie pary strategii w tej grze nie nastręcza problemów nawet wtedy, gdy nie 

miało  się  styczności  z  teorią  gier.  śadnemu  z  nich  nie  opłaca  się  grać  strategii  typu  1, 

poniewaŜ,  niezaleŜnie  od  wyboru  konkurenta,  strategia  typu  2  zawsze  przyniesie  wyŜszą 

wygraną.  MoŜemy  zatem  wykorzystać,  znane  z  teorii  gier  o  sumie  zerowej  kryterium 

dominacji.  Eliminacja  zdominowanych  strategii  typu  1  prowadzi  do  rozwiązania  [a

2

,b

2

]  i 

wygranych u

a

([a

2

,b

2

])=25 i u

b

([a

2

,b

2

])=30. 

Spójrzmy  na  inny  aspekt  tego  rozwiązania  zakładając,  Ŝe  kryterium  dominacji  nie 

moŜe  zostać  zastosowane.  Gracz  A  nie  znając  wyboru  strategii  przez  konkurenta  starać  się 

będzie znaleźć najlepsze na nie odpowiedzi. Zarówno na b

1

 jak i na b

2

 najlepszą odpowiedzią 

jest  a

2

.  Analogicznie  gracz  B  wybiera  strategię  b

2

.  W  ten  sposób  wyłonić  się  moŜe  para 

strategii,  która  jest  najlepszą  odpowiedzią  na  siebie  nawzajem.  Taką  parę  strategii 

definiujemy  jako  równowagę  w  grze.  Równowaga  jako  wskazanie  rozwiązania  w  grze 

niekooperacyjnej została zaproponowana po raz pierwszy przez Johna Nasha. Po raz pierwszy 

zdefiniował  ją  bez  wskazywania  konkretnej  pary  wartości  uŜyteczności  opierając  się  na 

                                                 

2

 Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o 

sumie róŜnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121]. 

background image

 

17 

relacjach między strategiami [Nash, 1950b, 1951]. KaŜdy z n graczy ma do wyboru określoną 

liczbę  strategii  M

i

={m

i1

,m

i2

,...,m

ij

,...,m

im

}.  Niech  wygraną  gracza  i,  przy  określonym 

wektorze  strategii  m

k

  (kaŜdy  z  graczy  wskazuje  jedną),  będzie  u

i

([m

1k

,m

2k

,...,m

ik

,...,m

nk

]). 

Określony  wektor  strategii  m

r

=[m

1r

,m

2r

,...,m

ir

,...,m

nr

]  nazwiemy  równowagą  wtedy,  gdy  dla 

kaŜdego gracza i: 

u

i

([m

1r

,m

2r

,...,m

ir

,...,m

nr

])=

ij

m

max

u

i

([m

1r

,m

2r

,...,m

ij

,...,m

nr

]).   

 

[1.36] 

ś

aden  z  graczy  nie  moŜe  poprawić  swojej  sytuacji  zmieniając  swoją  strategię  m

ir

  na 

jakąkolwiek  inną  m

ij

,  jeśli  pozostali  utrzymają  wybory  strategii,  które  złoŜyły  się  na 

równowagę. 

 

1.3.2.

 

Równowaga w strategiach mieszanych, twierdzenie Nasha 

Nash, oprócz zdefiniowania równowagi w teorii gier, udowodnił, Ŝe kaŜda gra o sumie 

róŜnej  od  zera  ma,  co  najmniej  jeden  punkt  równowagi  [Nash,  1951].  Dowód  cechował  się 

„wyjątkową  elegancją”  [Luce,  Raiffa,  1964,  s. 105]  i  opierał  się  na  twierdzeniu  Brouwera  o 

punkcie  stałym.  Równowaga,  której  istnienie  dowiódł  Nash  moŜe  opierać  się  zarówno  na 

wektorach  strategii  czystych  jak  i  mieszanych.  Znaczenie  twierdzenia  Nasha  jest 

porównywane  do  znaczenia  twierdzenia  minimaksowego  von  Neumanna.  Niestety,  jego 

praktyczna przydatność dla wyznaczania rozwiązań gier jest mniejsza. 

Powróćmy  na  chwilę  do  gier  o  sumie  zerowej.  Przywołanie  definicji  punktu 

siodłowego pozwala na stwierdzenie, Ŝe jest on szczególnym przypadkiem równowagi dla tej 

klasy  gier.  Idąc  tym  tropem  Nash  zaproponował  równowagę  jako  rozwiązanie  gier  o  sumie 

róŜnej  od  zera.  Związek  z  grami  o  sumie  zerowej  rozszerza  się  równieŜ  na  moŜliwość 

poszukiwania rozwiązań w strategiach mieszanych. Jeśli gra nie ma równowagi w strategiach 

czystych,  istnieje  moŜliwość  wyznaczenia  jej  szukając  optymalnych  prawdopodobieństw 

losowania strategii. W grach dwuosobowych o symetrycznych macierzach moŜemy posłuŜyć 

się metodą przyrównania. Przyjrzyjmy się grze „Mix” 

„Mix” 

Dwa  działające  na  tym  samym  rynku  przedsiębiorstwa  mają  do  wyboru  po  dwie 

strategie  rynkowe:  typu  1  i  2.  Wygranymi  są  ich  zyski.  Wygrane  zmieniają  się  zgodnie  z 

zapisami Tabeli 1.14. 

 

background image

 

18 

Tabela 1.14. Macierze wygranych gry „Mix”

3

 

Strategia 

a

1

 

Strategia 

a

2

 

Strategia 

b

1

 

34 

18 

Strategia 

b

2

 

28 

36 

ź

ródło: opracowanie własne 

Gra  nie  ma  równowag  w  strategiach  czystych.  Znalezienie  równowagi  w  strategiach 

mieszanych polega na znalezieniu takich prawdopodobieństw losowania strategii przez gracza 

A {p,1-p} i przez gracza B {q,1-q}, Ŝe Ŝaden z nich nic nie zyska na zmianie swojej strategii 

na inną. Innymi słowy, jeśli obydwaj gracze zastosują swoje optymalne strategie mieszane, to 

Ŝ

aden  z  nich  nie  moŜe  zwiększyć  swojej  wygranej  zmieniając  strategię.  Wyznaczone 

prawdopodobieństwa muszą spełniać warunki: 

EVb

1

(p)=pu

b

([a

1

,b

1

])+(1-p)u

b

([a

2

,b

1

])=EVb

2

(p)=pu

b

([a

1

,b

2

])+(1-p)u

b

([a

2

,b

2

]), 

[1.37] 

EVa

1

(q)=qu

a

([a

1

,b

1

])+(1-q)u

a

([a

1

,b

2

])=EVa

2

(q)=qu

a

([a

2

,b

1

])+(1-q)u

a

([a

2

,b

2

]). 

[1.38] 

W grze “Mix” te warunki konkretyzują się do postaci: 

18p+8(1-p)=28p, 

 

 

 

 

[1.39] 

34q+6(1-q)=36(1-q).   

 

 

 

[1.40] 

Rozwiązaniem  równań  [1.43]  i  [1.44]  są  p=

9

4

i  q=

32

15

.  Na  równowagę  w  strategiach 

mieszanych składają się a

r

=[

9

4

a

1

,

9

5

a

2

] i b

r

=[

32

15

b

1

,

32

17

b

2

]. Wartości wygranych w równowadze 

to  u

ar

=19

8

1

  oraz  u

br

=12

9

4

.  Wybór  optymalnych  strategii  mieszanych  pozostających  w 

równowadze  trudno  uznać  za  satysfakcjonujący.  Para  strategii  [a

1

,b

1

]  przynosi  wyŜsze 

wygrane obydwu graczom. 

Niestety gry podobne do „Mix” nie są jedynymi, w przypadku których trudno wskazać 

równowagę  jako  rozwiązanie.  Dzieje  się  tak  równieŜ  w  przypadku  równowag  w  strategiach 

czystych.  Kanonicznym  przykładem  jest  „K  lub  P”.  Jest  to  gra  naleŜąca  do  typu  „dylemat 

więźnia”

4

„K lub P” 

                                                 

3

 Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o 

sumie róŜnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121]. 

4

  Szerzej  o  genezie  i  eksperymentalnej  weryfikacji  „dylematu  więźnia”  napisano  w  rozdziale  poświęconym 

historii zastosowania eksperymentów w ekonomii. 

background image

 

19 

Dwa  przedsiębiorstwa

5

  mają  do  wyboru  strategię  konkurencji  (1)  lub  porozumienia 

(2).  Jednoczesny  wybór  strategii  konkurencji  [a

1

,b

1

]  przynosi  graczom  niŜsze  zyski  niŜ 

jednoczesny  wybór  strategii  porozumienia  [[a

1

,b

1

].  Jeśli  jednak  któryś  z  graczy  zerwie 

porozumienie  i  wybierze  strategię  konkurencji  przy  lojalnej  postawie  konkurenta,  osiągnie 

wyŜszy zysk niŜ gdyby go dochował. Jednocześnie drugi z graczy traci wygrywając mniej niŜ 

przy  zgodnym  wyborze  strategii  konkurencji.  Na  przykład,  gdy  porozumienie  zrywa  A 

u

a

([a

1

,b

2

])>u

a

([a

2

,b

2

]) i jednocześnie u

b

([a

1

,b

2

])<u

b

([a

1

,b

1

]). 

 
Tabela 1.15. Macierze wygranych gry „K lub P” 

Strategia 

a

1

 

Strategia 

a

2

 

Strategia 

b

1

 

15 

20 

35 

Strategia 

b

2

 

30 

12 

25 

30 

ź

ródło: opracowanie własne 

Najlepszą odpowiedzią A na dowolną strategię B jest a

1

. Analogiczną rolę spełnia b

1

Zgodnie  z  definicją  para  strategii  opartych  na  konkurencji  stanowi  równowagę  w  tej  grze 

[a

r

,b

r

]=[a

1

,b

1

]. Widać jednak, Ŝe jednoczesna zmiana wyboru strategii na [a

2

,b

2

] podnosi zyski 

obydwu  graczy.  To  wskazanie,  z  kolei,  pozostaje  pod  istotnym  zagroŜeniem  jednostronnej 

zmiany strategii na a

1

 lub b

1

. Analizowana gra, podobnie jak inne reprezentujące typ „dylemat 

więźnia”,  jest  najbardziej  jaskrawym  przykładem  trudności,  na  jakie  napotykamy  podczas 

wyznaczania  rozwiązania  gry  niekooperacyjnej  o  sumie  zerowej.  KaŜdej  propozycji 

towarzyszy alternatywa korzystniejsza, przynajmniej dla jednego z graczy. 

Przewaga  pary  strategii  [a

2

,b

2

]  nad  [a

1

,b

1

],  wynika  z  tego,  Ŝe  ta  druga  nie  spełnia 

kryterium  optymalności,  które  łączy  racjonalność  indywidualną  z  racjonalnością  zbiorową. 

Opiera  się  ono  postulacie  sformułowanym  ok.  1900  roku  przez  włoskiego  ekonomistę 

Vilfredo  Pareto.  Zgodnie  z  nim  „nie  powinien  być  akceptowany  system  ekonomiczny,  jeśli 

moŜliwy  jest  inny,  korzystniejszy  dla  wszystkich  uczestników”  [Straffin,  2001,  s. 86].  Ta 

definicja  moŜe  zostać  zaadaptowana  dla  potrzeb  teorii  gier  z  jednoczesną  zamianą  ostrej 

nierówności  na  nieostrą.  Optymalny  w  sensie  Pareto  będzie  kaŜdy  wektor  strategii  n  graczy 

                                                 

5

 Gra jest uproszczoną wersją duopolu Cournot’a, któremu więcej miejsca poświęcono w rozdziale dotyczącym 

duopolu jako gry strategicznej. 

background image

 

20 

m

p

=[m

1p

,m

2p

,...,m

ip

,...,m

nr

]  taki,  Ŝe  nie  będzie  moŜna  znaleźć  innego  dostępnego 

m

k

=[m

1k

,m

2k

,...,m

ik

,...,m

nk

] takiego, Ŝe dla kaŜdego gracza i: 

u

i

([m

1p

,m

2p

,...,m

ip

,...,m

np

])≤u

i

([m

1k

,m

2k

,...,m

ik

,...,m

nk

]), 

 

 

[1.41] 

i przynajmniej dla jednego: 

u

i

([m

1p

,m

2p

,...,m

ip

,...,m

np

])<u

i

([m

1k

,m

2k

,...,m

ik

,...,m

nk

]). 

 

 

[1.42] 

Kryterium  optymalności  w  sensie  Pareto  moŜemy  wykorzystać  jako  postulat,  który 

spełniać  powinno  rozwiązanie  gry  o  sumie  róŜnej  od  zera.  Nie  będziemy  wówczas 

przyjmować jako rozwiązań tych wektorów strategii, które nie przynoszą Pareto optymalnych 

kombinacji wygranych. Spełnienie tego postulatu jest dobrze widoczne na graficznym obrazie 

zbioru  wyników  gry,  czyli  obszarze  wygranych.  W  przypadku  dwuosobowych  gier  o  sumie 

róŜnej  od  zera  jest  to  część  przestrzeni  euklidesowej  składająca  się  z  punktów  opisujących 

pary  wygranych  dla  wszystkich  moŜliwych  par  strategii  (po  jednej  kaŜdego  z  graczy), 

zarówno czystych jak i mieszanych. 

 

 

 

 

 

 

 

 

Ź

ródło: opracowanie własne 

 

 

 

Ź

ródło: opracowanie własne 

Wykres 1.4. Obszar wygranych gry 

"Ścisła"

0

5

10

15

20

25

30

35

0

5

10

15

20

25

30

35

u

b

u

a

[a

1

,b

1

]

[a

1

,b

2

]

[a

2

,b

2

]

[a

2

,b

1

]

r

Wykres 1.5. Obszar wygranych gry "K lub P"

0

5

10

15

20

25

30

35

0

5

10

15

20

25

30

35

u

b

u

a

[a

1

,b

1

]

[a

2

,b

2

]

[a

2

,b

1

]

[a

1

,b

2

]

r

background image

 

21 

Wykres  1.4  pokazuje,  Ŝe  w  grze  „Ścisła”  jedyna  równowaga  jest  jednocześnie 

optymalna  w  sensie  Pareto

6

.  JeŜeli  jedyna  równowaga  w  grze  o  sumie  róŜnej  od  zera  jest 

jednocześnie  optymalna  w  sensie  Pareto,  to  mówimy  o  rozwiązaniu  w  sensie  ścisłym 

[Straffin,  2001,  s. 90].  Jest  to  niesłychanie  rzadki  przypadek  jednoznaczności  wyznaczenia 

rozwiązania gry o sumie róŜnej od zera. 

Wykres 1.5 przedstawia  sytuację stojącą na przeciwnym krańcu osi jednoznaczności. 

Równowaga  w  grze  „K  lub  P”  występuje  w  jedynym  nie  optymalnym  w  sensie  Pareto 

wierzchołku  obszaru  wygranych.  Rekomendacja  równowagi  jako  rozwiązania  tej  gry  moŜe 

upaść  pod  zarzutem  niespełnienia  kryterium  optymalności  Pareto.  Kontrowersja  pomiędzy 

kryterium  równowagi  i  kryterium  Pareto  pojawiająca  się  w  grach  niekooperacyjnych 

podzieliła w swoim czasie badaczy zajmujących się tą dziedziną. Nash obstawał przy swojej 

propozycji  nawet  wtedy,  gdy  eksperymenty  wskazywały  na  przewagę  rozwiązania 

optymalnego  w  sensie  Pareto  [Flood,  1958].  Poglądy  innych  były  zgodne  z  wynikami  tych 

eksperymentów.  Według  nich,  „na  korzyść  optymalności  w  sensie  Pareto  przemawia  to,  Ŝe 

kaŜdy z graczy zachowując się racjonalnie, przypisuje racjonalność drugiemu. Jeśli jest wynik 

gry  inny  od  równowagi,  który  podnosi  wygraną  jednego  z  graczy,  co  najmniej  nie 

zmniejszając  wygranej  drugiego,  to  równowaga  nie  stanie  się  racjonalnym  wynikiem  gry” 

[Rapoport, 1989, s.221]. 

 

1.3.3.

 

Wybór rozwiązania spośród wielu równowag tej samej gry 

Niejednoznaczność  wskazania  rozwiązania  gry  niekooperacyjnej  moŜe  się  pojawić 

równieŜ  wtedy,  gdy  mamy  do  czynienia  z  mnogością  równowag  optymalnych  w  sensie 

Pareto.  O  ile  rozwiązaniem  w  sensie  ścisłym  jest  jedyna  równowaga  optymalna  w  sensie 

Pareto, to ich większa liczba spełnia warunek ścisłości tylko wtedy, gdy są one ekwiwalentne 

i wymienne [Straffin, 2001, s. 90]. Tak nie jest w przypadku gry „Dwie równowagi”. 

„Dwie równowagi” 

Dwa  przedsiębiorstwa  działające  na  tym  samym  rynku  mają  do  wyboru  po  dwie 

strategie  rynkowe:  typu  1  i  2.  Wygranymi  są  ich  zyski.  Jeśli  jednocześnie  wybiorą  strategie 

typu  1,  osiągną  rozwiązanie  najkorzystniejsze  dla  gracza  A.  Gdy  zgodny  wybór  padnie  na 

strategie  typu  2,  najwyŜszą  wygraną  cieszyć  się  będzie  gracz  B.  Mieszanie  typów  strategii 

przynosi najniŜszą z dostępnych wygranych temu z przedsiębiorstw, które wybierze typ 2. 

                                                 

6

  Na  wykresach  zbiór  Pareto  optymalny  składa  się  z  punktów  zaznaczonych  romboidalnym  powiększonym 

znacznikiem oraz odcinków łączących te punkty. Te właśnie odcinki są obrazem wektorów mieszanych strategii 
optymalnych w sensie Pareto. Równowagi oznaczono małą literą r. 

background image

 

22 

Tabela 1.16. Macierze wygranych gry „Dwie równowagi” 

Strategia 

a

1

 

Strategia 

a

2

 

Strategia 

b

1

 

14 

Strategia 

b

2

 

-2 

14 

ź

ródło: opracowanie własne 

Równowagi  w  tej  grze  to  pary  strategii  [a

1

,b

1

]  i  [a

2

,b

2

].  Gracz  A  zdecydowanie 

preferuje pierwszą z nich, gracz B drugą, nie są zatem ekwiwalentne i wymienne. Nawet jeśli 

obydwie są optymalne w sensie Pareto, trudno przyjąć, Ŝe gracze zgodzą się na jedną z nich. 

Konieczność  wyboru  między  dwiema  równowagami  optymalnymi  w  sensie  Pareto  jest 

naturalnym zaproszeniem do poszukiwania rozwiązania kooperacyjnego, o którym traktować 

będzie następna część tego rozdział. 

Wykres 1.6. Wielobok wygranych gry "Dwie 

równowagi"

0

2

4

6

8

10

12

14

-4

-2

0

2

4

6

8

10

12

14

u

b

u

a

[a

1

,b

1

]

[a

2

,b

2

]

[a

2

,b

1

]

[a

1

,b

2

]

r

r

 

Ź

ródło: opracowanie własne 

Bardzo istotną propozycję kryterium wyboru miedzy dwiema równowagami w ramach 

gier  niekooperacyjnych  zgłosił  John  Harsanyi.  Polegała  ona  na  wykorzystaniu  dwóch 

kategorii:  dominacji  wypłat  i  dominacji  ryzyka  [Harsanyi,  1977,  s. 274].  Pierwsze  z  nich 

opiera się na wyborze tej równowagi, która przynosi wyŜszą wygraną przynajmniej jednemu z 

graczy  i  nie  niŜszą  pozostałym.  Racjonalność  tego  kryterium  nie  powinna  budzić  dyskusji, 

wszak pokrywa się z kryterium optymalności Pareto. 

background image

 

23 

Drugie  z  kryteriów  Harsanyi’ego  jest  inspirowane  koncepcją  Luce’a  i  Raiffy 

„dominacji psychologicznej”, jaka moŜe mieć miejsce w relacjach dwóch nieekwiwalentnych 

i  niewymiennych  równowag  [Luce,  Raiffa,  1964,  s. 108-109].  W  pierwszym  kroku  naleŜy 

sprawdzić,  czy  optymalna  strategia  mieszana  moŜe  zapewnić  graczom  wyŜsze  wygrane,  niŜ 

gdyby  wybrali  strategię  czystą  korzystniejszą  dla  przeciwnika.  Równowaga  w  strategiach 

mieszanych  w  grze  „Dwie  równowagi”  to  para  strategii  a

r

=[

2

1

a

1

,

2

1

a

2

]  i  b

r

=[

6

1

b

1

,

6

5

b

2

przynosząca  wygrane  u

ar

=7

3

1

  oraz  u

br

=6.  Taki  wynik  gry  jest  zdominowany  przez  obydwie 

równowagi.  Racjonalnie  zachowujący  się  gracz  nie  wybierze  równowagi  w  strategiach 

mieszanych  nawet,  jeśli  przyszłoby  mu  wybrać  strategię  czystą  umoŜliwiającą  ustalenie  się 

równowagi mniej korzystnej dla niego. 

Następnym  krokiem  w  wykorzystaniu  kryterium  dominacji  ryzyka  jest  wyznaczenie 

indeksów  ryzyka  towarzyszących  obydwu  równowagom  [Harsanyi,  1977,  s. 276].  Dla 

kaŜdego  z  graczy  indeks  zbudowany  jest  tak,  Ŝe  w  liczniku  znajduje  się  róŜnica  jego 

wygranych  w  alternatywnych  równowagach  liczona  tak  by  zawsze  miała  znak  dodatni,  a  w 

mianowniku  róŜnica  jego  wygranej  w  preferowanej  równowadze  i  wygranej  w  sytuacji,  gdy 

przeciwnik odpowie najmniej korzystnie na próbę forsowania tej równowagi. W grze „Dwie 

równowagi” odpowiednie indeksy będą miały następującą postać: 

4

3

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

i

2

1

a

1

1

a

2

2

a

1

1

a

ar

=

=

   

 

 

[1.43] 

8

3

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

i

2

1

b

2

2

b

1

1

b

2

2

b

br

=

=

  

 

 

[1.44] 

WyŜsza  wartość  indeksu  oznacza,  Ŝe  równowaga  preferowana  przez  gracza  A  ([a

1

,b

1

]) 

dominuje  w  zakresie  ryzyka  równowagę  [a

2

,b

2

]  i  ona  powinna  być  wskazana  jako  unikalne 

rozwiązanie w tej grze. Wskazana zostaje ta równowaga, której ewentualne odrzucenie przez 

konkurenta  wiąŜe  się  z  mniejszą  względną  szkodą.  Niestety  dominacja  ryzyka  pozostaje 

bezuŜytecznym  narzędziem  wyboru  równowagi  w  strategiach  czystych  w  szczególnym 

przypadku, w którym liczniki i mianowniki indeksów ryzyka są sobie równe. Dzieje się tak w 

przypadku gry „Tchórz”. 

„Tchórz” 

Dwa przedsiębiorstwa utworzyły konsorcjum dla realizacji pewnego kontraktu. KaŜde 

z  nich  ma  do  wyboru  dwie  strategie.  Mogą  wykonać  kontrakt  (1)  lub  nie  podejmować 

Ŝ

adnych działań licząc na to, Ŝe druga strona wypełni go sama (2). Jeśli zgodnie kooperując 

wykonają  zlecone  prace  ([a

1

,b

1

]),  osiągną  zyski  równe  2.  Jeśli  Ŝadne  z  przedsiębiorstw  nie 

background image

 

24 

podejmie wykonania kontraktu ([a

2

,b

2

]), wysokie kary umowne spowodują straty równe -8 u 

obydwu. W sytuacji, gdy jeden wykona cały kontrakt a drugi osiągnie wypłatę bez ponoszenia 

kosztów ([a

1

,b

2

] lub [a

2

,b

1

]), zyski wyniosą odpowiednio -4 i 6. 

 
Tabela 1.17. Macierze wygranych gry „Tchórz” 

Strategia 

a

1

 

Strategia 

a

2

 

Strategia 

b

1

 

-4 

Strategia 

b

2

 

-4 

-8 

-8 

ź

ródło: opracowanie własne 

Gra  „Tchórz”  ma  dwie,  optymalne  w  sensie  Pareto,  równowagi  w  strategiach 

czystych

7

. Przynoszą je pary strategii [a

1

,b

2

] (korzystniejsza dla B) i [a

2

,b

1

] (korzystniejsza dla 

A).  MoŜna  teŜ  w  niej  wyznaczyć  równowagę  w  strategiach  mieszanych.  Jest  nią  para 

a

r

=[

2

1

a

1

,

2

1

a

2

]  i  b

r

=[

2

1

b

1

,

2

1

b

2

],  która  przynosi  wygrane  u

ar

=u

br

=-1.  Równowagi  te  nie  są 

ekwiwalentne ani wymienne. Nie moŜna w tej grze skorzystać z kryterium dominacji wypłat. 

ś

adna z równowag nie dominuje pozostałych. 

Wykres 1.7. Wielobok wygranych gry "Tchórz"

-10

-8

-6

-4

-2

0

2

4

6

8

10

-10 -8

-6 -4

-2

0

2

4

6

8

10

u

b

u

a

[a1,b1]

[a2,b2]

[a2,b1]

[a1,b2]

r

r

 

Ź

ródło: opracowanie własne 

                                                 

7

  Gra  „Tchórz”  jest  modyfikacją  archetypowej  gry  „Chicken”  popularnej  wśród  amerykańskich  nastolatków  w 

latach pięćdziesiątych ubiegłego stulecia. Dwa samochody  jadą naprzeciw siebie z duŜą prędkością. Kierowca, 
który  pierwszy  zahamuje  „traci  twarz”  i  przegrywa.  Gracze  mają  do  wyboru  dwie  strategie,  hamować  lub  nie 
hamować  [Straffin,  2001,  s. 103].  W  polskich  tłumaczeniach  ksiąŜek  dotyczących  teorii  gier,  na  ogół, 
zachowana  zostaje  oryginalna  nazwa  tej  gry,  choć  zdarzają  się  jej  tłumaczenia  nie  oddające  istoty  rzeczy  (np. 
„kurczak” [Leibenstein, 1988, s. 301]). 

background image

 

25 

Kryterium  dominacji  ryzyka  równieŜ  nie  posłuŜy  wskazaniu  unikalnej  równowagi  w 

strategiach czystych. Wyznaczenie indeksów ryzyka przynosi rezultat i

ar

=i

br

=

7

5

. Dramatyczny 

brak  moŜliwości  wyznaczenia  rozwiązania  w  strategiach  czystych  w  grze  „Tchórz”  moŜna 

wytłumaczyć  następująco:  „im  bardziej  jesteś  przekonany  do  wyboru  stchórzenia,  tym 

bardziej kusząca jest strategia przeciwna” [Raiffa, Metcalfe, Richardson, 2002, s. 69]. Jedynie 

równowaga w strategiach mieszanych moŜe zostać wskazana jako rozwiązanie ze względu na 

dominację  ryzyka.  Ten  wybór  jest  oparty  na  toŜsamości  indeksów  ryzyka  równowag  w 

strategiach czystych. 

 

1.3.4.

 

Gry o sumie róŜnej od zera z asymetrią informacji 

Wyznaczenie  rozwiązania  w  grze  „Tchórz”  moŜe  się  stać  trywialne,  jeśli  zmienimy 

zakresy  informacji,  jakimi  dysponują  gracze.  W  pierwotnej  wersji  gry  Ŝaden  z  nich  nie  wie, 

co  wybierze  przeciwnik  (zbiory  informacyjne  zaznaczone  linią  kreskowaną  na  Schemacie 

1.5).  Wybory  strategii  są  dokonywane  jednocześnie.  Wyobraźmy  sobie  jednak,  Ŝe  jeden  z 

graczy  decyduje  jako  drugi  i  wie,  jaką  strategię  wybrał  rywal.  ZałóŜmy,  Ŝe  A  wybiera 

strategię jako pierwszy (zbiory informacyjne zaznaczone linią kropkowaną). 

 

Pełen  zakres  informacji  gracza  B  stwarza  moŜliwość  przedstawienia  jeszcze  jednej  z 

metod  szukania  rozwiązań  w  grach  o  sumie  dowolnej.  Metoda  ta  wykorzystuje  ich  postać 

rozwiniętą.  Polega  na  odrzucaniu  przez  gracza  tych  gałęzi,  które  przynoszą  mu  mniejsze 

wygrane.  Lewy  węzeł,  będący  jednocześnie  lewym  zbiorem  informacyjnym,  zostanie 

zredukowany  przez  gracza  B  o  wybór  b

1

  (6>2).  W  przypadku  prawego  węzła  odrzucona 

zostanie  gałąź  b

2

  (-4>-8).  Gracz  B  wybierze  więc  strategię:  „wybierać  zawsze  inaczej  niŜ 

przeciwnik”.  Jeśli  gracz  A  zakłada,  Ŝe  ma  do  czynienia  z  racjonalnym  przeciwnikiem  łatwo 

a

1

 

a

2

 

b

2

 

b

2

 

b

1

 

b

1

 

(2,2)   

   (-4,6) 

 

(6,-4)   

   (-8,-8) 

Schemat 1.4. Dendryt gry „Tchórz” 

 

Ź

ródło: opracowanie własne 

background image

 

26 

moŜe zidentyfikować jego wybór. Najlepszą odpowiedzią A na strategię gracza B „wybierać 

zawsze inaczej niŜ przeciwnik” będzie wybór strategii a

2

 (6>-4). „Taka metoda znajdowania 

dobrych  strategii  poprzez  analizę  drzewka  gry  od  końca  nazywa  się  indukcją  wsteczną” 

[Malawski, Wieczorek, Sosnowska, 1997, s. 30]. 

Gracz  A  wiedząc,  Ŝe  przeciwnik  będzie  podejmował  decyzję  znając  jego  wybór, 

wybierze  strategię  biernego  oczekiwania  na  zrealizowanie  kontraktu  przez  gracza  B. 

Dokonywanie  wyboru  strategii  w  pierwszej  kolejności  przynosi  przewagę  w  grze  w 

„Tchórza”.  Jednocześnie  większy  zakres  informacji  stawia  gracza  B  w  mniej  korzystnej 

sytuacji.  Sprawa  ma  się  tutaj  odwrotnie  niŜ  w  przypadku  gry  „A  przeciw  B”,  w  której 

znajomość decyzji rywala przyniosła firmie B wzrost wygranej w punkcie siodłowym. 

MoŜliwość wyboru strategii w pierwszej kolejności stworzyła sytuację, w której gracz 

A  swoją  decyzją  moŜe  sformułować  skuteczną  groźbę.  Wybierając  jako  pierwszy  bierne 

oczekiwanie  na  wykonanie  kontraktu  przez  partnera,  wymusza  na  nim  reakcję  obronną  w 

postaci wyboru strategii „wykonanie kontraktu”. O groźbach mówimy wtedy, gdy:” (i) gracz 

A  deklaruje,  Ŝe  w  wypadku  jakiegoś  działania  gracza  B  sam  podejmie  określone  działanie, 

które  (ii)  będzie  niekorzystne  dla  B,  oraz  (iii)  będzie  niekorzystne  takŜe  dla  niego  samego” 

[Straffin,  2001,  s. 111].  ZałóŜmy,  Ŝe  w  grze  „Tchórz”  dopuszczamy  moŜliwość  kontaktu 

między  graczami  przed  jednoczesnym  wyborem  strategii.  KaŜdy  z  nich  moŜe  sformułować 

wówczas  groźbę:  „jeśli  ty  zagrasz  swoją  strategię  (2)  to  ja  zrobię  to  samo”.  Wystosowanie 

groźby rodzi problem wiarygodności.  Ze względu na warunek (iii) adresat ma prawo wątpić 

w jej realizację. Gdy dokona on swojego wyboru, wykonanie groźby nie przynosi juŜ Ŝadnej 

korzyści  jej  autorowi.  Próba  rozwiązania  tego  problemu  moŜe  pojawić  się  w  powtarzanej 

wersji  gry,  w  której  dla  uwiarygodnienia  groźby  gracz  moŜe  pozwolić  sobie  na  niŜsze 

wygrane w kilku pierwszych turach. 

Tabela 1.18. Macierz gry „Tchórz: róŜnica wygranych” 

Wygrane B = u

b

’ 

a

1

 

a

2

 

b

1

 

-10 

b

2

 

10 

Ź

ródło: opracowanie własne 

Optymalne  strategie  gróźb  są  najlepszą  odpowiedzią  na  siebie  nawzajem. 

Wyznaczamy je jako punkt siodłowy gry powstałej w wyniku odjęcia od siebie wygranych z 

wyjściowej gry o sumie róŜnej od zera: 

u

a

’([a

i

,b

j

])=u

a

([a

i

,b

j

])-u

b

([a

i

,b

j

] oraz u

b

’([a

i

,b

j

])=u

b

([a

i

,b

j

])-u

a

([a

i

,b

j

])). 

[1.45] 

W przypadku gry „Tchórz” punktem siodłowym takiej gry jest para strategii [a

2

,b

2

]. 

background image

 

27 

KaŜdy  z  graczy  deklarując  brak  jakiegokolwiek  działania  na  rzecz  wykonania 

kontraktu,  formułuje  groźbę,  która  jest  najlepszą  odpowiedzią  na  groźbę  przeciwnika. 

Optymalne  groźby  pozostają  w  równowadze.  Pamiętać  naleŜy  jednak,  Ŝe  ich  realizacja 

przynosi  jedyny  wynik,  który  nie  jest  Pareto  optymalny  w  zbiorze  strategii  czystych.  Para 

optymalnych  strategii  gróźb  nie  moŜe  być  traktowana  jako  propozycja  rozwiązania  gry  o 

sumie  róŜnej  od  zera.  Groźby  stanowią  jedynie  narzędzie  słuŜące  osiągnięciu  poŜądanego 

wyniku  gry.  Ich  przydatność  widoczna  jest  w  przypadku  gier  powtarzanych  oraz  przy 

wyznaczaniu  rozwiązań  kooperacyjnych,  o  czym  szerzej  przeczytać  będzie  moŜna  w 

następnej części pracy. 

 

1.3.5.

 

Poziomy bezpieczeństwa, wykorzystanie kryterium maksyminowego 

Trudności  w  wyborze  jednoznacznego  rozwiązania  gier  o  sumie  róŜnej  od  zera 

stwarzają  pokusę  wykorzystania  narzędzi  słuŜących  wyznaczaniu  optymalnego  rozwiązania 

gier  o  sumie  zerowej.  Ulegnięcie  tej  pokusie  prowadzi  nas  do  wyznaczenia  optymalnych 

strategii  w  grach  o  sumie  róŜnej  od  zera  zwanych  strategiami  bezpieczeństwa.  Wartość  gry 

uzyskana  w  ten  sposób  to  poziom  bezpieczeństwa  gracza.  Z  praktycznego  punktu  widzenia, 

wyznaczenie  poziomów  bezpieczeństwa  polega  na  znalezieniu  maksyminów  w  grach  o 

wygranych  kaŜdego  z  graczy  z  osobna.  Macierze  wygranych  w  grze  o  sumie  róŜnej  od  zera 

traktowane  są  jak  macierze  gry  o  sumie  zerowej.  Zakładamy  tym  samym,  Ŝe  wygrana 

kaŜdego  z  graczy  jest  jednocześnie  przegraną  drugiego.  Wyborowi  strategii  przyświeca 

przekonanie, Ŝe przeciwnik jest zainteresowany w minimalizacji naszej wygranej. 

Tabela 1.19. Gra "Tchórz: suma zero B" 

u

b

 

a

1

 

a

2

 

a

M

i

a

min

 

b

1

 

-4 

-4 

a

M

i

a

b

M

j

b

min

max

 

b

2

 

-8 

-8 

-4 

b

M

bj

max

 

-4 

 

 

b

M

j

b

a

M

i

a

max

min

 

-4 

 

 

Ź

ródło: obliczenia własne 

Pozostańmy przy najczęściej analizowanej ostatnio grze w „Tchórza”. Macierz  gry  o 

sumie  zerowej  na  wygranych  gracza  B  ma  punkt  siodłowy  w  strategiach  czystych.  Jest  nim 

para strategii [a

2

,b

1

]. Wartość tej gry to v=-4 i taki jest właśnie poziom bezpieczeństwa gracza 

B.  NiezaleŜnie  od  wyboru  przeciwnika,  wybierając  strategię  b

1

,  gwarantuje  on  sobie,  Ŝe 

wygra, co najmniej -4. 

background image

 

28 

Wyznaczony  analogicznie  poziom  bezpieczeństwa  gracza  A  wynosi  równieŜ  -4  i 

gwarantowany  jest  wyborem  strategii  a

1

.  Zwróćmy  uwagę,  Ŝe  obustronny  wybór  strategii 

bezpieczeństwa  w  grze  „Tchórz”  przynosi  wynik  gry,  który  nie  jest  równowagą,  ale  spełnia 

kryterium  optymalności  Pareto.  Wiedza  o  wyborze  strategii  bezpieczeństwa  moŜe  jednak 

zostać  wykorzystana  przez  przeciwnika,  który  ma  sposobność  wybrać  strategię 

kontrbezpieczną, czyli najlepszą na nią odpowiedź. Strategią kontrbezpieczną gracza A jest a

2

 

a gracza B b

2

. Wykorzystanie strategii bezpieczeństwa jako wskazania rozwiązania w grach o 

sumie  zerowej  ma,  jak  widać,  jedną  podstawową  wadę.  Strategie  bezpieczeństwa  nie  są  w 

równowadze i nie przynoszą rozwiązania stabilnego. 

Tabela 1.20. Alternatywy dla równowag w grze „Tchórz” 

Strategie A 

Strategie B 

u

a

 

u

b

 

bezpieczna 

bezpieczna 

bezpieczna 

kontrbezpieczna 

-4 

kontrbezpieczna 

bezpieczna 

-4 

kontrbezpieczna 

kontrbezpieczna 

-8 

-8 

Ź

ródło: opracowanie własne na podstawie [Straffin, 2001] 

Wybierając swoje strategie bezpieczeństwa, kaŜdy z graczy umoŜliwia przeciwnikowi 

osiągnięcie  równowagi  bardziej  korzystnej  dla  niego.  Nie  moŜna  zatem  zaryzykować  tezy  o 

przydatności narzędzi wyznaczania rozwiązań gier o sumie zerowej dla rozwiązywania gier o 

sumie róŜnej od zera. 

Wszechstronne  próby  znalezienia  rozwiązania  w  grze  „Tchórz”  przyniosły  jedynie 

wskazanie  równowagi  w  strategiach  mieszanych  a

r

=[

2

1

a

1

,

2

1

a

2

]  i  b

r

=[

2

1

b

1

,

2

1

b

2

].  Przy 

nieskończonej liczbie powtórzeń przyniesie ona wygrane u

ar

=u

br

=-1. Nie zapominajmy jednak 

o  sytuacji,  jaka  stoi  za  analizowaną  grą.  Jeśli  w  którymś  z  powtórzeń  wylosowana  zostanie 

para strategii [a

2

,b

2

], nie będzie juŜ kolejnego kontraktu do zrealizowania. Podobnie moŜe być 

równieŜ  wtedy,  gdy  losowanie  strategii  przyniesie  którąkolwiek  z  równowag  w  strategiach 

czystych. Konsorcjum rozpadnie się z przyczyn oczywistych. 

Wskazanie  równowagi  jako  rozwiązania  gry  o  sumie  róŜnej  od  zera  ma  dwie  zalety. 

Po pierwsze, jest to propozycja wyróŜniająca się tym, Ŝe pojedynczy gracz nie moŜe poprawić 

swojej  sytuacji  wyłącznie  swoimi  działaniami.  Po  drugie,  jak  dowiódł  Nash,  w  kaŜdej  grze 

moŜna wskazać równowagę. Niestety, gdy mamy do czynienia z liczbą nie ekwiwalentnych i 

nie wymiennych równowag większą niŜ jeden, pojawia się problem wskazania tej właściwej. 

Harsanyi  zaproponował  wykorzystanie  kryteriów  dominacji  wypłat  i  dominacji  ryzyka.  Ich 

zastosowanie  umoŜliwia  wskazanie  unikalnej  równowagi  jako  rozwiązania  gry.  Jednak  w 

background image

 

29 

niektórych  przypadkach  uzyskane  rozwiązanie  w  strategiach  mieszanych  nie  spełnia 

oczekiwań graczy. Są bowiem gry, w których praktyczny aspekt mieszania strategii kłóci się z 

naturą sytuacji strategicznej. 

Podjęcie próby wykorzystania narzędzi poszukiwania punktów siodłowych w grach o 

sumie zerowej równieŜ nie przyniosło poŜądanych rezultatów. Pomijając trudności związane 

z  naturą  poszczególnych  przypadków,  wystarczy  powiedzieć,  Ŝe  strategie  bezpieczeństwa 

wyznaczone metodą maksyminu nie sprawdzą się w grach o sumie róŜnej od zera, poniewaŜ 

nie są w równowadze. 

Widać teraz, jak błahe były problemy, które pojawiały się podczas rozwiązywania gier 

o sumie zerowej. Rozwiązując grę o sumie róŜnej od zera pozostaje nam jedynie zatęsknić za 

jednoznacznością jej być moŜe mniej wyrafinowanej, ale jakŜe wdzięczniejszej siostry. 

 

1.4.

 

Teoria gier powtarzalnych 

 

1.4.1.

 

Natura gier iterowanych 

Powtarzalność  gry  rodzi  istotne  konsekwencje  strategiczne.  Wybory  graczy  w 

kolejnych turach pozostają pod wpływem znanych im wyników poprzednich iteracji. Gracza 

poznają  się  i  z  czasem  ich  wybory  uwzględniają  „dopasowanie”  do  postawy  przeciwnika. 

Dodatkowo pojawia się czynnik uczenia się obejmujący nie tylko zachowania innych graczy, 

ale równieŜ istotę i dynamikę gry. Wszystkie te względy przesuwają zainteresowanie badacza 

w kierunku pozytywnej analizy zachowań graczy. Jest ona domeną empirycznych badań nad 

zachowaniami  podmiotów  gospodarczych  oraz  przedmiotem  ekonomii  eksperymentalnej.  W 

tym rozdziale uwaga zostanie skoncentrowana na normatywnym aspekcie gier powtarzalnych. 

Przedstawione  zostaną  próby  wyznaczenia  racjonalnych  sposobów  postępowania  w  tych 

grach.  Elementy  analizy  pozytywnej  obejmujące  skutki  porozumiewania  się  graczy,  ich 

indywidualnych  charakterystyk  oraz  wzajemnych  przewidywań,  co  do  kolejnych  ruchów 

pojawią się tylko wtedy, gdy będzie to konieczne. 

Celem  graczy  w  grze  powtarzalnej  jest  uzyskanie  maksymalnej  sumy  uŜyteczności 

wygranych.  Spełnienie  załoŜenia  o  tym,  Ŝe  uŜyteczność  sumy  wygranych  jest  równa  sumie 

uŜyteczności jej składników jest moŜliwe tylko przy liniowej postaci tej funkcji. Formułując 

bazowe  załoŜenia  dla  modeli  budowanych  w  tej  pracy,  taką  właśnie  funkcję  przyjęto.  To 

daleko idące uproszczenie będzie przydatne jeszcze niejednokrotnie. MoŜna teŜ przyjąć inne 

podejście zakładając, Ŝe gracze są „zainteresowani jedynie w maksymalizacji swych własnych 

background image

 

30 

oczekiwanych  wypłat  pienięŜnych,  i  niech  wtedy  liczby  macierzy  wypłat  przedstawiają 

wypłaty pienięŜne” [Luce, Raiffa, 1964, s. 98]. 

 

1.4.2.

 

Powtarzanie jako metoda rozwiązywania gier o sumie zerowej 

Powtarzanie  gry  o  sumie  zerowej  przynosi  supergrę  o  tej  samej  charakterystyce. 

KaŜda  powtarzalna  gra  o  sumie  zerowej,  tak  jak  jej  składowa,  jest  ściśle  konkurencyjna.  Jej 

rozwiązaniem  będzie  wybór  strategii  maksyminowej  w  kaŜdej  iteracji.  Gry  ściśle 

konkurencyjne  w  wersji  powtarzanej  nie  stwarzają  istotnych  problemów  z  teoretycznego 

punktu  widzenia.  MoŜemy  nawet  stwierdzić,  Ŝe  stworzenie  fikcyjnej  gry,  poprzez 

powtarzanie bazowej gry o sumie zerowej, moŜe przynieść nową metodę jej rozwiązywania. 

„Ekspansja”

8

 

Dwa  przedsiębiorstwa  produkują  ten  sam  wyrób.  Przedsiębiorstwo  A  charakteryzuje 

się mniejszym udziałem w rynku i wyŜszymi kosztami marginalnymi niŜ przedsiębiorstwo B. 

Otwierają się przed nimi dwa nowe rynki. Jeśli obydwa wejdą na ten sam rynek ([a

1

,b

1

] lub 

[a

2

,b

2

]),  słabsze  przedsiębiorstwo  A  przegrywa  zyski  równe  jedności  na  rzecz  konkurenta. 

Odwrotnie dzieje się wtedy, gdy wybierają róŜne rynki ([a

1

,b

2

] lub [a

2

,b

1

]), poniewaŜ A moŜe 

wzmocnić się nie będąc atakowane przez konkurenta. 

 

Tabela 1.21. Gra "Ekspansja" 

u

b

 

a

1

 

a

2

 

a

M

i

a

min

 

b

1

 

-1 

-1 

a

M

i

a

b

M

j

b

min

max

 

b

2

 

-1 

-1 

-1 

b

M

bj

max

 

 

 

b

M

j

b

a

M

i

a

max

min

 

 

 

Ź

ródło: obliczenia własne na podstawie [Shubik, 1995] 

Gra nie ma punktu siodłowego w strategiach czystych, ale sprawdźmy, jak będzie się 

zmieniać  sytuacja,  jeśli  będzie  powtarzana.  ZałóŜmy,  Ŝe  gracze  zaczynają  od  jednoczesnego 

wyboru  drugiego  rynku.  Przez  cały  czas,  gracze  monitorują  częstość  wyboru  strategii  przez 

przeciwnika. W następnych turach wybierają odpowiednią strategię tak długo, dopóki drugi z 

graczy nie zacznie częściej wybierać strategii, na którą najlepszą odpowiedzią będzie zmiana 

własnej strategii. Gracz B powinien zmienić strategię juŜ w drugiej turze, poniewaŜ najlepszą 
                                                 

8

  Gra  jest  odmianą  archetypowej  gry  „Matching  Pennies”  polegającej  na  jednoczesnym  wskazaniu  jednej  z 

dwóch  stron  monety  przez  dwóch  graczy.  Jeśli  wskaŜą  tą  samą  stronę  wygrywa  jeden,  jeśli  róŜne  wygrywa 
drugi. Wygraną jest pokazywana moneta. 

background image

 

31 

odpowiedzią na a

2

 jest b

1

. Gracz A zmienia strategię na a

1

 w turze czwartej, zaraz po tym jak 

okazuje się, Ŝe gracz B zaczął częściej grać b

1

Tabela 1.22. Gra "Ekspansja" rozgrywana wielokrotnie 

Wybór A 

Częstość wyboru A 

Wybór B 

Częstość wyboru B 

Tura 

a

1

 

a

2

 

a

1

 

a

2

 

b

1

 

b

2

 

b

1

 

b

2

 

  

0,0000 

1,0000 

  

0,0000 

1,0000 

  

0,0000 

1,0000 

  

0,5000 

0,5000 

  

0,0000 

1,0000 

  

0,6667 

0,3333 

  

0,2500 

0,7500 

  

0,7500 

0,2500 

  

0,4000 

0,6000 

  

0,8000 

0,2000 

  

0,5000 

0,5000 

  

0,8333 

0,1667 

  

0,5714 

0,4286 

  

0,8571 

0,1429 

  

0,6250 

0,3750 

  

0,7500 

0,2500 

  

0,6667 

0,3333 

  

0,6667 

0,3333 

10 

  

0,7000 

0,3000 

  

0,6000 

0,4000 

11 

  

0,7273 

0,2727 

  

0,5455 

0,4545 

Ź

ródło: obliczenia własne na podstawie [Shubik, 1995] 

Zgodnie  z  tą  dynamiką  gra  moŜe  się  toczyć  w  nieskończoność.  Robinson  [1951] 

udowodnił,  Ŝe  częstości  wyboru  strategii  zmierzają  w  niej  do  wartości  optymalnych 

prawdopodobieństw  mieszania  strategii.  W  grze  „Ekspansja”  punkt  siodłowy  w  strategiach 

mieszanych to para a

r

=[

2

1

a

1

,

2

1

a

2

] i b

r

=[

2

1

b

1

,

2

1

b

2

] przynosząca wartość gry v=0. JuŜ przy 250 

powtórzeniach  średnia  wypłata  gracza  B  wynosi  0,02.  Zdaniem  Robinsona,  analizując  grę  o 

sumie  zerowej  poprzez  dokonywanie  powtórzeń,  moŜemy  wyznaczyć  optymalne  strategie 

mieszane graczy i jej wartość. 

Wykres 1.8. Częstość wyboru strategii a

1

 w powtarzanej grze "Ekspansja"

0,0

0,3

0,5

0,8

1,0

1,3

1

26

51

76

101

126

151

176

201

226

tury

 

Ź

ródło: opracowanie własne 

background image

 

32 

Wykres  1.8  pokazuje  jak  wygasają  oscylacje  częstości  wybierania  strategii  wokół 

optymalnego  prawdopodobieństwa  jej  losowania.  W  miarę,  jak  przyrasta  ilość  iteracji,  ich 

odchylenie  od  p=0,5  jest  coraz  mniejsze.  Podobnie  będzie  wyglądać  wykres  dla  kaŜdej  z 

pozostałych strategii czystych dostępnych  graczom. Co prawda, wraz z gaśnięciem oscylacji 

wydłuŜa  się  jej  okres,  ale  nie  zmienia  to  faktu,  Ŝe  częstość  wyboru  strategii  zmierza  do 

optymalnego prawdopodobieństwa jej losowania. 

 

1.4.3.

 

Powtarzane gry o sumie róŜnej od zera 

Niestety metoda Robinsona nie znajduje zastosowania w grach o sumie róŜnej od zera. 

Zbudowanie  normatywnego  modelu  wskazującego  na  najlepszą  strategię  kaŜdego  z  graczy 

wymaga  przyjęcia  szeregu  załoŜeń  upraszczających.  Badacze  chętniej  zajmują  się 

konkretnymi przykładami gier niŜ uniwersalną teorią powtarzalnych gier o sumie niezerowej. 

Najczęściej  przedmiotem  ich  zainteresowania  był  „dylemat  więźnia”.  Zbiega  się  to 

szczęśliwie  z  powinowactwem  gier  tego  typu  z  modelem  duopolu,  którego  uproszczoną 

postacią była gra „K lub P”. 

Zanim  zajmiemy  się  metodami  znajdowania  rozwiązań  w  powtarzanym  dylemacie 

więźnia,  przedstawmy  ogólną  postać  tego  typu  gry  w  wersji  jednoetapowej.  KaŜdy  z  graczy 

ma do wyboru dwie strategie: zdrada (z) lub kooperacja (k). ZałóŜmy, Ŝe macierze wygranych 

obydwu  graczy  będą  symetryczne.  Nie  będzie  to  miało  wpływu  na  naturę  wyznaczonego 

rozwiązania. 

Tabela 1.23. Macierze wygranych gry „Dylemat więźnia” 

Strategia 

a

1

 

Strategia 

a

2

 

Strategia 

b

1

 

Strategia 

b

2

 

ź

ródło: opracowanie własne 

Relacja  pomiędzy  wygranymi  zawsze  układać  się  będzie  zgodnie  z  nierównościami 

c>k>z>f  oraz 

2

f

c

k

+

.  Przypomnijmy,  Ŝe  równowaga  w  tej  grze  to  para  strategii  [a

z

,b

z

]. 

Jednocześnie  jest  to  jedyny  wynik  gry  w  strategiach  czystych,  który  nie  jest  optymalny  w 

sensie Pareto. 

background image

 

33 

ZałóŜmy, Ŝe gracze znają ilość powtórzeń, jaką przyjdzie im rozegrać. Analizując grę 

z perspektywy  ostatniej iteracji, uznają za racjonalne wybranie w niej strategii zdrady, która 

dominuje kooperację. Wybór jest oczywisty, bowiem więcej powtórzeń nie będzie. To z kolei 

sprawia, Ŝe tura przedostania, ze strategicznego punktu widzenia, upodabnia się do ostatniej. 

Ponownie  najbardziej  racjonalnym  wyborem  dla  obydwu  graczy  będzie  zdrada.  „Szanse  na 

kooperacje upadają jak kostki domina – równieŜ pierwszym wynikiem musi być para strategii 

zdrady”  [Straffin,  2001,  s. 96].  Zgodnie  z  tą  logiką  równowaga  w  dylemacie  więźnia  jest 

równocześnie  równowagą  w  jego  powtarzanej  określoną  ilość  razy  wersji.  Jednak 

doświadczenie  uczy,  Ŝe  gracze  nie  zawsze  z  Ŝelazną  konsekwencją  stosują  opisany  sposób 

myślenia, a i w teorii znaleziono sposób na odejście od tego zdeterminowanego rozwiązania. 

Polega  on  na  załoŜeniu,  Ŝe  gracze  nie  znają  ilości  powtórzeń,  jaka  będzie  ich  udziałem.  Nie 

znają  ostatniej  tury,  więc  nie  mogą  rozpocząć  wstecznego  odliczania  strategii  zdrady  w 

kolejnych powtórzeniach. 

W  literaturze  wymienia  się  cztery  metody  wyboru  strategii  w  przypadku  dylematu 

więźnia powtarzanego nieokreśloną ilość razy [Shubik, 1970]: 

 

wprowadzenie dodatniego prawdopodobieństwa zakończenia gry na kaŜdym jej etapie, 

 

wprowadzenie dodatniego współczynnika dyskontującego, 

 

zastąpienie gry jej skończoną wersją z funkcją wartości końcowej, 

 

optymalizacja średniej wypłaty dla pojedynczej iteracji. 

Pierwszy  ze  sposobów  zakłada,  Ŝe  kaŜda  tura,  następna  po  pierwszej,  zostanie 

rozegrana  z  prawdopodobieństwem  0≤p≤1  [Shubik,  1970].  Gdyby  kaŜdy  z  graczy  zawsze 

wybierał strategię kooperacji, jego suma wygranych wyniosłaby: 

p

1

k

k

p

k

p

pk

k

3

2

=

+

+

+

+

L

 

 

 

 

[1.46] 

Mógłby  jednak  zdecydować  się  na  zagranie  zdrady  w  m-tej  iteracji.  Przeciwnik  odpowie  tą 

samą  zmianą  w  turze  m+1  i  dalej  wybrane  strategie  pozostaną  w  równowadze.  Suma 

wygranych tego, który zdradzi pierwszy przybiera postać: 

p

1

z

p

c

p

)

p

1

(

)

p

1

(

k

z

p

z

p

c

p

k

p

k

p

pk

k

m

1

m

1

m

1

m

m

1

m

2

m

2

+

+

=

+

+

+

+

+

+

+

+

+

L

L

[1.47] 

Nie będzie się opłacało zdradzić, jeśli [1.50] będzie większe od [1.51]. 

p

1

z

p

c

p

)

p

1

(

)

p

1

(

k

p

1

k

m

1

m

1

m

+

+

>

 

 

 

[1.48] 

Przekształcając tą nierówność otrzymujemy: 

background image

 

34 

z

c

k

c

p

>

 

 

 

 

 

[1.49] 

Gracze  powinni  grać  kooperacyjnie  pod  warunkiem,  Ŝe  prawdopodobieństwo  rozegrania 

kolejnego  powtórzenia  jest  większe  od  ilorazu  róŜnic  wygranych  z  nierówności  [1.49]. 

Warunek jest niezaleŜny od tego, w którym powtórzeniu moŜe pojawić się zdrada. 

Powróćmy  na  chwilę  do  gry  „K  lub  P”.  W  przypadku  obydwu  graczy  graniczna 

wartość  prawdopodobieństwa  wynosi  p=

3

1

.  Jeśli  w  tej  grze  o  wystąpieniu  kolejnej  iteracji 

decydować  będzie  rzut  monetą,  zdrada  nie  będzie  się  opłacała  Ŝadnemu  z  graczy.  Na 

przykład,  stałe  granie  kooperacji  przez  gracza  A  przynosi  mu  oczekiwaną  wartość  sumy 

wygranych równą 50. Jednocześnie ta sama suma osiąga wartość 48,75 w wypadku zdrady w 

czwartym  powtórzeniu.  Jeśli  w  odmiennej  sytuacji,  o  kolejnym  powtórzeniu  będzie 

decydować  wyrzucenie  szóstki  przy  pomocy  kości  do  gry,  to  stałe  wybieranie  kooperacji 

przez  obydwu  graczy  przynosi  oczekiwaną  wartość  sumy  wygranych  równą  30,  a  zdrada  w 

czwartej iteracji przyniesie jej wzrost do 30,0139. 

Druga  z  przedstawionych  metod  jest  modyfikacją  pierwszej.  Prawdopodobieństwo 

rozegrania  kolejnej  iteracji  zostaje  zastąpione  przez  współczynnik  dyskontujący.  Gracze, 

oczekując  na  wygrane  w  kolejnych  turach,  ponoszą  koszty  alternatywne  związane  z 

odroczeniem  wypłaty  w  czasie.  Ich  miarą  jest  stopa  dyskontowa  d.  Jeśli  pierwsza  tura 

rozgrywana jest dziś, a kolejne z interwałem rocznym, to wartość obecna wygranej gracza A 

otrzymanej w etapie m jest warta: 

1

m

am

am

m

)

d

1

(

u

)

u

(

PV

+

=

 

 

 

 

[1.50] 

Nierówność [1.52] przybiera teraz postać: 

1

m

1

m

2

m

)

d

1

(

d

1

z

)

d

1

(

1

c

)

d

1

(

d

1

d

1

1

k

d

1

1

k

+

+

+

+



+

+

>

+

 

[1.51] 

a nierówność [1.53]: 

k

c

z

k

d

<

 

 

 

 

 

[1.52] 

W grze „K lub P” górną granicą wartości stopy dyskontowej, poniŜej której nie opłaca 

się zdradzać, jest d=200%. Jest to na tyle duŜa wartość, Ŝe moŜna być spokojnym o trwałość 

kooperacji.  Przy  zdecydowanie  częściej  spotykanej  d=10%,  strategia  trwałej  kooperacji 

background image

 

35 

przynosi graczowi A wartość oczekiwaną sumy wygranych równą 275, a zdrada w czwartym 

powtórzeniu to jedynie 203,6

9

Graniczne  prawdopodobieństwo  rozegrania  kolejnej  tury  i  maksymalna  stopa 

dyskontowa  są  koncepcjami  wskazującymi  warunki  dla  opłacalności  zdrady  w  dowolnym 

powtórzeniu  gry  w  przyszłości.  Trzeba  jednak  pamiętać  o  ograniczonym  zastosowaniu  tych 

propozycji.  Opierają  się  one  na  daleko  idących  załoŜeniach  upraszczających.  Gracze 

zaczynają  od  jednoczesnego  wyboru  kooperacji,  a  zdrada  jednego  z  graczy  przynosi  mu 

jednorazową  korzyść  i  od  następnego  powtórzenia  prowadzi  do  trwałego  wyboru  zdrady 

przez  obydwu.  Nie  trzeba  specjalnie  wysilać  wyobraźni,  by  dostrzec  moŜliwość  pojawienia 

się  ponownie  odmiennego  scenariusza,  na  przykład  kooperacji  po  paru  kolejnych 

obustronnych wyborach zdrady. 

Trzecia  z  wymienionych  przez  Shubika  metod  wyboru  strategii  w  powtarzanym 

dylemacie  więźnia  polega  na  wyznaczeniu  wartości  końcowej.  „Pozwala  ona  na  zamianę 

nieskończonego  horyzontu  czasowego  gry  moŜliwością  jej  zakończenia  przez  gracza  „i”  w 

okresie  T  i  uzyskania  wypłaty  końcowej  Q

i

,  która  ma  zrekompensować  mu  odstąpienie 

uczestnictwa  sukcesorowi.  Q

i

  moŜe  być  dowolną  ogólną  funkcją  gry  do  etapu  T”  [Shubik, 

1995,  s. 289].  Technika  wyznaczania  wartości  końcowej  opiera  się  na  takim  modelowaniu 

gry,  Ŝe  konkretną  rolę  spełnia  w  niej  określona  sekwencja  graczy,  w  której  kaŜdy  odstępuje 

od  gry  w  zamian  za  opłatę  końcową.  Horyzont  czasowy  gry  kolejnych  graczy  jest,  tym 

samym,  skończony.  „Wartość  końcowa  dla  kaŜdego  z  nich  moŜe  być  określona  przez 

czynniki  introspektywne  takie  jak,  altruizm  lub  skłonność  do  pozostawienia  spuścizny,  albo 

zewnętrzne takie jak, podatki, subsydia, prawa i zwyczaje [Shubik, 1980, 1981]. 

Wróćmy ponownie do gry „K lub P”. ZałóŜmy, Ŝe dodatkowy bonus o wartości 25 jest 

wypłacany  graczowi  A  w  wypadku  jednoczesnego  wyboru  kooperacji  w  powtórzeniu  T. 

                                                 

9

  Graniczna  wartość  stopy  dyskontowej  d=10%  występuje  w  tych  wariantach  dylematu  więźnia,  w  których 

róŜnica  wygranych  między  zgodnymi  wyborami  zdrady  i  kooperacji  jest  dziesięciokrotnie  mniejsza  od 
relatywnej korzyści ze zdrady partnera wybierającego kooperację: 

Wygrane A = u

a

 

a

z

 

a

k

 

b

z

 

21,8 

10,0 

b

k

 

35,0 

23,0 

 

Wygrane B = u

b

 

a

z

 

a

k

 

b

z

 

21,8 

35,0 

b

k

 

10,0 

23,0 

Ź

ródło: opracowanie własne 

Obustronny  wybór  strategii  kooperacji  przynosi  relatywnie  niewielki  przyrost  wygranych  w  stosunku  do 
równowagi  w  tej  grze.  Zdrada  partnera  gotowego  do  współpracy  jest  dalece  korzystniejsza.  Dodać  naleŜy,  Ŝe 
minimalną wartością prawdopodobieństwa rozegrania kolejnej tury w tej grze gwarantującą trwałość kooperacji 
jest p=10/11. 

background image

 

36 

Gracz  B,  w  tej  samej  sytuacji,  otrzymuje  wypłatę  końcową  równą  30.  KaŜda  inna  para 

strategii  sprawia,  Ŝe  wypłata  końcowa  wynosi  -23  dla  gracza  B  i  -22  dla  gracza  A.  Takie 

ustalenie sprawia, Ŝe para strategii [a

k

,b

k

] staje się równowagą w iterowanej wersji gry „K lub 

P”.  Dodatkowo  powoduje  to  zmniejszenie  się  prawdopodobieństwa  wystąpienia  wyniku 

[a

z

,b

z

], który jest równowagą w jednoetapowej wersji gry. Zwróćmy uwagę, Ŝe ustanowienie 

wypłaty  końcowej  w  powtarzanym  dylemacie  więźnia  umoŜliwia  wyznaczenie  rozwiązania 

bez konieczności przejścia do sfery gier kooperacyjnych. 

Czwarta  z  wyróŜnionych  przez  Shubika  metod,  optymalizacja  średniej  wygranej  z 

jednego  powtórzenia  polega  na  takim  skonstruowaniu  optymalnej  strategii  by  uzyskać 

moŜliwie  najwyŜszą  granicę,  do  której  zmierzać  będzie  średnia  wypłata  przy  nieskończonej 

ilości powtórzeń. Jeśli wygrane w kaŜdym powtórzeniu są mniejsze od stałej C, to ich średnia 

wartość równieŜ. Ta metoda, zaproponowana przez Aumanna [1959], prowadzi do uzyskania 

nowej  gry,  w  której  wygranymi  są  średnie  z  nieskończonej  ilości  powtórzeń,  a  strategiami 

sekwencje  dostępnych  strategii  czystych.  Rozwiązaniem  będzie  równowaga  tak  zbudowanej 

gry. 

Propozycje  rozwiązań  gier  powtarzanych  swoją  poprawność  formalną  opierają  na 

załoŜeniach  upraszczających,  które  często  budzą  wątpliwości  u  autorów  zajmujących  się  tą 

dziedziną

10

.  W  sposób  naturalny  pojawiła  się  potrzeba  eksperymentalnej  weryfikacji 

zachowań  podmiotów  decyzyjnych  w  grach  typu  „dylemat  więźnia”  lub  podobnych.  Wiele 

studiów  o  tym  charakterze  istotnie  uzupełniło  naszą  wiedzę.  O  ich  wynikach  będzie  moŜna 

przeczytać w rozdziale 3.5.2. 

 

                                                 

10

  Poza  przedstawionymi  dobrym  przykładem  jest  wskazanie  rozwiązania  w  dylemacie  więźnia  poprzez 

odwołanie  do  metagry  drugiego  stopnia.  Idea  ta,  znana  wcześniej,  została  sformalizowana  przez  Howarda 
[1971].  Wymaga  się  w  niej,  aby  jeden  z  graczy  wybierał  spośród  strategii  uwzględniających  trafne 
przewidywanie wyboru zdrady lub kooperacji przez drugiego. Jednocześnie ten drugi wybiera spośród strategii 
zakładających, Ŝe trafnie przewiduje jak wybierze pierwszy opierający się na własnej antycypacji. Na przykład, 
gracz A moŜe wybrać strategię „zz”, czyli zdradę niezaleŜnie od tego, co zagra gracz B. Gracz B natomiast, ma 
do wyboru między innymi, strategię „zzzk” czyli wybór zdrady gdy A wybiera „zz” i kooperacji w pozostałych 
przypadkach.  Za  wyborem  rozwiązania  metodą  metagry  drugiego  stopnia  stoi  załoŜenie  o  zdolności  graczy  do 
trafnego przewidywania wyborów przeciwnika. Jego realność wydaje się, co najmniej, dyskusyjna.