Ketszemelyes, teljes informacioju jatekok

Előadó: Dr. Várterész Magdolna

3. Kétszemélyes, teljes információjú játékok

3.1. A játékok osztályozása

A játékokat két nagy csoportba tudjuk sorolni:

szerencsejátékok
(itt minden a véletlen műve, pl.: rulett)
stratégiai játékok
(a játékos befolyásolhatja a játék kimenetét, pl.: sakk, malom, amőba, üzleti "játékok", harci "játékok")

Neumann János maga is foglalkozott ezzel. Harsányi János 1994-ben közgazdasági Nobel-díjat kapott; a játékelmélet az ő nevéhez fűződik.

Stratégiai játékok osztályozása:

résztvevők száma:	2,3,...,n személyes játékok
	(néha a véletlent is személynek veszik)
véges játékok:	olyan stratégiai játékok, amelyben minden állásban véges sok
	szabályos lépés közül lehet választani, s véges sok lépés után véget ér
zérusösszegű:	ha nyeremények + veszteségek = 0
	(beszélhetünk nem zérusösszegű stratégiai játékokról is)
véletlen szerepe:	1. sztochasztikus (pl. bridge)
	2. determinisztikus (pl. sakk)
teljes információjú:	tudom, hogy a másik mit lépett. A játékosok a játékkal
	kapcsolatos összes információt ismerik, s felváltva lépnek.

Leírás:	játékszabályok megadása
	Milyen játékállások fordulhatnak elő, az egyes állásokban milyen szabályos lépések vannak, mik ezeknek az előfeltétele. Célfeltétel: mikor kell befejezni, milyen állásban, s ekkor kit kell győztesnek kikiáltani.

A kétszemélyes játékot is le kell írni. Ehhez a következő leírást alkalmazzuk:

3.2. A játékok reprezentációja és a reprezentáció szemléltetése

H legyen a játék állásainak a halmaza, {A, B} a két játékos.

All = { (h, x) | h

H, x

{A, B} }

- ez az állapottér, ahol x azt jelzi, hogy ki következik

Kezdőállapot:

k = (i, I)

,ahol i

H kezdőállás, I

{A, B} kezdő játékos

Végállapot:

V = { (h, x) \| h H végállások, x nyertes v. vesztes }	megállapodás kérdése, hogy x
	nyertes vagy vesztes

Lépés:

l: H H

előfeltétel_l(h)

az egyes lépésekhez előfeltételek is tartoznak

Operátorok:

O = { o: (h, x) ® (h', x') | l: h ® h', előfeltétel_l(h) teljesül, h,h' Î H és x' = x ellenfele }

A játék állásait egy reprezentációs gráffal tudjuk szemléltetni. A reprezentációs gráf egy játékgráf:

Véges játék esetén véges a gráf is. Minden út benne véges.
Körök: a játékszabályok ezt általában nem engedik, vagy adnak rá valami korlátozást (a köröket fává egyenesítéssel is fel lehet oldani).

A start csúcsból egy levélbe vezető út: egy lehetséges játszma.

3.3. A stratégia

Egy játékos számára hogyan lehetne egy teret adni, ami befolyásolná a játék kimenetét? Stratégia. Ez mindig egy (1) játékoshoz tartozik. Minden, a játék során előforduló állapotban amikor ő következik a stratégia megmondja, hogy mit lépjen. A stratégia tehát egy döntés.
Jó a stratégia, ha minden állapotra van terv, bármit is lép az ellenfél.
Lehetséges hiperutak: a játékos különböző stratégiái. Ahány különböző hiperút, annyi különböző lehetséges stratégia a játékos számára.

Gyűjtsük össze a játék során előfordulható összes állapotot:

Tegyük fel, hogy például A szeretne nyerni. Ekkor a start állapotnak szerepelnie kell a stratégiában. Menjünk tovább a zölddel jelölt részen. B viszont (az ellenfél) bármit léphet, ezért az ÖSSZES olyan állapotnak is szerepelnie kell a stratégiában amelyet B léphet, hiszen az ellenfél minden válaszlépésére reagálni kell tudni!

Ahol A következik lépni: választunk a szabályos lépések közül. VAGY lépések vannak, lehet választani. B lépései ÉS élek. Ha B lép, akkor a stratégiába fel kell venni mindazon állapotokat, ahova B léphet.

Át kell alakítani a játékfát az ADOTT játékos alapján ÉS-VAGY gráffá. Ebben kell hiperutakat keresni! Az adott játékosnál VAGY élek lesznek, az ellenfélnél pedig ÉS élek.

Hogyan választunk: úgy, hogy a játék kimenetele lehetőleg nyeréssel végződjön, ne veszítsünk.

Nyerő stratégia: a stratégiával játszva a másik játékos lépéseitől függetlenül garantáltan nyerünk! Ha a levélelemek mind nyerőállások, akkor a stratégia nyerő.
Feladat: a stratégiák közül válasszunk nyerő stratégiát.

3.4. Adott állásban a következő lépés kiválasztásának módszerei

Minden kétszemélyes, teljes információjú játék esetén az egyik (és csakis az egyik) játékos számára garantáltan van nyerő stratégia. Ha van, akkor több is lehet.
Kérdés: melyik játékos számára lesz?

Az állítás csupán azt garantálja, hogy az egyiknek van nyerő stratégiája.

Bizonyítása konstruktív módon történik, s ehhez az egész játékfát elő kell állítani:

A leveleket megcímkézzük azalapján, hogy ott ki nyert. Ezután visszafelé haladunk (itt középső szint), s megnézzük, hogy ki lép (itt B). Mivel B tud úgy lépni innen, hogy ő nyerjen, ezért B-t írunk be (szürkével jelölve). Mint látható, ez egy B nyerő játék. A start csúcs címkéje határozza meg, hogy kinek van nyerő stratégiája. Ez megkonstruálja a nyerő játékost, s a nyerő stratégiát is. Címkemódszer. A címke jelöli, hogy az adott állásból kinek van nyerő stratégiája.

Az előbbi címkemódszerrel akkor van gond, ha túl nagy a játékfa (nem tudjuk előállítani), s így explicit módon nem tudjuk meghatározni hogy ki nyer. Ekkor használjuk a következő módszerek egyikét:

3.4.1. Mini-max módszer

Nem építjük fel az adott állásban a teljes játékfát (pl. nem tudjuk, mert olyan nagy lenne).

Amit tehetünk: néhány lépésre előre kombinálunk. Az adott állásból kiinduló játékfának csak egy részét állítjuk elő. A kialakuló állások (levélelemek) nem végállások, de mégis valahogy minősíteni kellene őket, hogy tudjunk választani.

Valamilyen heurisztikára lesz szükség, amely megmondja, hogy az adott játékos számára az adott állás mennyire jó, mennyire ígéretes. Minél jobb az állás, annál nagyobb értéket rendelünk hozzá. Döntetlen: 0 körüli érték.
Ha az ellenfél számára jobb: negatív érték.

Az azonos szinten lévő levélelemeket kiértékeljük (heurisztika). Az ősöknél ezt vesszük figyelembe, ill. azt, hogy ki következik lépni.

Ha A következik:	a legnagyobb értékű gyermeket fogjuk választani
	(nekünk az a legjobb)
Ha B következik:	a legkisebb értékűt választjuk
	(ez B-nek a legjobb, ezért úgy számítunk, hogy ő azt fogja lépni, ami neki a legjobb)

Ez a módszer az alapja minden kétszemélyes játékkal kapcsolatos tanácsadásnak!

3.4.2. Nega-max módszer

Egy állás kiértékelőfüggvénye az egyik játékos szempontjából értékeli ki az állásokat. Amennyire jó nekünk egy állás, annyira rossz az ellenfélnek (és fordítva).
B számára egy állás heurisztikája pontosan az ellentetje az A heurisztikájának.

-h_A(n) = h_B(n)

Nem kell szintről-szintre megvizsgálni, hogy ki következik! Levélszinten az ellenfél szerinti kiértékelőfüggvényeket adjuk meg. Ez a játékos pontosan a szülő szint ellenfele. A szülő szinten a lenti értékek az ellentettjére változnak, s ezek közül a maximumot vesszük.

A módszer előnye: nem kell egyik szinten minimumot, másikon maximumot venni. Eredménye amúgy azonos az előző módszerével. Mindig a maximumot kell venni.

3.4.3. Alfa-béta vágás

Generálás közben fog kiderülni, hogy mekkora részlet kell.
Amint van a szülőnek gyermeke, a szülő pontos értékének alsó vagy felső becslését meg tudjuk adni.

Max. szülő	alsó becslését tudjuk megadni a végleges értéknek
Min. szülő	felső becslését tudjuk megadni a végleges értéknek


a csúcs értéke legalább 3 lesz	a csúcs értéke legfeljebb 3 lesz

Lehet, hogy még nem állítottuk elő az összes gyermeket, de már tudunk valamit mondani a szülőről.

A zölddel jelölt résznél vágunk, mivel azt a részt már nem kell előállítani, hiszen már biztos, hogy nem fog "beleszólni" a felette lévő részbe.

-vágás, mert az alatt vágtuk el

A zölddel jelölt résznél vágunk, mivel az az alatti rész végleges, pontos értékének a kiszámítása már biztos hogy nem fogja módosítani az eredményt.

-vágás, mert a alatt vágtuk el

Ez a módszer is ugyanazt a javaslatot eredményezi, mint a mini-max módszer.
Előnye: csökken a játékfa mérete, mert bizonyos részeket nem kell előállítani.

- ha ez teljesül, akkor lehet vágni

Vissza a lap tetejére