Teória hier

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie

Teória hier (iné názvy: teória strategických hier, matematická teória hier[1]) je odvetvie aplikovanej matematiky. Používa modely na skúmanie interakcií s formalizovanou štruktúrou pohnútok („hier“). Teória hier skúma predpokladané a skutočné správanie sa jednotlivcov v hrách, rovnako ako aj optimálne stratégie. Zdanlivo odlišné typy interakcií sa môžu prejavovať podobnými štruktúrami pohnútok, takže všetky môžu byť reprezentované ako príklady jednej konkrétnej hry.

John von Neumann a Oskar Morgenstern ako prví formalizovali túto tému v roku 1944 v ich knihe Teória hier a ekonomické správanie (Theory of Games and Economic Behavior). Dôležité aplikácie teórie hier nájdeme v oblastiach ako operačná analýza, ekonómia, medzinárodné vzťahy, evolučná biológia, vojenská stratégia, kolektívne správanie, politológia a psychológia. Je úzko spätá s ekonómiou v tom zmysle, že sa snaží nájsť racionálne stratégie v situáciách, kde výsledok nezávisí len od našej stratégie a „podmienok na trhu“, ale aj od stratégií zvolených ostatnými hráčmi. Ciele jednotlivých hráčov môžu byť rozdielne, ale môžu sa aj prekrývať. Aplikácie vo vojenskej stratégii do istej miery prispeli k rozvoju teórie hier v jej začiatkoch.

Teória hier hrá čoraz dôležitejšiu úlohu v logike a v informatike. Niekoľko logických teórií má základ v sémantike hier. Informatici používajú hry na modelovanie interaktívnych výpočtov. Výpočtová logika sa snaží vyvinúť komplexnú formálnu teóriu (logiku) interaktívnych výpočtových úloh a zdrojov tak, že tieto entity formalizuje ako hry medzi výpočtovým agentom (činiteľom) a jeho okolím.

Analýza teórie hier sa môže vzťahovať na jednoduché zábavné hry alebo na závažnejšie aspekty života a spoločnosti. Väzňova dilema, ktorú spopularizoval matematik Albert W. Tucker, poskytuje príklad použitia teórie hier v bežnom živote – má mnoho implikácií pre charakter ľudskej kooperácie.

Biológovia používajú teóriu hier na pochopenie a predpovedanie určitých výsledkov evolúcie. Príkladom je koncept evolučne stabilnej stratégie, ktorý uviedli John Maynard Smith a George R. Price v roku 1973 v časopise Nature. Pozri tiež evolučná teória hier a behaviorálna ekológia.

Analytici hier bežne používajú v spojení s teóriou hier aj ostatné odvetvia matematiky, predovšetkým pravdepodobnosť, štatistiku a lineárne programovanie.

Typy hier[upraviť | upraviť zdroj]

Hra je dobre definovaný matematický objekt. Pozostáva z množiny hráčov, zo stratégií dostupných daným hráčom a ku každej kombinácii stratégií sú určené výplaty hráčov. Teória hier rozdeľuje hry do mnohých kategórií podľa toho, aké konkrétne metódy sa používajú na ich riešenie a ako v tej-ktorej kategórii definujeme „riešenie“. Medzi základné typy hier patria:

Hry s nulovým súčtom a hry s nenulovým súčtom[upraviť | upraviť zdroj]

V hrách s nulovým súčtom je celkový úžitok pre všetkých zúčastnených hráčov a pre každú kombináciu stratégií rovný nule. Inak povedané, víťazný hráč získava na úkor ostatných. Príkladom pre hru s nulovým súčtom je napríklad go, šach alebo poker. V týchto hrách víťaz získa práve toľko, koľko jeho protihráči prehrajú. V realite sa väčšinou stretávame s hrami s nenulovým súčtom (v podnikaní alebo v politike, ale príkladom je aj známa väzňova dilema), pretože niektoré výsledky prinášajú celkový čistý úžitok väčší alebo menší než nula. Inak povedané, zisk jedného hráča nemusí pre iného hráča nutne znamenať stratu. Napríklad obchodný kontrakt za bežných okolností predpokladá kladný celkový výsledok, lebo každá zo zúčastnených strán je na tom v konečnom dôsledku lepšie, než v situácii, keď by sa kontraktu nezúčastnila. Vo všeobecnosti je jednoduchšie analyzovať hry s nulovým súčtom. Napokon každú hru možno pretransformovať na hru s nulovým súčtom jednoducho tak, že pridáme dodatočného fiktívneho hráča a prostredníctvom jeho strát budeme kompenzovať výhry reálnych hráčov. Vhodným spôsobom zobrazenia výsledkov hry je matica výnosov.

Kooperatívne hry[upraviť | upraviť zdroj]

Kooperatívna hra je založená na existencii vymáhateľnej dohody medzi hráčmi a skupinami. V priebehu hry koná hráč s ohľadom na to, aká je jeho dohoda s ostatnými hráčmi. Hráči teda navzájom spolupracujú. Teória kooperatívnych hier vysvetľuje fungovanie hodnoverných dohôd. Hodnovernosť dohody je úzko spätá so stabilitou.

Axiomatické vyjednávanie[upraviť | upraviť zdroj]

Dvaja hráči môžu vyjednávať o veľkosti svojich podielov v rámci kontraktu. Teória axiomatického vyjednávania umožňuje určiť, aký veľký podiel je pre hráčov primeraný. Napríklad Nashovo riešenie vyjednávania vyžaduje, aby bol podiel dostatočne veľký a účinný. Podrobné objasnenie problematiky poskytujú špecializované učebnice.

Môže sa však stať, že niekoho nezaujíma „primerané“ riešenie a vyžaduje viac. Čo na to hovorí Nashov koncept riešenia vyjednávania? V skutočnosti jestvuje nekooperatívna hra striedavých ponúk (vyvinul ju Rubinstein), ktorá potvrdzuje Nashovo riešenie vyjednávania ako jedinečný bod Nashovej rovnováhy.

Charakteristické funkčné hry[upraviť | upraviť zdroj]

Namiesto dvoch hráčov môžu spolupracovať viacerí hráči tak, aby dosiahli lepší výsledok. Nie je jasné, aký veľký podiel z celkového výsledku pripadne na každého hráča. Jadro poskytuje primeraný súbor možných podielov. Kombinácia podielov je v jadre, ak neexistuje subkoalícia, ktorej členovia by mohli získať väčší celkový výnos než je podiel na koalícii. Ak podiel neleží v jadre, niektorí členovia môžu byť sklamaní a začnú uvažovať o opustení celej skupiny a vytvorení menšej skupinky (subkoalície) s niektorými inými nespokojnými hráčmi.

Hry s úplnými informáciami[upraviť | upraviť zdroj]

V hrách s úplnými informáciami má každý hráč k dispozícii rovnaké informácie týkajúce sa hry ako všetci ostatní. Príkladom hry s úplnými informáciami je šach. Naopak, hrou s neúplnými informáciami je napríklad poker alebo väzňova dilema. Hry s úplnými informáciam sa v bežnom živote vyskytujú iba zriedka. V teórii sa tieto hry používajú pre zjednodušenie - ako aproximácia skutočných, v realite prebiehajúcich hier.

Aplikácie teórie hier v hazardných hrách[upraviť | upraviť zdroj]

Ako referenčný rámec si môžme zvoliť napríklad poker, ktorý ako hra podľa teórie hrier spĺňa tieto vlastnosti:

  • Je dynamická (hráči sa rozhodujú jeden po druhom)
  • Je nekooperatívna (každý hrá sám za seba)
  • S nedokonalou informáciou (poznáme výplaty hráčov, ale nepoznáme akciu, ktorú hráči zahrajú. Máme len presvedčenia s akou pravdepodobnosťou zahrajú hráči akciu)
  • Je v extenzívnom tvare a zapisuje sa pomocou herného stromu (kvôli tomu, že hra je dynamická)

Reprezentácia hry poker v extenzívnom tvare[upraviť | upraviť zdroj]

  1. Hráč Náhoda (N) rozdá hráčovi 1 dve karty z balíčka kariet. Celkovo mu môže rozdať 1351 kartových kombinácií.
  2. Hráč 1 zahrá jednu zo svojich n stratégií s kartami, ktoré mu boli rozdané.
  3. Hráčovi 2 sa rozdajú dve karty z balíčka kariet. Celkovo mu môže byť rozdaných 1351 kartových kombinácií.
  4. Hráč 2 zahrá jednu zo svojich m stratégií s kartami, ktoré mu boli rozdané
  5. Krok 2) a 4) opakujeme, pokiaľ hráči prestanú vsádzať a navyšovať.
Bitmatica výplat hráča 1 a hráča 2:
S1 A11 B11  A12 B12  ...  A1n B1n
S2 A21 B21  A22 B22  ...  A2n B2n
...  ...  ...  ...  ... 
Sm  Am1 Bm1  Am2 Bm2  ... Amn Bmn

Kvôli zjednodušeniu sa budeme venovať iba situáciám, kde sú iba dvaja hráči. Takúto hru môžeme popísať jednou bimaticou s m riadkami a n stĺpcami. Hráč 1 má m stratégií (S1,...,Sm) a hráč 2 má n stratégií (S'1,...,S'n). Teda ak si hráč 1 vyberie stratégiu Si a hráč 2 zvolí S'j , potom bude výplata hráča 1 Aij a hráča 2 Bij

V skutočnej hre hráči používajú zvyčajne zmiešané stratégie. Robia to tak, že si vyberú jednu čistú stratégiu, ktorá sa hráčom hodí. Túto stratégiu vyberajú s určitou pravdepodobnosťou. Podľa teórie hier súčet jednotlivých pravdepodobností, s ktorými vyberajú hráči čisté stratégie, je 1. Keby sme chceli zistiť výplatu hráča 1 v zmiešaných stratégiách, vytvoríme si vektor p, kde zložka vektora pi bude pravdepodobnosť, s akou bude hráč 1 hrať stratégiu i. Pre hráča 2 analogicky vytvoríme vektor q, kde zložka qi bude pravdepodobnosť, s akou bude hráč 2 hrať stratégiu i.

Nashovo equilibrum[upraviť | upraviť zdroj]

Dvojica stratégií (p,q), kde p je stratégia hráča 1 a q je stratégia hráča 2, sa nazýva "Nashovo ekvilibrium (NEQ)", ak p je najlepšia reakcia na q a q je najlepšia reakcia na p.

Pre hráča 1 si nazveme stratégiu p "najlepšiu reakciu" na stratégiu q hráča 2, ak p prinesie hráčovi 1 najvyššiu možnú výplatu: 22 Hráč 1 Hráč 2 S21 S22 b 1-b S11 a A11 A12 S12 1-a A21 A22 Výplata hráča 1, keď zahrá stratégiu S11: b.A11+ (1-b).A12 Výplata hráča 1, keď zahrá stratégiu S12: b.A21+ (1-b).A22 Výplata hráča 1, keď zahrá stratégiu S21: a.B11+ (1-a).B21 Výplata hráča 1, keď zahrá stratégiu S22: a.B12+ (1-a).B22 Kde a je pravdepodobnosť s akou zahrá hráč 1 stratégiu S11 a 1-a je pravdepodobnosť s akou zahrá hráč 1 stratégiu S12. Hráč 2 zahrá stratégiu S21 s pravdepodobnosťou b a stratégiu S22 pravdepodobnosťou 1-b. Dá sa ukázať, že v každej hre existuje minimálne jedno NEQ, ktoré nemusí nutne nastať pri čistých stratégiách.

Hráč 1
S21 S22
b 1-b
S11 a A11  A12
S12 1-a A21  A22
Hráč 2
S21 S22
b 1-b
S11 a B11  B12
S12 1-a B21  B22

Referencie[upraviť | upraviť zdroj]

Konvenčné stratégie pre hazardné hry

Nashova rovnováha

The matematics of poker

  1. teória hier. In: Slovník filozofia a prírodné vedy. 1. vyd. Bratislava : Pravda, 1987. s. 729 - 733.