Spätná indukcia

z Wikipédie, slobodnej encyklopédie

Spätná indukcia je proces zdôvodňovania späť v čase, od konca problému alebo situácie, na určenie optimálneho sledu akcií. Uskutočňuje sa najprv zvažovaním posledného rozhodnutia a výberom čo robiť v akejkoľvek situácii, v danom čase. Pomocou tejto informácie možno určiť, čo treba robiť v ďalšej fáze. Tento proces pokračuje kým sa určí najlepšia akcia pre všetky možné situácie (t. j. pre všetky možné súbory informácií) v každom okamihu rozhodnutia.

V matematických optimalizačných metódach dynamického programovania je spätná indukcia jedným z hlavných spôsobov riešenia Bellmanovej rovnice. V teórii hier sa spätná indukcia používa na výpočet dokonalej rovnováhy podhry v nadväzujúcich hrách. Jediným rozdielom je, že optimalizácia zahŕňa len jedného tvorcu rozhodnutia, ktorý sa rozhodne, čo robiť v každom okamihu, zatiaľ čo teória hier analyzuje ako sa rozhodnutia viacerých hráčov navzájom ovplyvňujú. V spätnej indukcii je podľa očakávania, čo posledný hráč urobí v každej situácii možné určiť, čo urobí druhý až posledný hráč.