Što je povratna indukcija?
Indukcija unatrag u teoriji igara je iterativni proces rasuđivanja unatrag u vremenu, od kraja problema ili situacije, radi rješavanja konačnih opsežnih oblika i sekvencijalnih igara, te zaključivanja niza optimalnih radnji.
Objašnjena unatrag indukcija
Povratna indukcija korištena je za rješavanje igara otkako su John von Neumann i Oskar Morgenstern ustanovili teoriju igara kao akademski predmet kada su 1944. objavili svoju knjigu „ Teorija igara i ekonomsko ponašanje“ .
U svakoj fazi igre unatrag indukcija određuje optimalnu strategiju igrača koji napravi posljednji potez u igri. Tada se određuje optimalna akcija sljedećeg igrača u pokretu, uzimajući zadnju radnju igrača kao zadanu. Taj se proces nastavlja unatrag sve dok se ne utvrdi najbolja akcija za svaki trenutak. Učinkovito, jedno je određivanje Nash-ove ravnoteže svakog podgame u originalnoj igri.
Međutim, rezultati zaključeni unatrag indukcijom često ne mogu predvidjeti stvarnu ljudsku igru. Eksperimentalne studije pokazale su da se "racionalno" ponašanje (kako je predviđeno teorijom igara) rijetko izlaže u stvarnom životu. Iracionalni igrači zapravo mogu dobiti veće plaće od predviđenih unazad indukcijom, kao što je prikazano u igri s centipedom.
U igri s centipedom dva igrača naizmjenično dobivaju priliku zauzeti veći udio povećanog lonca novca ili proslijediti lopticu drugom igraču. Isplate su raspoređene tako da ako lonac pređe nečijem protivniku, a protivnik uzme poticaj u sljedećem krugu, jedan će primiti nešto manje nego ako bi ga uzeo u ovom krugu. Igra se zaključuje čim igrač preuzme zaostatak, pri čemu igrač dobiva veći dio, a drugi igrač manji dio.
Primjer indukcije unatrag
Kao primjer, pretpostavimo da je igrač A na prvom mjestu i mora odlučiti treba li "uzeti" ili "proslijediti" ulog, koji trenutno iznosi 2 dolara. Ako uzme, tada A i B dobivaju po 1 USD, ali ako A prođe, igrač B. mora donijeti odluku o primanju ili prolazu. Ako B uzme, dobit će 3 USD (tj. Prethodni ulog od $ 2 + $ 1) a A dobiva 0 USD. Ali ako B prođe, A sada odlučuje hoće li proći ili proći, i tako dalje. Ako oba igrača uvijek odluče proći, na kraju igre dobijaju isplatu u iznosu od 100 USD.
Smisao igre je ako A i B surađuju i nastave prolaz do kraja igre, a maksimalno im se isplaćuje 100 USD. Ali ako imaju nepovjerenje prema drugom igraču i očekuju da će ih "primiti" u prvoj prilici, Nash-ova ravnoteža predviđa da će igrači preuzeti najmanji mogući zahtjev (u ovom slučaju 1 USD).
Nash-ova ravnoteža u kojoj niti jedan igrač nema poticaja za odstupanjem od svoje odabrane strategije nakon razmatranja izbora protivnika sugerira da bi prvi igrač uzeo pot u prvom krugu igre. Međutim, u stvarnosti to čini relativno mali broj igrača. Kao rezultat toga, dobit je veća od one koja je predviđena analizom ravnoteže.
Rješavanje uzastopnih igara koristeći unatrag indukciju
Ispod je jednostavna sekvencijalna igra između dva igrača. Oznake s Playerom 1 i Playerom 2 unutar njih su setovi podataka za igrače, odnosno jedan, odnosno dva. Brojevi u zagradama na dnu stabla predstavljaju isplatu u svakoj točki. Igra je također sekvencijalna, pa igrač 1 donosi prvu odluku (lijevo ili desno), a igrač 2 donosi odluku nakon igrača 1 (gore ili dolje).
Slika 1
Povratna indukcija, kao i sva teorija igara, koristi pretpostavke racionalnosti i maksimizacije, što znači da će Player 2 u svakoj danoj situaciji maksimizirati svoju isplatu. U oba skupa podataka imamo dva izbora, četiri ukupno. Eliminiranjem izbora koje Player 2 neće odabrati, možemo suziti svoje stablo. Na ovaj način ćemo podebljati linije koje maksimaliziraju isplatu igrača na zadanom skupu informacija.
Slika 2
Nakon ovog smanjenja, Player 1 može povećati svoje otplate sada kada su poznati izbori igrača 2. Rezultat je ravnoteža pronađena povratnom indukcijom igrača 1 koji odabire "ispravno" i igrača 2 odabire "gore". Ispod je rješenje igre s podešenom ravnotežnom stazom.
Slika 3
Na primjer, moglo bi se lako postaviti igra slična onoj gore koristeći kompanije kao igrače. Ova igra može uključivati scenarije izdanja proizvoda. Ako je Tvrtka 1 htjela izdati proizvod, što bi Društvo 2 moglo učiniti kao odgovor? Hoće li tvrtka 2 objaviti sličan konkurentski proizvod? Predviđajući prodaju ovog novog proizvoda u različitim scenarijima, možemo postaviti igru koja će predvidjeti kako se događaji mogu odvijati. Ispod je primjer kako se može oblikovati takva igra.
Slika 4