Wat is het dilemma van de gevangenen?

In het spel zelf worden straffen (en beloningen, indien relevant) weergegeven door nut nummers. Positieve cijfers vertegenwoordigen goede resultaten, negatieve cijfers vertegenwoordigen slechte resultaten en de ene uitkomst is beter dan de andere als het bijbehorende cijfer groter is. (Wees echter voorzichtig met hoe dit werkt voor negatieve getallen, want -5 is bijvoorbeeld groter dan -20!)

In de bovenstaande tabel verwijst het eerste nummer in elk vak naar de uitkomst voor speler 1 en het tweede nummer naar de uitkomst voor speler 2. Deze cijfers vertegenwoordigen slechts een van de vele getallenreeksen die consistent zijn met het dilemma van de gevangenen.

Zodra een spel is gedefinieerd, is de volgende stap bij het analyseren van het spel het beoordelen van de strategieën van de spelers en proberen te begrijpen hoe de spelers zich waarschijnlijk zullen gedragen. Economen maken een paar aannames bij het analyseren van games - eerst gaan ze ervan uit dat beide spelers op de hoogte zijn de uitbetaling zowel voor zichzelf als voor de andere speler, en ten tweede gaan ze ervan uit dat beide spelers kijken naar

instagram viewer

rationeel maximaliseren hun eigen uitbetaling van het spel.

Een gemakkelijke eerste benadering is om te zoeken naar wat wordt genoemd dominante strategieën- strategieën die het beste zijn, ongeacht welke strategie de andere speler kiest. In het bovenstaande voorbeeld is kiezen voor bekennen een dominante strategie voor beide spelers:

Aangezien bekennen het beste is voor beide spelers, is het niet verwonderlijk dat de uitkomst waarbij beide spelers bekennen een evenwichtsuitkomst van het spel is. Dat gezegd hebbende, is het belangrijk om wat nauwkeuriger te zijn met onze definitie.

Het concept van een Nash Equilibrium werd gecodificeerd door wiskundige en speltheoreticus John Nash. Simpel gezegd, een Nash Equilibrium is een set strategieën met de beste respons. Voor een spel voor twee spelers is een Nash-evenwicht een uitkomst waarbij de strategie van speler 2 het beste antwoord is op de strategie van speler 1 en de strategie van speler 1 het beste antwoord op de strategie van speler 2.

Het vinden van het Nash-evenwicht via dit principe kan worden geïllustreerd in de tabel met resultaten. In dit voorbeeld zijn de beste reacties van speler 2 op speler één groen omcirkeld. Als speler 1 bekent, is speler 2 het beste om te bekennen, aangezien -6 beter is dan -10. Als speler 1 niet bekent, is speler 2 het beste om te bekennen, omdat 0 beter is dan -1. (Merk op dat deze redenering sterk lijkt op de redenering die wordt gebruikt om dominante strategieën te identificeren.)

De beste reacties van speler 1 zijn blauw omcirkeld. Als speler 2 bekent, is de beste reactie van speler 1 om te bekennen, aangezien -6 beter is dan -10. Als speler 2 niet bekent, is de beste reactie van speler 1 om te bekennen, omdat 0 beter is dan -1.

Het Nash-evenwicht is het resultaat waarbij er zowel een groene cirkel als een blauwe cirkel is, aangezien dit een reeks beste responsstrategieën voor beide spelers vertegenwoordigt. Over het algemeen is het mogelijk om meerdere Nash-evenwichten of helemaal geen te hebben (althans in pure strategieën zoals hier beschreven).

Je hebt misschien gemerkt dat het Nash-evenwicht in dit voorbeeld op een bepaalde manier suboptimaal lijkt (in het bijzonder omdat het niet optimaal is voor Pareto) omdat het voor beide spelers mogelijk is om -1 te krijgen in plaats van -6. Dit is een natuurlijke uitkomst van de interactie die aanwezig is in het spel - in theorie zou bekennen geen optimale strategie voor de groep collectief, maar individuele prikkels voorkomen dat deze uitkomst is bereikt. Als speler 1 bijvoorbeeld dacht dat speler 2 zou zwijgen, zou hij een stimulans hebben om hem te verraden in plaats van te zwijgen, en omgekeerd.

Om deze reden kan een Nash-evenwicht ook worden gezien als een uitkomst waarbij geen enkele speler een prikkel heeft om eenzijdig (d.w.z. door hemzelf) af te wijken van de strategie die tot die uitkomst heeft geleid. In het bovenstaande voorbeeld kan geen enkele speler, zodra de spelers ervoor hebben gekozen om te bekennen, het beter doen door zelf van gedachten te veranderen.