Ve hře samotné jsou tresty (a případně odměny) reprezentovány nástroj čísla. Kladná čísla představují dobré výsledky, záporná čísla představují špatné výsledky a jeden výsledek je lepší než druhý, pokud je číslo s ním spojené větší. (Buďte však opatrní, jak to funguje u záporných čísel, protože -5 je například větší než -20!)
V tabulce výše se první číslo v každém poli vztahuje k výsledku pro hráče 1 a druhé číslo představuje výsledek pro hráče 2. Tato čísla představují jen jedno z mnoha čísel, které jsou v souladu s nastavením dilemy vězňů.
Jakmile je hra definována, dalším krokem při analýze hry je posouzení strategií hráčů a pokusit se pochopit, jak se hráči pravděpodobně budou chovat. Ekonomové při analýze her dělají několik předpokladů - nejprve předpokládají, že si oba hráči jsou vědomi výplaty pro sebe i pro druhého hráče a zadruhé předpokládají, že oba hráči hledají na racionálně maximalizovat jejich vlastní návratnost ze hry.
Jeden snadný počáteční přístup je hledat to, co se říká
dominantní strategie- strategie, které jsou nejlepší bez ohledu na to, jakou strategii si druhý hráč vybere. Ve výše uvedeném příkladu je volba přiznat se dominantní strategií pro oba hráče:Vzhledem k tomu, že přiznání je nejlepší pro oba hráče, není divu, že výsledek, ve kterém se oba hráči přiznají, je vyváženým výsledkem hry. To znamená, že je důležité být s naší definicí trochu přesnější.
Koncept a Nashova rovnováha byl kodifikován matematikem a teoretikem hry Johnem Nashem. Jednoduše řečeno, Nashova rovnováha je sada strategií nejlepší reakce. U hry pro dva hráče je Nashova rovnováha výsledkem, kdy strategie hráče 2 je nejlepší reakcí na strategii hráče 1 a strategie hráče 1 je nejlepší reakcí na strategii hráče 2.
Nalezení Nashovy rovnováhy pomocí tohoto principu lze ilustrovat v tabulce výsledků. V tomto příkladu jsou nejlepší reakce hráče 2 na hráče jedna zakroužkované zeleně. Pokud se hráč 1 přizná, nejlepší reakcí hráče 2 je přiznat se, protože -6 je lepší než -10. Pokud se hráč 1 nepřizná, nejlepší odpověď hráče 2 je přiznat se, protože 0 je lepší než -1. (Všimněte si, že toto zdůvodnění je velmi podobné zdůvodnění použitému k identifikaci dominantních strategií.)
Nejlepší reakce hráče 1 jsou zvýrazněny modrou barvou. Pokud se hráč 2 přizná, nejlepší reakcí hráče 1 je přiznat se, protože -6 je lepší než -10. Pokud se hráč 2 nepřizná, nejlepší odpověď hráče 1 je přiznat se, protože 0 je lepší než -1.
Nashova rovnováha je výsledkem, kdy existuje jak zelený kruh, tak modrý kruh, protože to představuje soubor nejlepších reakčních strategií pro oba hráče. Obecně je možné mít více Nashových rovnováh nebo vůbec žádné (alespoň v čistých strategiích, jak je zde popsáno).
Možná jste si všimli, že Nashova rovnováha se v tomto příkladu jeví jako suboptimální (konkrétně v tom, že to není Pareto optimální), protože je možné, aby oba hráči dostali -1 spíše než -6. Toto je přirozený výsledek interakce přítomné v teorii hry - ne přiznání by bylo optimální strategie pro skupinu společně, ale individuální pobídky tomuto výsledku brání bylo dosaženo. Například, pokud by si hráč 1 myslel, že hráč 2 zůstane potichu, bude mít motivaci ho raději krys, než aby mlčel, a naopak.
Z tohoto důvodu lze Nashovu rovnováhu považovat také za výsledek, kdy žádný hráč nemá motivaci jednostranně (tj. Sám) odchýlit se od strategie, která k tomuto výsledku vedla. Ve výše uvedeném příkladu, jakmile se hráči rozhodnou přiznat, žádný z hráčů nemůže udělat lépe tím, že sám změní svou mysl.