Vesmírná školaVesmírná školaVesmírná školaVesmírná školaVesmírná školaVesmírná škola

Aktuální číslo:

2024/12

Téma měsíce:

Expedice

Obálka čísla

O zajatcích, vězních a empatii

Dimenze užitku a dimenze let
 |  11. 10. 2007
 |  Vesmír 86, 612, 2007/10

Před delším časem vyšly ve Vesmíru dva na sebe navazující příspěvky věnované témuž tématu 1) – úloze známé v teorii nekooperativních her jako vězňovo dilema (v prvním z citovaných článků byl navržen termín „zajatcovo dilema“). Pro připomenutí – jde o slavnou úlohu teorie takzvaných bimaticových her, která dráždí mnohem víc nematematiky než herní teoretiky, nicméně všem ukazuje, že i dobře zdůvodněné výsledky se nám mohou zdát absurdní. Alespoň to tak někomu připadá. Text, který se právě chystáte odložit, by měl být o tom, že s tou absurditou to možná není tak tragické. Abychom se k tomu dopracovali, chce to přeci jen trochu širší připomenutí. 2)

O čem přemýšlejí vězňové

Nuže, úloha zvaná „vězňovo dilema“ je úloha matematická a k výsledku se propracovává přes exaktní lineární a bilineární algebru. Nicméně se dá vyprávět (a celkem snadno i řešit) také bez použití nátlakových metod, jako jsou vzorce, matice a podobné matematické nástroje. Představte si, že v zemi, ve které zákony připouštějí existenci takzvaného korunního svědka obžaloby (to je obžalovaný, který za slib beztrestnosti usvědčí své spolupachatele), byli pro tentýž závažný zločin zatčeni dva spoluviníci. Vyšetřovatel si je nechá předvést a řekne jim asi toto: „Situace je celkem přehledná. Nemám dost nevyvratitelných důkazů, aby vás prokurátor mohl obžalovat z onoho závažného zločinu, nicméně na vás mám několik drobnějších provinění, pro která se každý dostanete spolehlivě asi tak na rok do vězení. Pokud se ale jeden z vás přizná, stane se korunním svědkem, vyvázne bez trestu a jeho komplic to odskáče všechno – odhaduji to tak na dvacet let. Je také možné, že se přiznáte oba, a pak už nebude žádný korunní svědek zapotřebí a o trest se tak trochu podělíte – mohlo by to dát asi tak dvanáct let pro každého. Tak se rozhodněte.“

Než si řekneme, co si o tom myslí teorie her, připomeňme si, že ji na zcela obecné úrovni zajímají dva hlavní typy otázek: co by poradila každému hráči jako jeho nejrozumnější chování a jestli jsou ve hře stabilní situace, které žádný z obou hráčů nechce svým jednostranným zásahem změnit (pokud už se do nich hra nějak dostane). Odpovědí na první otázku je obvykle doporučení, aby si hráč zjistil, co nejhoršího mu může protihráč udělat, a na to se co nejlépe připravil. Pokud jde o druhou otázku, takové situace mohou být někdy (jen někdy) trochu složité, vždy ale spočívají v tom, že se sejdou strategie obou hráčů tak, že si každý z nich pohorší, jakmile tu svou (izolovaně) změní. Hra tím jaksi „zamrzne“ v nějakém stabilním stavu.

Pro vězňovo dilema je podstatné, že na obě otázky dostaneme shodnou odpověď – pro každého hráče je nejlepší se přiznat a zároveň to je situace, na které už žádný z nich nechce samostatně nic měnit. Mimochodem ani teorie kooperativních her nevede k ničemu jinému – koalice obou hráčů by nutně byla nestabilní a okamžitě by se rozpadla s tím, že by její bývalí členové vzápětí zvolili právě uvedené sebevražedné strategie.

O čem přemýšlejí ti, kteří přemýšlejí o vězních

Uvedený teoretický výsledek budí rozpaky nejspíš u každého, kdo se s ním setká, a není málo těch, kdo se s těmi rozpaky touží vyrovnat veřejně. Díky tomu literatura o vězňově dilematu zahrnuje už dnes pozoruhodně mnoho položek a pořád ještě přibývají nové – ostatně tenhle článek je jednou z nich. Je zajímavé, kolik je mezi jejími autory psychologů, sociologů, etiků a politologů. Názorů, které vyslovili, je poměrně široká škála, dají se ale shrnout do dvou vět – „Tak to přeci dopadnout nemůže“ a „Ono to tak nakonec nejspíš dopadnout musí“ – a do pokusů řešit nějak rozpor mezi nimi. Zvlášť když obě zpravidla vysloví tentýž autor. A tak se v testech hemží slova jako altruizmus, sobectví, empatie, důvěra a důvěryhodnost a kdovíjaká další, proložená úvahami, jestli by to celé dopadlo stejně, kdyby v situaci vystupovaly místo otrlých zločinců třeba dvě Matky Terezy. Háček je v tom: Pokud by se držely principu teorie her, že totiž každý hráč usiluje výhradně o maximalizaci svého vlastního užitku, zdá se, že by se i ony „přiznaly“ (pomineme-li to, že Matka Tereza obviněná z těžkého zločinu už sotva bude Matkou Terezou).

Nejde ale jen o celkem nevinné hříčky s pověstí proslavených altruistů. Domyšleno do „vhodných“ důsledků, dá se dilema vězně vykládat také tak, že dokonce i racionálně myslící jednotlivci se při samostatném rozhodování (a s ohledem na individuální zájmy) mohou jako skupina zachovat také dost nesmyslně, a to už podsouvá myšlenku, že ani racionálním lidem by se samostatné rozhodování a individuální zájmy raději neměly moc trpět. Tady by se měl člověk zarazit a zamyslet nad tím, jestli v tom celém není někde schované čertovo kopýtko. Pokud ano, pak by na ně měla ukázat už i sama teorie her nebo teorie rozhodování, do které v jistém smyslu patří. Pokusme se o to.

Co si o tom myslel Daniel Bernoulli

Ten pán v nadpisu téhle části si o dilematu vězně nemyslel nic, protože v jeho době (žil v letech 1700 až 1787) ještě neexistovalo, stejně jako neexistovala teorie her. Existovaly ale hry a herny a slavný matematik jejich prostředí využil k vymýšlení zajímavého příkladu, kterému se říká Petěrburský paradox. 3) Ponechme stranou jeho znění, tady o něj zas tak moc nejde. Jde o to, že díky němu vyslovil zajímavou myšlenku, která je dalším z obecných (a někdy bohužel zamlčovaných) předpokladů teorie her a teorie rozhodování. Při rozhodování nejsou směrodatné nominální číselné hodnoty zisku nebo ztráty, ale užitek, který jim přikládáme. Bernoulliho myšlenka se od té doby využívá v některých makro- nebo mikroekonomických optimalizačních úlohách a při činliví výzkumníci už přišli na to, že při hodnocení číselně vyjádřeného zisku nebo ztráty (ať už jsou uvedeny v penězích, kilech zlata nebo letech kriminálu) roste subjektivní užitek ze zisku zhruba podle logaritmické funkce množství oné „komodity“, která je rozdělována (takže pořád roste, ale čím dál pomaleji), zatímco pocit subjektivní ztráty roste zhruba s její exponenciální funkcí (tedy čím dál rychleji a rychleji). 4)

Možná že by i vězňovo dilema vypadalo trochu jinak, kdybychom se na ně podívali znova, ne z pohledu let vězení, kterými oba vězně oslňuje vyšetřovatel, ale z pohledu skutečného užitku (v našem případě ztráty), které pro ně znamenají. Zdá se, že přitom můžeme i zapomenout na onen logaritmus a exponenciálu z předchozího odstavce – v našem případě znamenají jen podpůrné argumenty, dvanáct let vězení není „jenom“ dvanáctkrát horší než jeden rok, ale ve skutečnosti ještě mnohem víckrát – a o to horší to je s dvaceti lety. Podstatnější je, že by stálo za to podle Bernoulliho vzoru a podle principů teorie her a teorie rozhodování vytvořit nové hodnoty pro to, co pro vězně a jejich pocit užitku znamenají vyšetřovatelovy alternativy. Jinými slovy pro to, podle čeho se ve skutečnosti rozhodují.

Je slušné rovnou přiznat, že to samo o sobě ještě nemusí stačit (a také nestačí) k tomu, aby bylo v dilematu vězňů jednoznačně jasno. Může nám to ale ukázat kritická místa, a hlavně to vymezí, odkud a kam sahá v téhle úloze vliv v podstatě celkem subjektivního přiřazení užitku k objektivním hodnotám „výplat“ (v našem případě roků v kriminálu).

Co si možná myslí vězni

Budeme tedy předpokládat, že oba vězni jsou v situaci, kdy jim nezbývá nic jiného než trochu racionálně uvažovat, a pokusme se uhádnout, jak si sami pro sebe „přeloží“ vyšetřovatelovy nabídky do jazyka svých představ o jejich důsledcích a z nich plynoucího subjektivního užitku.

Nepřizná se ani jeden z nich. Pravda, znamená to asi rok ve vězení, při obratnosti advokáta možná i méně. To ale pro ostříleného zločince není zas tak moc a dá se to vydržet. Škoda sice nastane, ale nebude nepřijatelná ani (pro zločince) nenapravitelná. Oceňme ji bodovou hodnotou –1.

Oba se přiznají. Odhadem to pro každého znamená asi dvanáct let ve vězení a to je, i při případném dřívějším propuštění (na které se nedá spolehnout), už kus života. Tak velký, že hodně, nejspíš nenapravitelně, poškodí osobní vztahy a rodinu, popřípadě znemožní jiné plány do budoucnosti. Ztráta bude asi pociťována jako značná, řekněme –100 bodů.

Já se nepřiznám a ten druhý se přizná. Znamená to pro mne asi 20 let ve vězení a to už je v jistém smyslu skoro jako doživotí. I kdybych vyšel ven dřív, bude to nejdřív asi po 15 letech, pro rodinu a přátele už budu cizí člověk a svět venku bude cizí pro mne. Ztráta je vlastně skoro nekonečná, a i kdybych ji chtěl ocenit body, moc se nespletu hodnotou –1000. Nejlepší bude okamžitě se v takovém případě přiznat také – pokud to ovšem pravidla budou připouštět. Tím bych ztrátu převedl na předchozí, sice také hodně zlý, ale přeci jenom snesitelnější případ.

Já se přiznám a ten druhý se nepřizná. Podle vyšetřovatele by to mělo znamenat nulovou ztrátu, podle mne to ale není pravda! Je mi jasné, že se v takovém případě ten druhý také hned přizná (pokud mu to pravidla dovolí) a ono slibované okamžité propuštění se změní ve 12 let ve vězení. Užitek z mého přiznání tedy bude ve skutečnosti ztráta oceněná na –100 bodů.

Když si právě přečtené odstavce rozmyslíme z hlediska teorie her a s použitím jejich metod, rozpadá se nám teď původní dilema vězně na dvě rozdílné úlohy. Liší se v pravidlech platných pro chování vězňů, konkrétně v pravidlech o tom, dokdy mohou změnit výpověď, aby to mělo vliv na výši trestu. Je už v povaze doprovodné historky k téhle úloze, že změna je prakticky možná jen v směru od mlčení k přiznání. Ostatně už jistý vyšetřovací soudce ve Švejkovi tvrdíval, že každé zapírání ztěžuje přiznání, k čemuž Švejk správně dodal, že také naopak.

  • První úloha. Kterýkoli vězeň, který se dosud nepřiznal, může vždy změnit výpověď a přiznat se, bez ohledu na přiznání či nepřiznání svého spolupachatele. Jinými slovy neexistuje žádná „poslední lhůta pro přiznání“. Pak popsané „ztrátové body“ vedou podle teorie her k tomu, že se žádný z vězňů nepřizná, toto chování je pro oba to nejlepší možné a je stabilní.
  • Druhá úloha. Existuje okamžik, ve kterém (přesněji do kterého) je poslední možnost se přiznat. Do něj se mohou přiznat oba. Pokud tak neučinili, tak ten, který se v onom posledním okamžiku přizná, je osvobozen a druhý už nemá možnost na věci nic změnit. V takovém případě vede podle teorie her úloha na stejný výsledek jako její historická varianta – pro oba hráče je nejrozumnější, aby se přiznali „dost včas“, a situace, která tak vznikne, je stabilní.

Pořád je o čem meditovat

To, že začneme při řešení vězňova dilematu důsledně přemýšlet v dimenzích užitku místo roků vězení, ještě nestaví ony už zmíněné etiky, psychology, politology a sociology mimo hru. Pořád ještě mají dost příležitostí k úvahám, jestli předchozí dvě schémata vystihují podstatu lidské povahy a také, pokud chtějí, jak je to ve skutečnosti s oním nahrazením výše trestu užitkem, které jsme v naší úvaze použili. Budou to už ale úvahy, ve kterých bude o něco jasnější hranice mezi tím, co ještě je teorie her a co už je mimo ni.

Poznámky

1) Viz Jan Sokol, Vesmír 82, 466, 2003/8, a Milan Mareš, Vesmír 82, 610, 2003/11.
2) Formulace úlohy se v citovaných článcích trochu liší. Tady se držíme té, která je v literatuře častější (je to ta z druhého článku, snad se to dá autorovi tolerovat). Na podstatě následujících odstavců to mnoho nemění.
3) Ne proto, že by carští důstojníci v kasinech nad Něvou hráli obzvlášť divoce, ale proto, že Daniel Bernoulli v Petěrburku dlouho působil a článek o paradoxu vydal v roce 1738 v Listech Carské akademie věd v Sankt Petěrburku.
4) Tu logaritmickou a exponenciální křivku je třeba brát hodně volně – přinejmenším je nutné je posunout, aby procházely počátkem. Dost variabilní je také konkrétní základ onoho logaritmu, popřípadě exponenciály. Podstata věci ale opravdu sedí.

Ke stažení

OBORY A KLÍČOVÁ SLOVA: Matematika

O autorovi

Milan Mareš

Prof. RNDr. Milan Mareš, DrSc., (*1943) vystudoval Matematicko-fyzikální fakultu UK. V Ústavu teorie informace a automatizace AV ČR, v. v. i., se zabývá teorií rozhodování a teorií fuzzy množin. V letech 1993–1997 byl členem Akademické rady AV ČR. Je autorem knihy Slova, která se hodí aneb Jak si povídat o matematice, kybernetice a informatice (Academia, Praha 2006), a knihy Příběhy matematiky (nakladatelství Pistorius, Praha 2008).

Doporučujeme

Pěkná fotka, nebo jen fotka pěkného zvířete?

Pěkná fotka, nebo jen fotka pěkného zvířete?

Jiří Hrubý  |  8. 12. 2024
Takto Tomáš Grim nazval úvahu nad svou fotografií ledňáčka a z textové i fotografické části jeho knihy Ptačí svět očima fotografa a také ze...
Do srdce temnoty

Do srdce temnoty uzamčeno

Ladislav Varadzin, Petr Pokorný  |  2. 12. 2024
Archeologické expedice do severní Afriky tradičně směřovaly k bývalým či stávajícím řekám a jezerům, což téměř dokonale odvádělo pozornost od...
Vzhůru na tropický ostrov

Vzhůru na tropický ostrov

Vojtěch Novotný  |  2. 12. 2024
Výpravy na Novou Guineu mohou mít velmi rozličnou podobu. Někdo zakládá osadu nahých milovníků slunce, jiný slibuje nový ráj na Zemi, objevuje...