Nekřivděme Johnu Nashovi
V teorii her se setkává několik vědních oborů – matematika, informatika, sociologie, ekonomie, biologie, možná i další – a tak nabízí zajímavé náměty k úvahám.
Hlavní sdělení článku P. Houdka o brankářích (Vesmír 87, 860, 2008/12) je přesné a pravdivé – lidé se před rozhodnutím zpravidla chovají trochu jinak, než jim doporučují „tabulkové“ rady vydestilované z nominálních číselných hodnot nějakého ukazatele. V daném případě je řeč o brankářích, kteří (na první pohled komicky) poskakují před brankou, místo aby při penaltě zůstali stát pěkně uprostřed, což by odpovídalo teorii her. Skutečně? Článek sice pro vyčkávání uprostřed branky uvádí zdánlivě silné argumenty, jenže to nejsou argumenty teorie her. Podíváme se proto na penalty opravdu „očima“ zmíněné teorie a troufale si na to vypůjčíme čísla z citovaného Houdkova článku.
Po vzoru balíčků s cigaretami uvedeme i my napřed varování: Teorie her obsahuje matematiku! V následující části ji nabízíme se silným filtrem, který bezpečně zadržuje vzorečky, ale stejně se základní matematický charakter této teorie zcela odstranit nedá. Pokud tedy považujete matematiku za šíření poplašných zpráv, měli byste asi následující část článku přeskočit a podívat se až na závěry. Pokud byste naopak rádi věděli, proč právě takové závěry hlásám, bude přečtení následující části zřejmě nutné.
O strategickém brankáři
Než začneme, měli bychom si uvědomit dvě skutečnosti:
- V našich úvahách se hodně mluví o pravděpodobnostech (místy jsou oblečeny do procent) a z nich se odvozuje, jak často by asi brankář chytil nebo nechytil míč. Spoléháme se tak na pomoc zákona velkých čísel. Samo o sobě to je v pořádku, proto tady onen zákon je, ale nese to v sobě skrytý předpoklad, že se dotyčné pravděpodobnosti časem nemění, a to je silný předpoklad, zvlášť když jde o chování lidí.1 Nicméně v dalších odstavcích se budeme chovat, jako by pravděpodobnosti stálé byly.
- Už bylo řečeno, že lidé-hráči hrají podle svého subjektivního užitku. Protože ale o něm nevíme nic, co by šlo kvantifikovat do užitkové funkce, kromě toho, že by brankář chtěl zvýšit naději na chycení penalty a střelec má opačný cíl, budeme hrát hru, ve které jde přesně o toto. Podívejme se, co o ní říká příslušná teorie (viz rámeček 1 ).
Omlouvám se, že vynechám výpočty – jsou trochu zdlouhavé a dost nudné. Navíc rovnou přiznávám, že jsem při nich mírně zaokrouhloval, takže výsledné pravděpodobnosti se liší od správných na úrovni desetin procenta. Podstatu věci to nemění.
Jak by měl hrát
Zatím jsme jenom popsali hru způsobem, jakým bývá v teorii her popisována. Teorie her v podstatě nabízí dva základní pohledy na to, jaké chování by mělo být zvýhodněno. Každý z nich může být použit jak na úrovni ryzích strategií, tak na úrovni těch smíšených.
- Řešení garanční. Je historicky starší, název garanční je sice výstižný, většinou se ale používá spíš termín minimaxové. Zabývá se každým hráčem zvlášť a radí mu jak se zachovat, aby dosáhl co nejvyšší výhru z těch, které protihráč už žádnou svou strategií nemůže snížit. Je možné ho použít vždy, pro ryzí i smíšené strategie, ale pro ryzí strategie může vyjít jako nestabilní v tom smyslu, že je hodně pesimistické (zaručené výsledky pro každého hráče se sice nedají dále zhoršit, ale jsou už i tak dost špatné). Taková situace se pozná i podle toho, že se zaručené výhry obou hráčů od sebe liší (zaručená výhra jednoho je menší než zaručená prohra druhého). Pro smíšené strategie bude vždy stabilní v právě uvedeném smyslu. Hráči nebudou mít důvod garanční chování měnit a jejich zaručené výhry a prohry se kompenzují.
- Řešení rovnovážné. Navrhli ho už tvůrci teorie her. Zabývá se hrou obou hráčů jako celkem a doporučuje „stabilní“ dvojice jejich strategií. To znamená takové, které žádný z hráčů nechce sám měnit, protože by tím snížil svou výhru. Pro ryzí strategie nemusí existovat, ale John Nash, zmíněný v článku o brankářích, dokázal v roce 1949 slavnou větu, že pro smíšené strategie existují rovnovážné dvojice vždy. Při použití rovnovážných strategií se výhry a ztráty obou hráčů (u her s nulovým součtem) navzájem kompenzují. Jak se dalo čekat, jsou strategie tvořící rovnovážnou dvojici právě těmi garančními strategiemi, které jsme v minulém odstavci označili za stabilní. Pokud se výplaty při ryzích garančních strategiích lišily, bude rovnovážná výplata někde mezi nimi, pokud se shodovaly, bude se s nimi také shodovat. Vzájemná kompenzace výher a ztrát jim ale i v roli garančních strategií hodně ubírá na pesimizmu.
Jak to vychází pro brankáře
Konečně se dostáváme k tomu, co teorie her skutečně radí brankářům. Uvedeme pouze výsledky. Výpočetní postup není náročný, zabere ale dost místa. Pro ty, kteří si chtějí výsledek zkontrolovat, jsou návody nejpřehledněji uvedeny v knize J. D. Williamse Dokonalý stratég aneb Slabikář teorie strategických her (Orbis, Praha 1966). Vyšla sice už dávno, ale ve specializovaných knihovnách by měla být k nalezení.
- Garanční řešení v ryzích strategiích. Existuje, ale není stabilní (už víme, že to znamená „rovnovážné“).
Pro střelce je garanční strategie vpravo a garantuje mu ztrátu, ne větší než 25,4 (to znamená, že volbou této strategie může zaručit, že brankář nebude úspěšný ve více než 25,4 % střel).
Pro brankáře jsou garanční všechny tři ryzí strategie a každá z nich mu garantuje výhru 0. Je to opravdu pesimistická předpověď a zaručuje mu jen to, co je zaručeno samotnou situací – že úspěšnost jeho zásahů nebude horší než 0 %.
Víme ale, že bude existovat řešení (současně rovnovážné i garanční) ve smíšených strategiích a že výhra brankáře se bude pohybovat v rozmezí mezi 0 a 25,4 % úspěšnosti.
- Rovnovážné řešení v ryzích strategiích. V ryzích strategiích rovnovážná dvojice neexistuje.
- Řešení ve smíšených strategiích (současně rovnovážné i garanční). Víme, že existuje a doporučuje hráčům tyto smíšené strategie.
Střelec
— střelit vlevo s pravděpodobností 34,4 %,
— střelit doprostřed s pravděpodobností 20,3 %,
— střelit vpravo s pravděpodobností 45,3 %.
Brankář
— skočit vlevo s pravděpodobností 41,1 %,
— zůstat stát uprostřed s pravděpodobností 11,0 %,
— skočit vpravo s pravděpodobností 47,9 %.
Při použití takové rovnovážné dvojice strategií mají hráči zaručenu ztrátu ve výši 12,2, to znamená, že brankář bude úspěšný (v průměru – jde o pravděpodobnostní metodu a zákon velkých čísel) ve 12,2 % případů.
Tak skákal by John Nash, nebo ne?
To, k čemu jsme se v předchozí části s použitím teorie her dostali, se od závěrů článku o brankářích liší. Brankář nemá optimální ryzí strategii v žádném smyslu – ani garanční, ani rovnovážnou. Proto neexistuje stabilní nejlepší chování, ať už to je setrvání uprostřed branky při každé střele, nebo skok vždy na stejnou stranu. John Nash by jistě skákal a směr skoku (popřípadě setrvání uprostřed) by náhodně střídal podle pravděpodobností své rovnovážné strategie.Brankáři se tedy nechovají tak špatně, když většinou někam skočí. Z tab. II citovaného Houdkova článku je vidět, že své chování řídí pravděpodobnostmi: vlevo – 49,3 %, střed – 6,3 %, vpravo – 44,4 %, které se od optimální rovnováhy zas tak zásadně neliší.
Tomu odpovídá i statistická úspěšnost jejich zásahů – podle citovaného článku je 12–16 %. O něco vyšší hodnota než rovnováha skoro jistě padá částečně na vrub tomu, že zákon velkých čísel platí limitně a částečně (asi především) tomu, že ani střelci nedodržují přesně rovnovážnou strategii, pokud správně rozumím pravému součtovému sloup ci tab. II v citovaném článku.
Proč se výsledky liší?
Nejspíš proto, že oba pohledy (jeden odpovídající teorii her, druhý vysvětlený v Houdkově článku) na „hru“ brankářů proti střelcům se ve skutečnosti zaměřují na různé jevy, i když jim občas dávají podobná jména. Šedesátiprocentní úspěšnost chycení penalty, pokud brankář zůstane uprostřed branky, je jistě impozantní, ale jen tehdy, když střelci na ten prostředek opravdu střílejí. Zkusme si schválně spočítat, co se stane se stovkou penaltových střel (s respektem k uvedeným pravděpodobnostem):Střelec jich kopl 32 vlevo, 29 rovně a 39 vpravo (všimli jste si, že rovnovážná strategie radí brankáři skákat nejčastěji vpravo?).
Brankář chytil z těch, které letěly vlevo, 6, z těch, které letěly doprostřed, 5 a z těch, které letěly vpravo, 2. Dohromady jich tedy chytil okolo 13 (zaokrouhleno) a jen asi jedné ze stovky vystřelených střel se poštěstilo, že byla vystřelena směrem na střed branky, brankář tam stál a střelu chytil.
Ve světle těchto čísel (hlavně oněch pouhých 29 % střel na střed branky) se časté setrvávání ve středu branky nejeví tak výhodné, jak by oněch šedesát procent z Houdkovy tab. I. naznačovalo.
KDO A O CO HRAJE
Začneme tím, že si řekneme, co je co a kdo je kdo v naší hře.Komentář 1. Tady by byla namístě trocha názornosti. Pokud brankář přijme jeden směr skoku, například „skákej vlevo“, a drží se ho při každé penaltě, používá ryzí strategii. Jestliže ho po čase změní na jiný stálý způsob chování (třeba „stůj uprostřed“), je to legitimní, jen změnil svou ryzí strategii. Pokud ale má vybrané pravděpodobnosti svých akcí (například „s pravděpodobností 1 : 2 skočím vlevo, s pravděpodobností 1 : 2 zůstanu uprostřed a doprava skákat nebudu“), má zvolenu smíšenou strategii a před každou penaltou musí udělat náhodný pokus (třeba si hodit mincí), který mu nezávisle na něm (!) řekne, co má dělat tentokrát. Realizuje tím svou smíšenou strategii. I tu může změnit tím, že změní pravděpodobnosti, a příště už náhodně vybírá podle nich.
Pro smíšené strategie je výsledkem průměr z hodnot v tabulce počítaný pro pravděpodobnosti tvořící danou smíšenou strategii.
Komentář 2. Při pohledu na tabulku nás zarazí jedna věc. Zatímco brankář stojící uprostřed nemá šanci chytit pouze míč kopnutý doleva nebo doprava, brankář stojící vlevo nebo vpravo má šanci chytit i míč vystřelený doprostřed. Nejsou k dispozici okolnosti vzniku tabelovaných hodnot, ale budí to přinejmenším rozpaky nad metodikou stanovení „oblastí “ v brance.
Komentář 3. Hra dvou hráčů je antagonistická, jakmile pro každé dva výsledky ten, který je lepší pro jednoho, je horší pro druhého. Nulový součet není nutný, v našem případě asi není ani výstižný (neúspěch brankáře bývá pociťován jako nepříjemnější než neúspěch střelce), ale předpoklad nulového součtu nemění podstatu naší hry a usnadňuje počítání.
Ke stažení
- článek ve formátu pdf [226,55 kB]