Digitální ekosystém
Tušíme, že veškerá naše interakce s digitálním světem je „někde“ zaznamenávána a že „nějaká“ umělá inteligence z těchto záznamů určuje, jaké personalizované reklamy na internetu vidíme, jaká videa jsou nám doporučována či jak jsou nám řazeny výsledky ve vyhledávačích. Ponořme se tedy do této oblasti o něco podrobněji a podívejme se, jak taková umělá inteligence (AI) založená na velkých datech (Big Data) funguje.
Co je to inteligence jako taková? Pomohou nám dvě na první pohled odlišné definice, u nichž však brzo uvidíme, že jsou dvěma stranami téže mince:
- Inteligence je schopnost vyjádřit větší množství dat pomocí menšího množství dat při zachování stejného informačního obsahu.
- Inteligence je schopnost dosáhnout cíle.
Co si představit pod první definicí? Řekněme například, že mám 100 čísel: 2, 4, 6, 8, 10, 12 atd. Poslední z těch čísel je 200. Tato čísla bych vám chtěl všechna sdělit. Mohl bych je tedy zde všechny vypsat, pěkně jedno po druhém, a celá tato zpráva by byla 800 bitů dlouhá (pro jednoduchost předpokládejme, že každé kladné číslo menší než 256 by bylo kódované pomocí 8 bitů, jako je tomu na počítači). Nebo bych vám místo toho mohl napsat něco jako: „sudá čísla od 2 do 200“. K tomu mi vystačí pouhých 176 bitů v ASCII kódování znaků. A dokázal bych to snížit ještě více, třeba nějakým formálním kódováním.
A právě tato schopnost snížit počet nutných bitů z 800 na 176 je projevem inteligence. Inteligence tedy v jistém funkčním smyslu odpovídá kompresi dat. Zde jsme měli štěstí, protože se nám podařilo najít kompresi bezeztrátovou. Dokážeme tedy původní sekvenci čísel dlouhou 800 bitů zrekonstruovat zcela přesně, i když obdržíme zprávu dlouhou jen 176 bitů.
V reálném životě (a v reálné inteligenci) se však většinou setkáváme s kompresí ztrátovou. Skoro přesně takovou, jakou můžete vidět, třeba když se díváte na film: typický film ve Full HD rozlišení by v původní nekomprimované podobě zabíral přibližně 750 GB (gigabajtů). To není moc praktické. Ale pomocí kompresního algoritmu H.264 se vám podaří velikost snížit přibližně na 50 GB. Drtivá většina původní informace z oněch 750 GB je sice nenávratně ztracena, avšak vy, když se díváte na film, nepoznáte žádný rozdíl.
Kde je zde ta inteligence? Ve schopnosti zahodit většinu informace tak, aby stále bylo dosaženo cíle – což v tomto případě je: „člověk nesmí poznat žádný rozdíl v reprezentaci vizuální reality“. A právě zde se nám první zmíněná definice inteligence propojuje s tou druhou. Inteligentní systém (agent) dokáže vhodným způsobem ztrátově komprimovat informace o vnějším světě tak, aby mu to pomohlo k dosahování jeho cíle.
A nyní udělejme obrovský skok k člověku a k jeho inteligenci. V každé vteřině našeho života přijímá naše tělo všemi svými senzorickými receptory gigantické množství bitů informací. To jsou naše biologická „provozní velká data“. Náš mozek (včetně dalších komponent centrální nervové soustavy) je pak vysoce paralelním síťovým výpočetním zařízením, jehož úkolem je ztrátově zkomprimovat tu příchozí záplavu dat natolik dobře, aby to kontinuálně umožňovalo dosahování určitého cíle. Ten cíl pak v zásadě můžeme shrnout takto: „Predikuj budoucí vývoj okolního světa i svého jednání v něm natolik dobře, abys co nejdéle udržel svůj vlastní tvar.“ Takovýto cíl byl našemu mozku (a nejspíše i všem jiným živočichům) postupně zakódován evolucí a selekčním tlakem. Ono „zachování vlastního tvaru“ je takové trochu poetičtější vyjádření všudypřítomné a úporné snahy všech živých organismů o zachování nízké entropie (a tedy vysoké organizovanosti) své vlastní tělesné schránky. Jinými slovy: evoluční tlak odjakživa říkal, že buňkám mého těla bude mnohem lépe, pokud zůstanou takto krásně organizované do „tvaru mého těla“, než aby byly rozmáznuté po půlce savany.
Učení posilováním
To, co jsem zde v kontextu lidské inteligence nazval „ztrátová komprese“, je v podstatě model světa, který si všichni kontinuálně konstruujeme v našich myslích a nad nímž automaticky vytváříme predikce budoucího chování světa a nás v něm.