i

Aktuální číslo:

2024/11

Téma měsíce:

Strach

Obálka čísla

Digitální ekosystém

Velká data jako potrava umělé inteligence v digitálním světě
 |  1. 11. 2021
 |  Vesmír 100, 676, 2021/11
 |  Téma: Velká data

Tušíme, že veškerá naše interakce s digitálním světem je „někde“ zaznamenávána a že „nějaká“ umělá inteligence z těchto záznamů určuje, jaké personalizované reklamy na internetu vidíme, jaká videa jsou nám doporučována či jak jsou nám řazeny výsledky ve vyhledávačích. Ponořme se tedy do této oblasti o něco podrobněji a podívejme se, jak taková umělá inteligence (AI) založená na velkých datech (Big Data) funguje.

Co je to inteligence jako taková? Pomohou nám dvě na první pohled odlišné definice, u nichž však brzo uvidíme, že jsou dvěma stranami téže mince:

  • Inteligence je schopnost vyjádřit větší množství dat pomocí menšího množství dat při zachování stejného informačního obsahu.
  • Inteligence je schopnost dosáhnout cíle.

Co si představit pod první definicí? Řekněme například, že mám 100 čísel: 2, 4, 6, 8, 10, 12 atd. Poslední z těch čísel je 200. Tato čísla bych vám chtěl všechna sdělit. Mohl bych je tedy zde všechny vypsat, pěkně jedno po druhém, a celá tato zpráva by byla 800 bitů dlouhá (pro jednoduchost předpokládejme, že každé kladné číslo menší než 256 by bylo kódované pomocí 8 bitů, jako je tomu na počítači). Nebo bych vám místo toho mohl napsat něco jako: „sudá čísla od 2 do 200“. K tomu mi vystačí pouhých 176 bitů v ASCII kódování znaků. A dokázal bych to snížit ještě více, třeba nějakým formálním kódováním.

A právě tato schopnost snížit počet nutných bitů z 800 na 176 je projevem inteligence. Inteligence tedy v jistém funkčním smyslu odpovídá kompresi dat. Zde jsme měli štěstí, protože se nám podařilo najít kompresi bezeztrátovou. Dokážeme tedy původní sekvenci čísel dlouhou 800 bitů zrekonstruovat zcela přesně, i když obdržíme zprávu dlouhou jen 176 bitů.

V reálném životě (a v reálné inteligenci) se však většinou setkáváme s kompresí ztrátovou. Skoro přesně takovou, jakou můžete vidět, třeba když se díváte na film: typický film ve Full HD rozlišení by v původní nekomprimované podobě zabíral přibližně 750 GB (gigabajtů). To není moc praktické. Ale pomocí kompresního algoritmu H.264 se vám podaří velikost snížit přibližně na 50 GB. Drtivá většina původní informace z oněch 750 GB je sice nenávratně ztracena, avšak vy, když se díváte na film, nepoznáte žádný rozdíl.

Kde je zde ta inteligence? Ve schopnosti zahodit většinu informace tak, aby stále bylo dosaženo cíle – což v tomto případě je: „člověk nesmí poznat žádný rozdíl v reprezentaci vizuální reality“. A právě zde se nám první zmíněná definice inteligence propojuje s tou druhou. Inteligentní systém (agent) dokáže vhodným způsobem ztrátově komprimovat informace o vnějším světě tak, aby mu to pomohlo k dosahování jeho cíle.

A nyní udělejme obrovský skok k člověku a k jeho inteligenci. V každé vteřině našeho života přijímá naše tělo všemi svými senzorickými receptory gigantické množství bitů informací. To jsou naše biologická „provozní velká data“. Náš mozek (včetně dalších komponent centrální nervové soustavy) je pak vysoce paralelním síťovým výpočetním zařízením, jehož úkolem je ztrátově zkomprimovat tu příchozí záplavu dat natolik dobře, aby to kontinuálně umožňovalo dosahování určitého cíle. Ten cíl pak v zásadě můžeme shrnout takto: „Predikuj budoucí vývoj okolního světa i svého jednání v něm natolik dobře, abys co nejdéle udržel svůj vlastní tvar.“ Takovýto cíl byl našemu mozku (a nejspíše i všem jiným živočichům) postupně zakódován evolucí a selekčním tlakem. Ono „zachování vlastního tvaru“ je takové trochu poetičtější vyjádření všudypřítomné a úporné snahy všech živých organismů o zachování nízké entropie (a tedy vysoké organizovanosti) své vlastní tělesné schránky. Jinými slovy: evoluční tlak odjakživa říkal, že buňkám mého těla bude mnohem lépe, pokud zůstanou takto krásně organizované do „tvaru mého těla“, než aby byly rozmáznuté po půlce savany.

Učení posilováním

To, co jsem zde v kontextu lidské inteligence nazval „ztrátová komprese“, je v podstatě model světa, který si všichni kontinuálně konstruujeme v našich myslích a nad nímž automaticky vytváříme predikce budoucího chování světa a nás v něm.

Nyní vidíte 20 % článku. Co dál:

Jsem předplatitel, mám plný přístup
Jsem návštěvník
Chci si přečíst celé číslo
Předplatným pomůžete zajistit budoucnost Vesmíru. Více o předplatném
TÉMA MĚSÍCE: Velká data
OBORY A KLÍČOVÁ SLOVA: Informatika

O autorovi

Jan Romportl

Ing. Mgr. Jan Romportl, Ph.D., (*1981) vystudoval umělou inteligenci na Fakultě aplikovaných věd Západočeské univerzity a filozofii na Fakultě filozofické téže univerzity. Do roku 2015 působil v univerzitním prostředí, poté se přesunul do komerční sféry, kde nyní vede výzkum a vývoj v oblasti umělé inteligence. Organizuje Prague AI Safety Meetup a snaží se být nápomocen české komunitě zabývající se bezpečností a hodnotami umělé inteligence.
Romportl Jan

Další články k tématu

(Ne)chemické toulky chemickým prostoremuzamčeno

Zkusme si představit všechny chemické látky, které by bylo možno připravit, od vodíku až po makromolekuly včetně nukleových kyselin a bílkovin....

I geografie má velká datakomerce

Práce s rozsáhlými soubory dat patří ke geografii odnepaměti. Čím podrobněji se snažíme popsat svět kolem nás, tím více dat musíme vytvořit, a to...

Datová revoluce v biologiiuzamčeno

„Všechny modely jsou špatné (ale některé jsou užitečné),“ napsal statistik George Box v roce 1979. Narážel na fakt, že pouze modely, od...

Divoká plavba mořem dat

Jak velká jsou velká data? Najít jednoznačnou odpověď na podobné otázky není snadné; soudci posuzující, zda množství zadržených drog je „větší než...

Doporučujeme

Se štírem na štíru

Se štírem na štíru

Daniel Frynta, Iveta Štolhoferová  |  4. 11. 2024
Člověk každý rok zabije kolem 80 milionů žraloků. Za stejnou dobu žraloci napadnou 80 lidí. Z tohoto srovnání je zřejmé, kdo by se měl koho bát,...
Ustrašená společnost

Ustrašená společnost uzamčeno

Jan Červenka  |  4. 11. 2024
Strach je přirozeným, evolucí vybroušeným obranným sebezáchovným mechanismem. Reagujeme jím na bezprostřední ohrožení, které nás připravuje buď na...
Mláďata na cizí účet

Mláďata na cizí účet uzamčeno

Martin Reichard  |  4. 11. 2024
Parazitismus je mezi živočichy jednou z hlavních strategií získávání zdrojů. Obvyklá představa parazitů jako malých organismů cizopasících na...