mff2024mff2024mff2024mff2024mff2024mff2024

Aktuální číslo:

2024/2

Téma měsíce:

Faleš

Obálka čísla

Jak určit autora textu

 |  6. 4. 2020
 |  Vesmír 99, 210, 2020/4
 |  Téma: Jazyk

Byli Moliére či Shakespeare skutečně autory všech jim připisovaných děl? Na podobné otázky odpovídá stylometrie, disciplína zabývající se kvantifikací stylu, nejčastěji za účelem rozpoznávání autorství.

Stylometrie patří v posledních deseti letech k nejdynamičtěji se rozvíjejícím odvětvím matematické lingvistiky. Svědčí o tom jak množství článků indexovaných ve webových databázích, množství příspěvků na odborných konferencích, tak i to, že o výsledcích stylometrického výzkumu čím dál častěji referují i běžná média (v poslední době například o studii zpochybňující Corneillovu možnou autorskou účast na hrách připisovaných Molièrovi nebo o studii potvrzující autorskou účast Johna Fletchera na hře Jindřich VIII., původně publikované pod jménem Williama Shakespeara). Nejde ale – jak by se mohlo na první pohled zdát – o disciplínu etablující se teprve s nástupem moderní výpočetní techniky; její kořeny sahají hluboko do 19. století.

Knihovna Stylo

Burrowsova Delta i řada dalších stylometrických metod je implementovaná ve volně dostupné knihovně Stylo v populárním programovacím jazyku R. Vedle toho jsou její základní funkce dostupné i prostřednictvím uživatelsky přívětivého webového rozhraní WebSty, kde si lze základy stylometrické analýzy vyzkoušet bez jakýchkoliv vstupních předpokladů. Versologický tým Ústavu pro českou literaturu AV ČR připravuje vlastní webovou aplikaci zaměřenou na básnické texty. Ta umožní do stylometrické analýzy zahrnout nejen lexikální rysy (např. četnosti slov), ale i formální charakteristiky verše (např. četnosti rytmických konfigurací, četnosti různých typů rýmu). Aplikace bude v průběhu roku 2020 zpřístupněna na webu versologie.cz.

Počátky oboru

V roce 1851 se britský matematik Augustus de Morgan v dopise adresovaném reverendu Healdovi zamýšlel nad možnostmi určení autorství novozákonních epištol připisovaných svatému Pavlovi a navrhl, že by bylo možné odlišit texty skutečně psané Pavlem od ostatních na základě průměrné délky slov měřené počtem znaků. S povzdechem pak dodal, že „kdyby badatelé rozuměli zákonu velkých čísel tak jako matematici, snadno by se vybralo pár set liber na to, aby se takový experiment vyzkoušel ve velkém měřítku“.

Finance se ale podařilo sehnat až o padesát let později americkému fyzikovi Thomasi Corwinu Mendenhallovi. Ten nejprve v roce 1887 navrhl pracovat namísto průměru s celou distribucí četností slov různé délky. Tuto metodu pak díky podpoře mecenáše Augusta Hemenwaye později použil při řešení skutečné otázky sporného autorství, jehož výsledky shrnul v článku A mechanical solution to a literary problem (1901). Mendenhall porovnal tvar křivky určené relativními četnostmi slov různé délky v textech připisovaných Williamu Shakespearovi s křivkami extrahovanými z textů Francise Bacona a Christophera Marlowa a na základě jejich odlišnosti či podobnosti opatrně dovodil, že Shakespearovy texty nemohl napsat Bacon, zatímco je velmi pravděpodobné, že jejich skutečným autorem je Marlow. (Později se ovšem ukázalo, že celý experiment byl zkreslen jednou významnou vnější proměnnou: u Shakespeara a Marlowa zkoumal Mendenhall veršované texty, zatímco u Bacona texty neveršované.)

Od hledání ideálního rysu k multidimenzionálním analýzám

První polovina 20. století se nesla ve znamení hledání ideální textové charakteristiky, která v textech produkovaných jedním autorem zůstává stabilní, ale mění se napříč díly různých autorů. Vědci jich navrhli a testovali celou řadu: průměrná délka slova měřená počtem slabik, průměrná délka věty měřená počtem slov nebo různé metriky bohatosti slovníku. Žádná ale nebyla dostatečně robustní a při rozpoznávání autorství jiných textů než těch, pro něž byly původně navrženy, tyto metody obvykle selhaly.

Nyní vidíte 50 % článku. Co dál:

Jsem předplatitel, mám plný přístup
Jsem návštěvník
Chci si přečíst celé číslo
Předplatným pomůžete zajistit budoucnost Vesmíru. Více o předplatném
TÉMA MĚSÍCE: Jazyk
OBORY A KLÍČOVÁ SLOVA: Lingvistika

O autorovi

Petr Plecháč

Mgr. Petr Plecháč, Ph.D. & Ph.D. (*1985) vystudoval teorii literatury na FF UP v Olomouci a matematickou lingvistiku na FF UK v Praze. Působí v Ústavu pro českou literaturu AV ČR jako vedoucí Versologického týmu. Zabývá se především kvantitativní analýzou veršovaných textů a otázkami rozpoznávání autorství.
Plecháč Petr

Další články k tématu

Nenápadný půvab gestikulaceuzamčeno

Gesta nejsou nějakou tajnou, paralelní „řečí těla“, jak se nás snaží přesvědčit různí „experti na komunikaci“, ani pouhým doprovodem jazykového...

Pak jsem vyspinkal pokojíčkuuzamčeno

Patrně v každém rodiči vyvolávají jazykové výtvory jeho dítěte alespoň občas pousmání. Někdy se ptáme, kde na to ty děti přišly. Tak jako třeba...

Twitter v rukou psychologů

Stejně jako je deprese poruchou mozku, která zvyšuje jeho citlivost vůči stresu a negativním podnětům, je i poruchou mezilidských vztahů, v nichž...

Když se pletou psi a osliuzamčeno

Představte si, že někomu něco vyprávíte a on se tváří, že to, co říkáte, vůbec nedává smysl. A vy nechápete proč. Nebo se chcete zeptat, kde máte...

Šumava: štěpení společnosti a krize vědyuzamčeno

Mediálně mimořádně exponovaná debata o přístupu ke správě našeho největšího národního parku trvá už téměř třicet let. Spoustu textů a energie...

„Krásná řeč“ starověkých Egypťanůuzamčeno

Od proslulého zvolání „Mám to!“, kdy francouzský učenec Jean F. Champollion při studiu Rosettské desky jako první pochopil princip egyptského...

Misionáři, bible a vymírající jazykyuzamčeno

Máte-li možnost, zavítejte na bohoslužbu v některém z kostelů na Papui Nové Guineji. Kromě Božího slova se vám tam velmi rychle dostane poučení o...

Je myšlení závislé na jazyku?uzamčeno

Jak souvisí jazyk a myšlení? Jsou naše myšlenky závislé na našem rodném jazyce? A pokud ano, jak se taková závislost projevuje? A lze ji zkoumat...

Nakolik si vlastně rozumíme?

Psycholingvistický výzkum porozumění jazyku po dlouhou dobu implicitně předpokládal, že si v komunikaci vzájemně rozumíme a že případné...

Doporučujeme

Pravá faleš, nebo falešná pravda

Pravá faleš, nebo falešná pravda uzamčeno

Halina Šimková, Jan Strojil  |  5. 2. 2024
Žádná společnost na světě nemá tolik prostředků či energie, aby dokázala efektivně bojovat proti všem podezřením z ohrožení. Používáme proto...
Koho balamutí tořiče

Koho balamutí tořiče uzamčeno

Jiří Sádlo  |  5. 2. 2024
Vstavačovité tořiče, rod Ophrys, jsou hodně složité a osobité. Dlouho se ví a říká, že klamou své hmyzí opylovače. Méně se připouští, že...
20 let s grafenem

20 let s grafenem uzamčeno

Jan Kunc  |  5. 2. 2024
Grafen, dvoudimenzionální alotrop uhlíku, vyvolal velkou vlnu pozornosti v roce 2004. Jak se tento význačný vědecký směr formoval, jaké byly jeho...