Grada2024Grada2024Grada2024Grada2024Grada2024Grada2024

Aktuální číslo:

2024/7

Téma měsíce:

Čich

Obálka čísla

K Occamově břitvě

(ad Vesmír 77, 464, 1998/8)
 |  5. 9. 1998
 |  Vesmír 77, 517, 1998/9
 |  Seriál: Occamova břitva, 2. díl (Předchozí)

Vědátoři z článku o Occamově břitvě by opravdu zasluhovali co proto. Takhle odbýt tak krásná empirická fakta! To správní teoretičtí fyzici by si, panečku, smlsli.

Už předpoklad, že tři (empirické) proměnné a, b, c lze vyjádřit třemi (teoretickými) proměnnými L, M, N takovými, že a = LM, b = MN, c = NL, by pro ně určitě nebyl samozřejmým; vždyť čtyři proměnné a, b, c, d nelze obecně vyjádřit čtyřmi proměnnými L, M, N, P tak, aby a = LM, b = MN, c = NP, d = PL. (Z takového předpokladu by totiž plynulo, že ab = cd, protože se obojí rovná LMNP.) Tím spíše by si saframentsky rozmysleli chtít popsat dvě nové proměnné d, e v rámci staré teorie jedinou novou proměnnou R. Skuteční teoretičtí fyzici by uvažovali asi takhle:

Popisujeme-li logické proměnné a, b, c (označující splnění či nesplnění empirických vlastností a nabývající tedy zde dvou hodnot, např. 0 = nesplněno, 1 = splněno) pomocí jiných logických proměnných L, M, N, zjistíme si nejen, zda to někdy nějak jde, ale pokusíme se najít rovnou nejobecnější řešení, tedy ekvivalenci. A ejhle – jde to! Rozpisem všech možností (kterých není nikterak nekonečně, nýbrž jen osm) dostaneme jednoduchý výsledek. Označíme-li symbolem abc stav, kdy neplatí ani a, ani b, ani c, můžeme napsat nejobecněji

L = a + c + λ . abc,

M = a + b + μ . abc,

N = b + c + ν . abc.

Přitom nanejvýš jedna z hodnot λ, μ, ν může být pravdivá. Máme tedy čtyři možnosti: hodnoty λ, μ, ν mohou být postupně (0, 0, 0) nebo (1, 0, 0) nebo (0, 1, 0) nebo (0, 0, 1). Tyto veličiny samozřejmě nejsou žádné „skryté“ parametry – jsou stejně málo mystické jako to, jestli volím velikost úhlu α = 270° nebo –90° pomocí „skrytého“ parametru k ve vyjádření α = 270° + 2k. π (tedy rovnu k = 0 nebo k = – 1).

A do té doby, než se objeví nové experimentální vlastnosti (třeba právě d, e, anebo i úplně jiné), pak prosím, experimentátoři, vyberte si. Máte ode mne čtyři možná řešení. Jsou to řešení všechna, samozřejmě v rámci modelu, který jste mi přinesli: že totiž jsou tři empirické vlastnosti a, b, c a dva empirické zákony, popsatelné vztahy abc, bca, a že byste je raději popsali nezávislými proměnnými L, M, N.

Až najdete další empirické vlastnosti d, e, přijďte zase; rád vám poradím. A přijdete-li s tím, že přesnější měření jaksi nepotvrdila nebo vyvrátila vaše dosavadní experimentální zjištění, nevadí – udělám vám model nový, aby jim vyhovoval.

A Occamova břitva? Tou nebudu odřezávat zbůhdarma některá náhodná řešení, ale nechám si ji pro něco jiného. Třeba až mi zanícený muzikant bude tvrdit, že λ je Cis dur, μ je samozřejmě F dur a ν pochopitelně A dur, dělící rovnoměrně oktávu a navzájem se vylučující. Pomůže-li toto jemu v hudební teorii, které já nerozumím, spánembohem – ale zvolil to on a ne já; já to autoritou matematické logiky nemíním zaštiťovat.

Jan Obdržálek

Podstatné je, o kolik je další teorie silnější

S podtitulem 1) lze plně souhlasit; článek je sice matematicky dobře, ale zbytečně komplikovaný a věc spíše zatemňující; zavádění nových proměnných d, c, R, N, f je zbytečné pro podstatu věci. Vše, co ve Fialově pojednání fakticky je (z logiky), se dá říci stručně takto: Jiří Fiala postupně zavádí čtyři teorie ve výrokovém počtu:

  • T1 s axiomy abc, bca;
  • T2 je T1 plus axiom acb;
  • T3 je teorie s axiomy a = LM, b = MN, c = LN (L, M, N jsou nové „teoretické“ výrokové proměnné);
  • T4 je teorie s axiomy M = a + b, N = b + c, L = a + c. (LM je konjunkce L, M; a+b je disjunkce a, b; = je ekvivalence.)

Snadno lze vidět, že každá další teorie je důsledkem teorie následující; otázka je, o kolik je silnější.

  1. T2 je ostře silnější než T1. (T1 má 6 modelů, T2 jen 5.)
  2. T3 je konzervativní rozšíření T2: zavádí nové symboly, ale neomezuje možnost pro a, b, c dané teorií T2 . Každé ohodnocení M, N, L (ze všech 8 možných) dává model teorie T3 a každý model teorie T2 má rozšíření do modelu T3. T3 má 8 modelů.
  3. T4 je ostře silnější než T3: Každý model T2 jednoznačně určuje model teorie T4, tedy T4 má jen 5 modelů.

Důkazy jsou snadné a leccos je dokázáno již v článku. Co tedy vyplývá pro Occamovu břitvu či Popperovu teorii falzifikace? Předpokládejme s Fialou, že T1 odpovídá empirii, tj. nebyly pozorovány případy (a, b, c) = (1, 1, 0) ani (a, b, c) = (0, 1, 1). Hypotéza, že platí T2, je falzifikovatelná; pokud někdo pozoruje (a, b, c) = (1, 0, 1), je nutno T2 zavrhnout. Pokud ne, lze zavést M, N, L a přijmout T3; pro a, b, c tím nezískáme ani neztratíme žádné možnosti. Přitom T3 připouští všech 8 logicky možných ohodnocení M, N, L. (Kdo přijímá T3, by měl ovšem mít pro M, N, L nějakou interpretaci.) Teorie T3 je vyvrácena, právě když je vyvrácena T2.

T4 omezuje možnosti pro M, N, L (na pět). Je to falzifikovatelná teorie; např. ohodnocení L = 1, M = N = 0 uvedené Fialou vyvrací T4.

Occamovský popperovec, je-li čestný, podrží co nejsilnější teorii, pro kterou má nějaké důvody, pokud nebyla falzifikována. Doporučuji čtenáři, který dočetl až sem, aby si nyní znova přečetl Fialův článek (aspoň jeho první část, druhá jen rozmělňuje). Pravděpodobně se mnou bude souhlasit, že Fialův úmysl je chvályhodný, závěr článku (počínaje slovem „Osvětářské“) hodný potlesku, ale provedení neseriózní: podsouvá čtenáři „okultní“ proměnné, formulace „jistě budete souhlasit“, „shnilá“ teorie apod. a drží ho v nevědomosti o tom, kterých možností se zbavuje přidáním nových předpokladů. Fialův článek je příkladem filozofování nad logikou bez dostatečné logické serióznosti (bohužel ne prvním ve Vesmíru). Nakonec drobnost: autor knihy zmiňované Fialou se jmenuje Ramsey, nikoli Ramsay.

Petr Hájek

Některé jednoduché věci některým lidem prostě nevysvětlíte

Očekával jsem nějaké reakce, ale tato dvě pokračování příběhu o Occamově břitvě mě opravdu zarazila.

O skutečné teoretické fyzice

(Odpověď doc. Obdržálkovi)

1. To, že se podařilo vyjádřit tři empirické proměnné třemi teoretickými proměnnými, jimiž se empirická pozorování nejen vysvětlila, nýbrž se umožnily i další predikce, představovalo v mém příběhu zásadní objev, který vystačil na několik desetiletí či staletí (historicky pomyslete třeba na Newtona).

2. Proč by se měly (např.) čtyři empirické vlastnosti vysvětlovat zrovna čtyřmi teoretickými vlastnostmi, a navíc ještě nezávislými? Vždyť přece snad skutečným teoretickým fyzikům jde o to vyjádřit empirické vlastnosti co nejmenším počtem teoretických vlastností (což by se také mohlo pokládat za Occamovu břitvu, třeba v podobě Frustra fit per plura, quod fieri potest per pauciora), a to tak, aby mezi nimi bylo co nejvíce závislostí (jimž se říká přírodní zákony). Kdybychom chtěli opravdu mít stejný počet teoretických proměnných (skoro) bez závislostí, pak by bylo nejjednodušší položit rovnou L = a, M = b atd.: říká se tomu čistě deskriptivní teorie.

3. K ,nejobecnějšímu řešení‘: tak, jako jsou a, L atd. proměnné, tj. jsou to vlastnosti předmětů, jsou λ, μ, ν proměnné a nikoli konstanty. Okultními či skrytými je nazveme proto, že nevíme, kterým předmětům příslušejí a kterým nikoli, a nevíme ani, jak a zda by je bylo možno ověřit empiricky. Naše miniteorie na ně klade jen ten požadavek, že pokud je jedna z nich pro nějaký předmět splněna, pak zbývající dvě pro něj splněny nejsou. K naší teorii je tedy nepotřebujeme, a tudíž se zdá být rozumné je prostě ignorovat, ,vynulovat‘; právě to předepisuje Occamova břitva. Cílem článku bylo ukázat, že taková redukce teoretických vlastností na (v dané oblasti známé) empirické není rozumná a že dokonce může mít škodlivé následky. Že tedy výroky jako ,L není nic než‘ patří do pseudovědy.

4. Potud to bylo nezajímavé a neobsahovalo to nic, co by nebylo v mém článku. Nezajímavé je i to, že tento článek někdo přečetl chybně a vyvodil mylné závěry. Nikdy nemůžeme zabránit chybnému pochopení toho, co jsme řekli nebo napsali. Záleží totiž na tom, v jakém kontextu se to čte a zda nechybí ochota tento kontext změnit.

Právě kontext Obdržálkovy odpovědi je zajímavý a poučný; připomínám např. věty ,Vědátoři z článku by opravdu zasluhovali co proto‘ (vědátory se patrně míní Frank Plumpton Ramsey a Richard Bevan Braithwaite) 2) , ,To správní teoretičtí fyzici by si, panečku, smlsli‘, ,Přijďte zas, já vám rád poradím‘. Zvláštní pozornosti si pak zasluhuje věta: ,A přijdete-li s tím, že přesnější měření nepotvrdila nebo vyvrátila vaše dosavadní zjištění – udělám vám model nový, aby jim vyhovoval.‘ Zdá se, že teoretická fyzika dokáže v rukou ,skutečných teoretických fyziků‘ nabízet řešení problémů a vytváření nových teorií na počkání.

Opravdu není obtížné k jakékoli větě či rozpravě stvořit takový kontext, aby se stala nesmyslem či hloupostí; někteří lidé, např. Obdržálek, mají takový kontext připraven už předem a jsou na něj pyšní. Mnohem obtížnější je ovšem nalézt k větě či rozpravě takový kontext, v němž smysl má. Říká se tomu rozumění a schopnosti tak činit vzdělání.

V jakém smyslu je to pokračování mého příběhu o Occamově břitvě? Trváte-li (např. v důsledku tzv. scientific training) na určitém fixním kontextu, v němž budete posuzovat, zda něco smysl má či nemá – stejně jako při fixování teoretických proměnných –, může se to rychle obrátit nejen proti vám (což by tak nevadilo), ale i proti vědě a jejímu rozvoji.

O seriózní logice

(Odpověď prof. Hájkovi)

Zase, mohl bych nad tím mávnout rukou a případně zavolat prof. Hájkovi, kde udělal chybu, ale dozvěděl jsem se, že můj článek je ,příklad filozofování nad logikou bez dostatečné logické serióznosti‘. Podívejme se tedy na to, jak vypadá dostatečná logická serióznost. O skutečných teoretických fyzicích jsme se už něco dozvěděli, teď přijde na pořad seriózní logika.

Prof. Hájek píše: ,Fiala postupně zavádí čtyři teorie ve výrokovém počtu.‘ Tedy a, b, c, L, M, N, ...jsou výroky (výrokové proměnné)! Prof. Hájek to dokonce říká explicitně: L, M, N jsou... výrokové proměnné.

Můj ,vlastní‘ text začíná: ,Empirické vlastnosti budeme označovat malými písmeny a, b, c, ..., vlastnosti teoretické velkými písmeny L, M, N, ...‘.

Jak je možné si splést vlastnostivýroky, mi nejde na rozum. Pokládám totiž za naprosto vyloučené, že by prof. Hájek nebyl s to rozlišit výrokové proměnné (zastupující výroky jako ,Nebe je modré‘, ,Čtyři je sudé‘ nebo ,Pes je zvíře‘) od predikátových proměnných (zastupujících vlastnosti, vztahy atd., např. ,modrý‘, ,sudý‘, ,být zvířetem‘). Přemýšlel jsem o tom hodně, ale všechna řešení mi připadala tak hloupá nebo neslušná, že jsem je zapomněl. 3) Problém je v tom, že už hned jedna z dalších vět by takovou záměnu měla zcela vyloučit: ,Cokoli má vlastnosti ab, má i vlastnost c.‘ Pro logika musí být zjevné, že tato věta obsahuje ,kvantifikátor‘ (,cokoli‘). Ale i kdybychom nevěděli, co je to kvantifikátor, museli bychom hned narazit na potíž, jak rozumět např. větě: ,Cokoli má vlastnosti nebe je modré a čtyři je sudé, má i vlastnost pes je zvíře.‘ Kdyby jen to: o kus dál se uvádí příklad, v němž a znamená ,modré‘. Ještě se mi nestalo, že by mi nějaký student řekl, že ,modrý‘ je výrok. A ještě o kousek dál je příklad, který definitivně musí vyloučit jakoukoli záměnu: ,vše, co je kulaté a modré, je těžké.‘

Ke zbytku toho, co říká prof. Hájek, se snad už nemusím vyjadřovat.

Stalo se, nevadí. Nevadí mi ani, že se empirická pozorování nazvou axiomy (odtud je už jen krok k tomu, nazvat soubor empirických pozorování ,teorií‘). Dokonce si myslím, že bych to i uměl obhájit, ale obávám se, že by to pro čtenáře Vesmíru bylo příliš postmoderní. Nakonec mi nevadí ani obvinění typu, že ,provedení je neseriózní‘. Poté, co jsem se setkal s ,dostatečnou seriózností‘, mi to připadá lichotivé.

Co mně ale opravdu vadí (a mrzí), že zůstala naprosto nepochopena pointa celého mého (tj. Ramseyova a Braithwaitova) příběhu. Vždyť tam vůbec nešlo o formální logiku, to přece nebylo filozofování nad logikou. V původním Ramseyově článku se chodilo dopředu a dozadu, a když zrovna nebyla tma, bylo možno vidět měnící se barvy; rovnice mezi empirickými proměnnými (observačními) a teoretickými proměnnými tam byly číselné. Nemám už čas ani chuť znovu se pokoušet tuto pointu vysvětlit. Je to jako u vtipu. (Ve svém skepticizmu očekávám další reakci: ,Jó, tak to s těmi teoriemi byl vtip?‘) Problém eliminace teoretických pojmů je starý problém a noční můra logických empiristů. Byly o něm napsány stohy článků i knih a Ramseyův článek i Braithwaitova kniha patří ke ,klasice‘.

Naproti tomu za to, že jsem v článku nechal ,Ramsay‘ místo ,Ramsey‘, se upřímně stydím a omlouvám.

Pro ty, kteří dočetli až sem, mám (snad) malou odměnu. Letos v létě se mi dostal do rukou francouzský Code civil (občanský zákoník) a moc jsem si početl. A to nejpěknější, co jsem našel, vám sdělím. Je to Art. 1157 a uvedu ho (pro krásu vyjadřování) francouzsky: Lorsqu’une clause est susceptible de deux sens, on doit plutôt l’entendre dans celui avec lequel elle peut avoir quelque effet, que dans le sens avec lequel elle n’en pourrait produire aucun. A teď velmi volně česky: ,Jestliže by nějaká klauzule (ustanovení, závěr, věta, článek) mohla mít dva smysly (významy), pak je třeba dát přednost tomu smyslu, který vede k nějakým závěrům (následkům, důsledkům), než tomu, který by nevedl k ničemu.‘ Skoro bych si přál, aby to byla součást i našeho občanského kodexu, nebýt ovšem toho, že mne opět zachvacuje právní nihilizmus: co když někdo (kdo ví, ,jak to správně je‘), vůbec nepřipustí či není schopen poznat či uznat, že by nějaká klauzule mohla mít i jiný smysl?

Jiří Fiala

Poznámky

1) Pozn. red.: Břitva v rukou dogmatiků může být krajně nebezpečná, neboť se jí může zaříznout svobodný rozvoj vědy
2) Kdyby chtěl někdo namítnout, že ,vědátory' se rozumí autoři těch miniteorií, použitých v článku jako příklady, pak bych byl nucen odpovědět, že autory těchto teorií byli právě Ramsey a Braithwaite. Zbyla by ještě možnost, že vědátory se rozumí ti, kteří neprozřetelně použili Occamovu břitvu. Pak bych ovšem musel souhlasit.
3) Myslet si např. že by to mohla způsobit věta ze začátku článku ,Nenechte se odradit tím, že se v tomto příběhu vyskytují vzorečky; jde o velmi jednoduché vztahy obyčejného výrokového kalkulu (či elementární teorie množin). Ono tomu tak opravdu je, potřebujeme jen vztahy typu LL = L. Z predikátového kalkulu tam nepotřebuji nic.

Ke stažení

OBORY A KLÍČOVÁ SLOVA: Věda a společnost
RUBRIKA: Diskuse

O autorech

Jiří Fiala

Petr Hájek

Jan Obdržálek

Doporučujeme

Algoritmy pro zdraví

Algoritmy pro zdraví

Ondřej Vrtiška  |  8. 7. 2024
Umělá inteligence proniká do medicíny a v následujících letech ji nejspíš významně promění. Regina Barzilay z MIT má pro vývoj nástrojů...
Mají savci feromony?

Mají savci feromony?

Pavel Stopka  |  8. 7. 2024
Chemická komunikace je způsob předávání a rozpoznávání látek, jímž živočichové získávají informace o jiných jedincích, o jejich pohlaví a věku, o...
Jak funguje moderní speleologie

Jak funguje moderní speleologie uzamčeno

Michal Filippi, Jan Sirotek  |  8. 7. 2024
Přesně před 150 lety byla na prodej Mamutí jeskyně. Systém, který do té doby sloužil jako místo pro těžbu ledku z guana, byl k mání za pouhých...