Je každá teorie o něčem?
Když jsem zde před časem psal o vnitřních potížích s porovnáváním teorií v souvislosti s Popperovým pojmem verisimilitude a Tichého důkazem nesoudržnosti tohoto pojmu, tak pro nás teorie byly nějaké soubory (množiny) vět, formulovaných v nějakém předem daném jazyku. Problémy byly s nepravdivými teoriemi, tedy teoriemi, které měly nějaké důsledky, které byly nepravdivé. Podstatné tam bylo rozlišení mezi pravdivostí a platností: platnost se týkala toho, co můžeme uvnitř teorie vyvodit a co uvnitř teorie pokládáme za “pravdivé″, zatímco pravdivost se vztahovala k čemusi vně této teorie.
Popperův postoj byl – a to už od jeho Logiky vědeckého bádání – že nikdy nemáme žádné pravdivé teorie, nýbrž jen teorie, které se osvědčily (byly “corroborated″, koroborovány – což je anglický překlad původního Popperova termínu “sich bewähren″, tedy osvědčit se).
Toto osvědčení se, zhruba řečeno, děje vždy vůči nějakému souboru základních tvrzení, která už sama nepodléhají žádnému dalšímu zdůvodnění (justifikaci), např. “bezprostřední smyslovou zkušeností″. Justifikace by se totiž musela dít opět vůči nějakému “ještě základnějšímu″ souboru vět a tak bychom se dostali do nekonečného regresu.
Alternativou by byl pak jen apriorizmus, že to prostě tak je a dál se o tom bavit nebudeme. Nepřijmeme-li ani jedno ani druhé, pak nám nezbývá než uznat, že výběr těchto základních tvrzení je věcí dohody, rozhodnutí a souhlasu všech zúčastněných vědců daného oboru. Teorie jsou hypotézy a Popper volí jako moto své první knihy citát z Novalise: “Hypotézy jsou sítě; jen ten, kdo je hodí, něco chytne.″ Naše dnešní otázka zní: Chytí vždy něco, a když ano, co je toto něco?
Abychom tuto otázku, totiž zda je každá teorie o něčem, mohli zodpovědět, musíme se podívat podrobněji na strukturu jazyka, v němž se teorie formuluje. Věty tohoto jazyka jsou nějaká tvrzení, která mají tvar oznamovacích vět. V gramatikách (třeba češtiny; cituji podle Havránka a Jedličky) se dočteme něco takového: “Ve větě lze zpravidla rozeznávat dvě části: jednu část, která vyznačuje původce či nositele činnosti, stavu nebo vlastnosti – to je část podmětová (podmět, subjekt); druhou část, která vyznačuje činnost anebo vlastnost podmětu, prostě něco, co se podmětu přisuzuje, – to je část přísudková (přísudek, predikát).″ Říká se tady “zpravidla″, v logice se z toho činí pravidlo, předpokládá se to. Takové omezení to zase není: při troše dobré vůle (a mírného násilí na přirozeném jazyce, což je u každého jazyka vědy stejně nutné), dostaneme do tohoto tvaru každou (jednoduchou, holou atd.) větu. Zkrátka budeme předpokládat, že věty takového jazyka mají subjekt-predikátový tvar.
Příklady: “4 je sudé″, “kočka mňouká″. První příklad je jednoduchý, je to singulární tvrzení o čísle 4, o němž se říká, predikuje, že je sudé. Ten druhý příklad je už složitější: neříká se jím, že zrovna teď nějaká určitá kočka mňouká, nýbrž, že kočky obecně mňoukají. Ani to ještě není ono, ne vždy mňoukají. Chceme-li to říci přesněji, musíme to říci nějak takto: “Pro každou kočku platí: jestliže tato kočka vydává zvuky (které nejsou prskáním atd.), pak mňouká″. To jsou “tvrzení univerzální″; slovo “kočka″ zde nevystupuje v roli jména nějakého určitého individua (jako tomu bylo třeba u ″4" – což je jméno individua čtyři), nýbrž jako “proměnná″, jejíž hodnoty jsou “kvantifikovány″ slovy: pro všechny. Základními predikáty by tedy zde byly: “být kočkou″, “mňoukat″.
Predikáty, které jsme dosud viděli, se týkaly vždy jen jednoho jména individua nebo jedné proměnné. S takovými predikáty ale nevystačíme. Vezměme například věty: “Sněžka je nižší než Mont Blanc″ nebo “Jana je manželka Petra″. Ty se nám nepodaří převést na jednoduchý subjekt-predikátový tvar. Můžeme sice říci, že “Jana je manželka″ a ″Petr je manžel″, ale odtud neplyne, že by Jana byla manželkou zrovna Petra. Podobně s větami “Sněžka je nízká″, “Mont Blanc je vysoký″. Logici vyřešili tento problém tak, že kromě “jednomístných″ predikátů jako “být sudý″ připustili i predikáty “dvoumístné″ (A je nižší než B, X je manželka Y), “třímístné″ (z je součtem x a y) atd.
Takže nejjednodušší oznamovací věty jsou složeny z predikátu a příslušného počtu jmen individuí či proměnných. Z těchto jednoduchých vět můžeme skládat věty složené, např. spojkou “a″: “Sněžka je nižší než Mont Blanc a Mont Blanc je nižší než Mount Everest″, nebo negací, např. “Jana není manželka Petra″, tj. “ne-(Jana je manželka Petra)″. Spojka “a″ je binární (spojuje dvě věty), “ne″ je unární (neguje jednu větu). Mohou být spojky ternární (spojující tři věty) atd. Ve výrokovém počtu, který se tímto spojováním zabývá, se ukazuje, že všechny spojky se dají vyjádřit jen pomocí “a″ a ″ne″. Tak třeba spojku “nebo″ (v nevylučujícím smyslu, tj. u nebo v znamená buďto u nebo v, nebo oboje) můžeme vyjádřit jako “ne-(ne-u a ne-v)″. Dál už do toho nepůjdeme; jednak si myslím, že jste se s tím v nějaké podobě už setkali, jednak to pro další výklad ani nebudeme potřebovat.
Ve vědě nevystačíme ovšem jen s větami singulárními, vypovídajícími o kočce Míce, číslu 2, Janě, Sněžce atd. Věda spočívá na tvrzeních univerzálních, jako “Všichni lidé jsou smrtelní″, “Pro každé dva různé body existuje přímka, která jimi prochází″. První příklad se analyzuje v logice takto: “Pro všechna x: je-li x člověk, pak je x smrtelný″; máme zde dva predikáty: “být člověkem″, “být smrtelný″, jednu proměnnou x a jeden kvantifikátor (“pro všechna x″). Druhá věta se analyzuje takto: Pro každé x, y: je-li x bod a je-li y bod a je-li x různé od y, pak existuje z tak, že z je přímka a x leží na z a y leží na x″. Kdybychom chtěli vyjádřit, že tato přímka je jen jedna, museli bychom dodat “a pro každé w: je-li w přímka a x leží na w a y leží na w, pak w je totožné se z″.
Vidíme, že i v takto jednoduchých případech je úplná analýza složitá a zdlouhavá (a to naše analýza není v přísném smyslu zdaleka úplná). V principu je však vždy proveditelná a obecné přesvědčení, že vystačíme s kvantifikátory “pro všechna″ a “existuje″ (dokonce jen s jedním z nich, neboť “existuje x tak, že″ lze říci i jako “ne- pro všechna x platí ne-″). Jiné kvantifikátory jako třeba “pro téměř žádné″, “pro drtivou většinu″, “skoro nikdy″ se buďto dají vyjádřit v konkrétním případě pomocí kvantifikátorů základních, anebo jsou natolik vágní, že do jazyka vědy stejně nepatří (což je dost zajímavý způsob, jak se zbavit problémů).
Shrňme to: jazyk vědy je analyzovatelný na základní věty, které jsou složeny z predikátu a jednoho či více jmen individuí nebo proměnných. Z nich se pak všechny věty dají sestavit pomocí spojky “a″, negace “ne″ a kvantifikace “pro všechna″.
Teď musíme udělat jeden krok, který pochází od Bolzana a který je velmi podstatný. Je to krok dost obtížný, proto prosím o větší pozornost. Řekneme-li, že každé dva různé body leží na jedné přímce, pak tím rozumíme, že ať vezmeme jakékoli dva body, pak existuje přímka, která jimi prochází. Jinými slovy, že naše tvrzení je splněno jakýmikoli instancemi, že platí v každém případě. Jenže co je to “bod″, “přímka″, “ležet″? Geometrie se tím nezabývá, bere tato slova jako základní, primitivní, nedefinovaná a nedefinovatelná. Jsou “naprosto neurčitá″; Bolzano tomu říkal “proměnné představy″. Mají smysl nikoli osamoceně, nýbrž jen v souvislosti, kontextu geometrické teorie, v síti vztahů postulovaných axiomy geometrie. Řecké slovo axióma neoznačovalo však původně v dobách Eukleidových něco samozřejmého, evidentního, něco, co každý musí přijmout, nýbrž takovou větu, která se v kritickém dialogu předhazuje, aby se posoudily její důsledky, přičemž partner v dialogu nebyl vůbec nucen takovou větu přijmout jako pravdivou. Teprve v další historii (tím, jak se Eukleidovy Základy vyučovaly jako definitivní nauka) se zvrátil význam slova axióm v něco, co každý přece musí přijmout, protože to prostě tak je. Mimochodem: jak byste se vypořádali s někým, kdo by pochyboval o tom, že vůbec nějaké body, přímky existují, a chtěl po vás důkaz existence třeba jen jednoho bodu? A jak byste chtěli existenci bodu dokázat, když vám chybí definice bodu? V čem tedy spočívá evidence a samozřejmost?
Samozřejmost axiomů geometrie souvisela s přesvědčením, že musí existovat jeden “pravý a objektivní″ (neobyčejně vágní slova!) popis světa, “tak jak to opravdu je″. Objev neeukleidovských geometrií byl šokem. Jeden z ″evidentních″ axiomů se nahradil opakem (rovnoběžné přímky se protínají) a dostal se opět “konzistentní popis světa″. Největší šok však musel být z toho, že se mezi těmito různými popisy nedá rozhodnout, že nelze říci, která z těchto různých geometrií je “objektivně″ ta správná, že se to nedá rozhodnout z principu, že si musíme vybrat na základě našeho svobodného rozhodnutí.
K uznání neeukleidovských geometrií přispělo to, že se v minulém století podařilo matematikům udělat modely těchto geometrií, a to v eukleidovské geometrii (např. “body″ byly opět body, ale na kulové ploše, “přímky″ byly kružnice apod.). Všechny axiomy neeukleidovské geometrie byly splněny. Všimněte si ale tady něčeho podstatného: model byl udělán nikoli “ve skutečnosti″, nýbrž v jiné teorii (eukleidovské geometrii). Kdybychom byli vychováni v geometrii neeukleidovské, divili bychom se geometrii eukleidovské a dělali si její modely v námi přijaté geometrii neeukleidovské!
To, co si dobře uvědomila geometrie, si, zdá se, začínají uvědomovat ostatní vědy: že totiž základní pojmy jsou stejně nedefinované jako body v geometrii, že smysl těchto pojmů je dán jen (koherentní a konzistentí) sítí jejich vztahů k jiným (stejně nedefinovaným) pojmům. “Věda vždy vysvětluje známé pomocí neznámého,″ říká opakovaně Popper.
Vraťme se ale k ″bolzanovskému obratu″. Vezměme si nějakou teorii, tj. množinu vět v nějakém jazyku popsaného typu, teorii, která je konzistentní, tj. neobsahuje (ani v důsledcích) nějakou větu a současně i její negaci. Tradičně bychom řekli, že tato teorie je správná (pravdivá), když odpovídá skutečnosti. Problém je s tím slovem “odpovídat″. Musíme se totiž opřít o jinou (zase “samozřejmou″) teorii a říci, že tomu a tomu predikátu atd. v naší teorii odpovídá ten a ten predikát v ″samozřejmější″ teorii. Pod touto “samozřejmější″ teorií si lze třeba představit (zpravidla explicitně neformulovanou) teorii v jazyku “bezprostředních smyslových zkušeností″. Zůstane ovšem stejná otázka: jak tato samozřejmější teorie odpovídá skutečnosti? Ten Bolzanův obrat a pak Hilbertův obrat v geometrii spočíval v tom, že si tyto otázky prostě přestaneme klást. Teorie bude správná, bude-li prostě o něčem a je o tomto “něčem″ správně. Toto “správně″ už není tak vágní: cokoli vyvodím v teorii, musí platit také v onom “něčem″ (a toto “něco″ je opět zase teorie).
Teď už to vypadá nadějně: řekli bychom, že nějaká teorie je nesprávná, když je o ničem. Jenže tak tomu není. Každá konzistentní teorie je o něčem a je o tomto něčem správně! Toto něco se nazývá modelem teorie. Tento podivný a pozoruhodný důsledek vyvodili už ve dvacátých letech nezávisle dva logici: Löwenheim a Skolem; ve třicátých letech k tomu nezávisle dospěl i Gödel. Ale pozor, ten model je ovšem formulován opět v nějaké teorii a tato teorie musí být taková, že o ní nemáme pochyb. V našem případě jsou základem modelu přirozená čísla 1, 2, 3 atd. Kdo by se odvážil nepřijmout tento předpoklad? Možná znáte větu, kterou napsal německý matematik Kronecker v minulém století: Přirozená čísla jsou od Boha, všechno ostatní je výmysl lidský.
Pokusím se teď o nemožné: naznačit hlavní ideu důkazu Löwenheimovy-Skolemovy věty, tedy toho, že každá bezesporná teorie je o něčem, že má model. Zde se nám ukáže výhoda toho, že se logikům podařilo vyjasnit, že vše, co říkáme v nějakém jazyku vědy, se dá vyjádřit pomocí základních formulí a spojek “a″, “ne″ a ″existuje″. Hlavní problém je, jak se dá čekat, se slovem “existuje″. Víme ale už, že když máme nějakou větu tvaru “existuje x tak, že, třeba existuje x tak, že x.x=4″, pak když máme nějaké takové x – totiž např. 2 – máme vyhráno. Ale co je to “2″? To je jméno nějakého individua, je to individuová konstanta. Máme-li tedy “jmen″ dostatek, totiž pro každé “existuje″ nějaké, pak máme znovu vyhráno. Takže: Když máme nějakou teorii (řekněme A), která je bezesporná a která už obsahuje všechny své logické důsledky a má dost individuových konstant, pak má model, je o něčem. Přesněji: když je A taková, že:
- obsahuje-li větu u, pak neobsahuje větu ne-u;
- obsahuje-li větu ne-ne-u, pak obsahuje i větu u;
- obsahuje-li větu u a v, pak obsahuje jak u, tak v;
- obsahuje-li větu u nebo v, pak obsahuje buďto u, nebo v (nebo obě);
- obsahuje-li větu “existuje x tak, že u″, pak obsahuje i individuovou konstantu c takovou, že u je s tímto c splněno;
- obsahuje-li větu “pro všechna x platí, že u″, pak neobsahuje žádnou individuovou konstantu, která by splnila větu ne-u;
pak už taková teorie má model. Tento model je prostě udělán z množiny individuových konstant, teorie je o těchto individuových konstantách. Vztahy mezi těmito objekty – individuovými konstantami – jsou prostě převzaty z teorie samé, což zaručuje, že je teorie o nich (jaksi z definice) správně.
Co když ale těch individuových konstant není dost? Teprve teď přijde něco vskutku rafinovaného: my si je prostě vymyslíme – ale ne tak úplně: vezmeme za ně třeba přirozená čísla (ta “jsou″); rozumějte: přirozená čísla budou teď “jména″, individuové konstanty. Mohli bychom místo toho vzít třeba čárky: |, ||, |||, – nebo i třeba posloupnosti písmen, něco jako “slova″. Podstatné však bude, že to ve své nekonečnosti existuje, a to naráz, čili jak se říká: aktuálně. A teď ta vlastní rafinovanost: všechny věty jazyka se dají seřadit (třeba abecedně v nějaké rozšířené abecedě). My je ale seřadíme tak, aby se v tomto (nekonečném) seznamu každá věta opakovala nekonečněkrát. To lze zařídit takovým “cik-cakovým″ způsobem: napřed je seřadím nějak, a pak po tomto seznamu postupujeme dopředu a zase hned dozadu (všechny dosavadní věty tam dáme ještě jednou pozpátku a pak zase o jeden krok dopředu atd. Kdybychom to třeba dělali s čísly, pak by to mohlo vypadat takto: 1. Přidáme 2 a hned zpět: 1 2 2 1. Přidáme 3 a hned zase celé zpět: 1 2 2 1 3 1 2 2 1. Přidáme 4 a hned zase zpět: 1 2 2 1 3 1 2 2 1 4 1 2 2 1 3 1 2 2 1 atd. Může vám to zatím připadat celé nesmyslné, podstatné je ale jen to, že se tam každé číslo (v našem případě věta) objeví nekonečněkrát. Proč to potřebujeme, ještě naznačím. A teď bereme větu za větou: jakmile se nám tam objeví “existuje x tak, že″ a my ještě žádné takové x nemáme, tak si vezmeme další volné jméno – individuovou konstantu z našeho seznamu přirozených čísel, čárek nebo slov. A když tam bude “pro všechna x platí to-a-to″, tak prohlásíme, že “to-a-to″ platí pro všechny dosud vybrané individuové konstanty, prostě jim tu vlastnost být “to-a-to″ připíšeme. Teď je dobré vědět, že se tam každá věta objeví nekonečně mnohokrát: můžeme si vymyslet další individuovou konstantu, ale ono “pro všechna″ mohlo být už někdy předtím, takže jsme tuto vlastnost nově vybrané konstantě nepřipsali. Jenže ono “pro všechna″ se objeví zaručeně ještě jednou (a nekonečněkrát). Teď by měl přijít důkaz toho, že to vždycky dopadne dobře, že se nedostaneme do nějaké smyčky, bludného kruhu. Tak tomu už budete muset věřit. Udělal jsem, co jsem mohl, abych vás o tom přesvědčil. Dokázat to opravdu (tj. ve shodě s nynějšími standardy pro dokazování) je už záležitost profesionální. To ale neznamená, že by měl takový výsledek být zatajován. Když si čtu články třeba o imunologii, dozvím se, a v lepším případě i pochopím, spoustu velice zajímavých a důležitých věcí i souvislostí, přestože mi samozřejmě ono profesionální zázemí zůstane utajeno. Ale také tuším, co bych musel podniknout (a kolik by to asi stálo času), abych do toho pronikl a mohl věci z profesionálního hlediska posuzovat.
Tak vezměte na vědomí, že to dokázat lze. Takže každá bezesporná teorie je o něčem. Z toho, co jsem zde ale naznačil, vyplývá, že toto “něco″ je zkonstruováno z teorie samé plus předpokladu, že existuje něco takového, jako je množina přirozených čísel. Svá fakta si teorie udělala sama. No dobře, můžete říct, ale jsou přece nějaká “faktická fakta″. Teď se rozjel nekonečný regres a já z tohoto rozjíždějícího se regresu raději hned vyskočím.