Fuzzy logika - móda, či změna paradigmatu?
Čím lépe matematické zákony popisují realitu, tím jsou méně přesné, a čím jsou přesnější, tím hůře popisují realitu.
Albert Einstein
V řadě lidských činností se používá nebo spíše začíná používat teorie fuzzy množin. Začalo to v obecné teorii systémů a v regulační technice a dnes se fuzzy množiny používají v ekonomii, v lékařské diagnostice, v odhadech stability stavebních konstrukcí, k předpovídání zemětřesení, k popisu činnosti chemických reaktorů, ale i v knihovnictví a finančnictví. Čtenáři Vesmíru měli příležitost setkat se s pojmem „fuzzy“ i v jazykovém koutku p. prof. Daneše (Vesmír 70, 537, 1991/9).
Praktická uplatnění jsou ještě atraktivnější a firmy z Dálného východu zaplavují svět fuzzy procesory použitými v “inteligentních“ pračkách, vysavačích, kamerách a nejrůznějších dalších zařízeních. Naskýtá se otázka, nadhozená v nadpisu článku, zda jde o módní vlnu, která bude mít jen pomíjející trvání, nebo zda tento zájem signalizuje jisté změny ve způsobech našeho uvažování. Dnes již mnohé argumenty nasvědčují tomu, že jde o zásadní změnu, kterou bychom mohli označit jako posun nebo změnu vzoru, jímž se řídily hluboce zažité stereotypy našeho myšlení. V následujících řádcích se pokusíme tyto argumenty osvětlit na historii fuzzy množin, dnes již téměř třicetileté, a na předchozím vývoji, jenž k jejich objevu vedl.
Fuzzy přístup totiž není jen jakýsi nový přístup k vyjádření neurčitosti, který má zajímavé technické využití, ale on tak trochu staví na hlavu způsob uvažování používaný v západní civilizaci od dob antiky.
Od dob Aristotelových se učíme v logice, že tvrzení může být buď pravdivé, nebo nepravdivé, třetí možnost neexistuje. V tzv. exaktních vědních disciplínách se snažíme pravdivost svých tvrzení ověřit objektivním měřením. Galileo dal novověké fyzice do vínku své heslo: „Měřím, co měřitelné je, a snažím se učinit měřitelným to, co ještě měřitelné není.“ Přesný kvantitativní popis přírodních jevů založený na tomto přístupu umožnil použití matematických metod pro systematizaci pozorovaných dat a vybudování teorií, které jsou z hlediska vysvětlování i předvídání těchto jevů velmi účinné.
Dlouho žila obec fyziků a na ni navazující obec techniků v přesvědčení, že je jen otázkou nákladů a úsilí, jak kterou veličinu dokážeme přesně změřit. Prvním varováním, které touto vírou otřáslo, byl objev Heisenbergova principu neurčitosti. Dvě veličiny (poloha a hybnost částice) jsou navzájem vázány tak, že čím přesněji změříme jednu, tím méně víme o té druhé. Objevil se tady poprvé překvapující fakt, že existují jakési meze kvantitativního přístupu.
Ve stejné době, kdy se fyzikové v Göttingenu potýkali s principem neurčitosti, se o kousek dále, v Cambridgi, Bertrand Russel při tvorbě svého monumentálního díla „Principia mathematica“ potýkal s paradoxy klasické logiky. Jde o soudy, kde jsou potíže s určením pravdivosti. Znali je už antičtí filozofové, jak dokládá známý paradox lháře: Epimenides tvrdí, že všichni Kréťané jsou lháři. Epimenides je Kréťan: je jeho výrok pravdivý, nebo není? B. Russel k tomu přidal svůj paradox holiče: Holič má nad svou oficinou napsaný reklamní nápis „Holím všechny občany tohoto města, kteří se neholí sami.“ Jak je to však se samotným holičem? Jestliže se holí sám, pak reklamní nápis není pravdivý, a jestliže se neholí sám, pak také není pravý.
Pomiňme fakt, který odhalil B. Russel, že se zde směšuje tvrzení v jazyku a v metajazyku, a podívejme se, jak by to vypadalo s pravdivostními hodnotami.
Pro zmíněné paradoxy platí, že pravdivostní hodnota tvrzení je rovna pravdivostní hodnotě popření tohoto tvrzení.
Porušují zákon nonkontradikce (neprotiřečení) a vyloučení třetího. Pokud bychom nebrali v úvahu, že tyto zákony porušujeme, a přiřadili bychom pravdivostní hodnotě „pravda“ hodnotu 1, kdežto pravdivostní hodnotě „nepravda“ hodnotu 0, pak řešením této rovnice dostaneme na první pohled nesmyslný výsledek 1/2. Výsledkem je „polopravda“. Je skutečně tento výsledek nesmyslný? Zcela jistě je nesmyslný z hlediska aristotelovské logiky. Vraťme se ale opět do třicátých let.
V době, kdy se v Göttingenu zabývali principem neurčitosti a B. Russel v Cambridgi zkoumal vlastnosti svých paradoxů a budoval logické základy matematiky, v Polsku pracovala skupina význačných logiků, tzv. Lvovsko-varšavská škola. Jejím vůdčím duchem byl profesor Jan Lukasiewicz (mimochodem ministr školství v první polské vládě), který vybudoval vícehodnotovou logiku, nejprve s pravdivostními hodnotami (0, 1/2, 1), později s pravdivostními hodnotami z celého intervalu (0,1), to byla Lukasiewiczova logika L1. V Lukasiewiczově logice by tedy náš předchozí výsledek nemusel být zcela nesmyslný. V souvislosti s Lvovsko-varšavskou školou ještě poznamenejme, že tradice nebyla přerušena a že v Polsku je jedna z nejsilnějších skupin zabývajících se fuzzy logikou. (Pedrycz, Czogala, Kiszska aj.).
Způsob uvažování založený na vícehodnotové logice se zdá cizí evropské tradici, která vychází z logiky aristotelovské. Tento způsob však není cizí některým filozofiím orientálním. V čínské taoistické dialektice spolu soupeří dva principy, jin a jang. Každá věc je trochu jin a trochu jang. Některá je více jin, jiná více jang.
Proto není čistě náhodou, že snaha o změnu aristotelovského paradigmatu přišla – byť trochu zprostředkovaně – z oblasti, kde odpradávna na sebe narážely kultura antická a orientální: z oblasti dědiců kultury perské.
První, kdo se začal po filozofické stránce zabývat jiným než pravděpodobnostním pohledem na neurčitost a kdo zavedl pojem „vagueness“, byl americký filozof Max Black. V slavnostním čísle International Journal of General Systems, věnovaném 25. výročí prvního článku o fuzzy množinách, přetiskl prof. G. J. Klir Blackův článek z r. 1937. Nezasvěcený pozorovatel by nepoznal, že článek je o půl století starší než ostatní články současných představitelů teorie fuzzy množin. Blackovy práce však tenkrát měly malý ohlas, doba ještě nebyla zralá.
Uzrála až r. 1965, kdy L. Zadeh publikoval svůj článek „Fuzzy sets“. Ten dal fuzzy množinám jméno a je všeobecně považován za začátek jejich éry. Avšak ještě než se budeme zabývat Zadehovým přínosem, vraťme se k zmínce o styku kultur. Max Black se narodil v Baku. Prof. Lotfi Zadeh je též Ázerbájdžánec narozený v Baku, odkud jeho rodiče utekli před stalinským terorem do Íránu. (Na Teheránské univerzitě vystudoval elektrotechnické inženýrství). Že by šlo o shodu čistě náhodnou?
Podívejme se nyní, v čem spočívá základní Zadehova idea, která vedla ke vzniku teorie fuzzy množin. Celá moderní matematika je budována na teorii množin. Jenže, jak už to bývá, každá krásná a elegantní teorie má nějaké slabé místečko, ze kterého se časem vyvine změna paradigmatu. Ten malý problém spočíval v rozhodnutí, zda prvek patří, či nepatří do dané množiny. Každá množina má svou charakteristickou funkci, která nabývá hodnoty 1, jestliže prvek do množiny patří, a hodnoty 0, jestliže prvek do množiny nepatří. Jenže nalezení hodnot charakteristické funkce u většiny aplikací je problém ležící většinou mimo matematiku, a často vůbec těžko rozhodnutelný.
Ukažme si to na příkladu, který si vypůjčíme od prof. P. Vopěnky, autora alternativní teorie množin, která je v mnohém směru fuzzy množinám velmi blízká. Příklad je následující: Vezměme si množinu všech lidí, kteří kdy na Zemi žili. Bude to množina spočetná, budou tam patřit všichni žijící lidé a všichni jejich mrtví předkové. Ale pozor! Lidský druh se vyvíjel – a kteří předkové tam patřit budou a kteří už ne? Od cromagnonských lovců nás dělí pouhých pár desítek generací. Zcela jistě bude do této množiny patřit jistý pan Darwin, který s vývojovou teorií přišel. Bude tam ale patřit o několik desítek generací starší pradědeček slavné Lucy, kterého nazveme pracovním názvem opičák Charlie? O tom se budou velmi obtížně dohadovat paleontologové, antropologové atd., natož matematici. Nicméně lidský druh má s opičákem Charliem mnohé rysy společné, tak trochu do zmíněné množiny patří. Jenže charakteristická funkce nám neumožňuje vyjádřit „tak trochu“. Na hodnoty charakteristické funkce se můžeme dívat jako na pravdivostní hodnoty výroku „patří do množiny“. Použijeme-li nyní Lukasiewiczovu logiku, kde obor pravdivostních hodnot je kontinuum (0, 1), bude každému prvku množiny příslušet určitá pravdivostní hodnota výroku „patří do množiny“ – od 0, kdy tam nepatří, až po 1, kdy tam zcela jistě patří. Tuto pravdivostní hodnotu označíme jako funkci příslušnosti . Do fuzzy množiny všech lidí bude Charles Darwin patřit s = 1, kdežto opičák Charlie např. s = 0,1.
Zdánlivě jednoduchý krok, který otevřel dveře nesmírným možnostem. V běžném životě je málo tvrzení, o kterých bychom mohli bezpečně říci, že jsou pravdivá či nepravdivá. Pohybujeme se ve světě neurčitých výpovědí, často je to tak, někdy jinak, většinou to nastává, někdy to nenastane, skoro všichni tam byli, málokdo tomu rozuměl, Karel je skoro tak dobrý jako Pepa atd. atd. Fuzzy množiny nám umožňují přesný popis takovéhoto neurčitého světa a vytvářejí pro to velmi bohatý aparát. Jen tak pro zajímavost, implikace (tj. výrok typu Jestliže A, pak B) jako logická funkce je jediná. Různých typů fuzzy implikací je celá řada. Jednotlivé typy implikací více či méně přesně zachycují naše přibližné usuzování za různých okolností.
Teď se jistě může objevit námitka, proč se tím vlastně zabýváme, jaký to může mít praktický význam, k čemu je to dobré? Vysvětlení nám poskytne jiný Zadehův článek, který svým názvem předznamenal vznik induktivního směru obecné teorie systémů. Článek se jmenuje „From circuit theory to system theory“, tedy od teorie elektrických obvodů k teorii systémů. Poukazuje se v něm na to, jak se s postupným rozvojem regulační techniky zjistilo, že řadu dynamických systémů jde řešit metodami používanými v teorii obvodů. Pro jejich řešení se vlastně v té době užívalo univerzálních elektrických obvodů – analogových počítačů. Zobecnění těchto myšlenek vedlo ke stavovému popisu a L. Zadeh patří mezi průkopníky stavové teorie. Vděčíme mu mimo jiné za matematicky přesnou, ale operacionální definici stavu.
Udělejme nyní malou odbočku věnovanou systémovému přístupu. Obecná teorie systémů brzy odvrhla pojetí přírodního zákona poplatné 19. století. (Představu, že existují nějaké objektivní přírodní zákony, které je možno objevit, a pak jsme s popisem přírody hotovi.) Nahradila je chápáním přírodních zákonů jako systémů budovaných na objektech reálného světa, daných časoprostorovou rozlišovací úrovní (přesností měření a popisu) a současným vědeckým paradigmatem, které v současné době nejlépe vystihuje pozorované jevy. Z tohoto pohledu popis dynamických systémů založený na diferenciálních rovnicích a vycházející z teorie elektrických obvodů byl velice účinný u fyzikálních systémů, ale selhává u systémů málo formalizovaných. Všeobecné mínění v exaktních vědách je, že systémy biologické, ekologické, socioekonomické apod. nejsou dobře formalizovatelné, protože příslušná vědní disciplína není na takové úrovni, aby umožňovala přesná kvantitativní měření.
Když prof. Zadeh domýšlel systémové představy dále, uvědomil si, že nedostatečná formalizace, která brání použití diferenciálních rovnic, není způsobena jen nedostatečnou úrovní příslušné vědní disciplíny. Uvědomil si, že zmíněné disciplíny pracují s nesmírně složitými systémy, které neumožňují použití tradičních fyzikálních jednofaktoriálních experimentů. Jde o systémy, kde se výrazně uplatňují jejich holistické vlastnosti, synergizmus současného působení mnoha jevů, a kde často nejde oddělit pozorovatele od pozorovaného jevu. To ho vedlo k formulaci principu inkompatibility, jenž je vlastně přesným vyjádřením Einsteinova aforizmu použitého jako moto článku.
Princip říká, že když složitost systému roste, naše schopnost formulovat přesná a důležitá tvrzení klesá až k jistému prahu, za nímž jsou přesnost a závažnost vzájemně se vylučujícími charakteristikami. Řečí teorie fuzzy množin by se princip dal vyjádřit takto: Čím blíže je problém reálnému světu, tím více fuzzy se stává jeho řešení.
Teorii fuzzy množin otevřel představitel aplikačního oboru, byť hluboce poučený v matematice. (L. Zadeh je profesorem elektrotechnického inženýrství na Kalifornské univerzitě v Berkeley a autorem fundamentálních prací v teorii automatického řízení). Nicméně jako teorie množin patří fuzzy množiny do hájemství matematiky. Je proto zajímavé všimnout si reakce profesionálních matematiků. Reakce matematické komunity byla podobná, jako když před sto lety Heawiside zavedl používání operátorového počtu. Část matematiků pracujících s neurčitostí, tj. statistiků, odmítá vzít teorii fuzzy množin na vědomí. Jsou toho názoru, že není třeba jiný popis neurčitosti než pravděpodobnostní. Na námitku, že jde o jinou neurčitost než kterou zachycuje pravděpodobnost, odpovídají, že zatím se sice ještě přesně neví jak, ale časem se to jistě podaří převést na pravděpodobnost. Menší skupina spíše mladších matematiků vzala teorii fuzzy množin za svou a čile dokazuje další a další teorémy, takže dnes má teorie fuzzy množin již velmi slušné teoretické zázemí.
Aplikace fuzzy množin nebyly po dlouhou dobu příliš významné. Situace se ale začala dramaticky měnit před několika málo lety, zejména od té doby, co Yamakawa vyrobil první fuzzy VLSI obvody a co se ukázalo, že kombinace fuzzy přístupu a neuronových sítí se velmi dobře dá realizovat pomocí optických procesorů. Dnes nám nabízí fuzzy procesory řada firem, zejména z Dálného východu. Nemá smysl tady vypočítávat jednotlivé způsoby uplatnění. Japonsko zaplavuje svět nejrůznějšími výrobky, které využívají fuzzy logiky, počínaje vysavači a konče automatickým řízením metra. V Číně se údajně zabývá aplikacemi fuzzy řízení přes 10 000 techniků. (Zřejmě má ta asijská jin – jang dialektika k fuzzy přístupu blízko).
Nejzajímavější na tom je, že se fuzzy přístup zatím prakticky velmi málo využívá v oblastech, pro které byl původně navržen. To znamená pro systémy málo formalizované, kde nejsou matematické modely a kde se opíráme jen o neurčité slovně popsané modely. Světlou výjimkou jsou některé biotechnologické procesy, jako je např. čistička vody, kde popis ve formě diferenciálních rovnic není znám nebo je příliš nákladné ho nalézt a kde se skutečně vycházelo ze slovního popisu činnosti zkušeného operátora. Výhoda, že nepotřebují matematický model v analytickém tvaru a že „fuzzy matematika“ je často velmi jednoduchá, vede k tomu, že fuzzy regulátory úspěšně zastupují klasické systémy řízení. Místo analytického popisu používáme slovně formulovaná pravidla, a přesto může být přesnost popisu srovnatelná s popisem pomocí diferenciálních rovnic. To ale umožňuje využít zkušeností, různých heuristik a vůbec kvalitativního pohledu na řešený problém.
I ve velmi fundovaných článcích nalezneme větu typu: „Na základě inženýrského úsudku, zdravého rozumu a dostupných zkušeností byla zvolena následující pravidla.“ Velmi perspektivní je v tomto směru použití neuronových sítí, které se na základě trénovací množiny mohou naučit zmíněná pravidla, aniž je třeba tato pravidla jasně formulovat. Podobná situace je i s odhadem funkcí příslušnosti.
Vraťme se však k otázce uvedené v nadpisu. Je současná „fuzzy vlna“ módou, nebo jde skutečně o posun vzoru od stroze kvantitativního popisu k popisu respektujícímu kvalitativní stránky pozorovaných jevů? Do jisté míry jde jistě o módu, povzbuzenou úspěchy uplatnění přicházejícími z Dálného východu. Na druhé straně to, co považujeme za odklon od snahy o racionální vysvětlení přírodních jevů, může být způsobeno selháním striktně kvantitativního přístupu u velmi složitých systémů. Racionální přístup je často ztotožňován s přístupem čistě kvantitativním. Že tomu tak vždy být nemusí, ukazuje popis přírodních jevů pomocí fuzzy logiky a fuzzy množin.