Aktuální číslo:

2024/6

Téma měsíce:

Éčka

Obálka čísla

Knihovník budoucnosti – úředník, nebo autor?

Kdo neovládne svět metadat, bude smeten!
 |  5. 11. 2000
 |  Vesmír 79, 614, 2000/11

Jaká bude role knihovníků v budoucnosti, kdy všechny informace budou přístupné v počítačových sítích a knihovny se přetvoří na virtuální organizace, které budou dle potřeby spontánně vznikat a zase mizet? Změní se i role knihovníků spolu s tím, jak se již dnes veřejné knihovny přetvářejí na veřejná informační střediska a národní knihovny jsou nahrazovány distribuovanými soubory digitalizovaných dat? Stanou se knihovníci pouhými vrátnými či operátory u počítačů, nebo zaujmou tvořivější roli pracovníků přímo se účastnících autorského procesu?

 

Nový řád

Vznik velkokapacitních paměťových médií a pronikavý rozvoj počítačových sítí vytvářejí pro knihovníky paradoxní situaci. Technický pokrok zjednodušuje přístup k nesrovnatelně většímu objemu informací než dříve, avšak tradiční role knihovníků jako tvůrců sbírek knih, katalogizátorů a dodavatelů surových informací beznadějně zastarává. Problém je podobný tomu, jemuž budou čelit učitelé. I jejich role se změní: ze zprostředkovatelů předem daných znalostí se stanou průvodci nekonečným zdrojem informací.

 

Knihovníci již nebudou pouhými strážci a konzervátory knižních fondů. Staré knihy přestanou být vyhledávány kvůli obsahu a místo toho budou ceněny jen jako artefakty. Jejich obsah bude přístupný online. V dravém, převážně anglicky mluvícím světě webu se konverze národních literatur do digitální formy přístupné online stane jedinou možnou cestou k zachování národní identity a jazyka.

Lidé se při hledání konkrétních odpovědí budou stále méně obracet na knihovny a knihovníky; sami si je najdou na síti. S využitím inteligentních vyhledávacích mechanizmů a dotazovacích jazyků budou lidé při vyhledávání informací stále méně potřebovat pomoc a nebudou ani vědět, ani se starat o to, která virtuální knihovna obsahuje odpovědi na jejich otázky či kde se potřebné informace fyzicky nacházejí. Distribuované datové soubory se soubornými indexy či univerzálními dotazovacími rozhraními, které budou přístupné online, vytvoří dojem knihovny jako fyzického fondu, ad hoc uspořádané pro co nejpohodlnější přístup k požadovaným informacím.

 

Jaká je nová role knihoven?

Už dávno byly knihovny nuceny vzdát se záměru vlastnit úplný soubor lidských znalostí. Web však paradoxně právě toto umožňuje. Pořizování fyzických kopií každé publikace, o níž se knihovník domníval, že by mohla být užitečná pro jeho čtenáře, ztratí jakýkoli smysl. Také již nebude zapotřebí více exemplářů jednotlivých publikací; jediný originál bude stačit všem uživatelům webu, kteří si budou moci kdykoli v případě potřeby vytvořit svou vlastní lokální kopii.

 

Kdo tento originální exemplář vlastní a udržuje? A kde? Co vlastně bude „knižní“, či spíše „informační“ fond? Nebudou-li fondy vázány fyzickými parametry, stanou se možná tematickými a to, co je bude charakterizovat, nebudou pouze vztahy, ale přidaná hodnota zvyšující jejich užitečnost jako informačního zdroje. Jenže přidaná hodnota nejvíc poroste ne z bezprostřední intelektuální práce spojené se získáváním a tříděním nových informací případ od případu, ale jako nepřímá aktivita spojená s vytvářením pravidel – algoritmů – řídících automaticky a autonomně samovytvářející a samoudržující se fondy. Objem dostupných informací ani nic jiného nepřipouští.

Udržování online digitální knihovny je velice odlišné od běžné papírové knihovny. Bude vyžadovat jen minimální dovednosti operátora počítače (jako práce typu pravidelného kopírování informací z jednoho paměťového média nebo systému do média či systému další generace) v harmonogramu daném technologií dostupnou na trhu, nikoli knihovnickými principy.

Jestliže veřejné knihovny přetrvají spíše kvůli sociálním důvodům než pro zajištění přístupu k informacím budou knihovníci redukováni na jakýsi druh recepčních, lidskou tvář uvádějící uživatele spíše do internetové kavárny než do knihovny, jak ji známe nyní? Tato role by mohla být potřebná, avšak pro méně kvalifikované pracovníky, než jsou knihovníci. Nebo veřejné knihovny zcela zmizí a budou nahrazeny jen další funkcí dostupnou na portálu webu?

 

Jaká tedy bude role knihovníků?

 

Jsou knihovníci, jak je známe dnes, druhem odsouzeným k záhubě? To záleží na tom, v čem vidíte současnou roli knihovníka.

Knihovník coby správce fyzických fondů, ať již určených k prezenčnímu studiu nebo k výpůjčkám, nemá před sebou dlouhodobou budoucnost, protože ji nemají ani fondy.

Knihovník coby katalogizátor fondů rovněž nemá dlouhotrvající budoucnost, protože fondy budoucnosti nebudou jen sebekatalogizující, ale též sebevytvářející. Konec konců, knihovníkům by mohlo zůstat jen jediné rozhodování, a to co z fondu vyřadit. To se však neslučuje s tradicí knihovníka jako konzervátora.

Knihovník coby pomocník při formulování dotazů či průvodce webem možná budoucnost má, ovšem na jak dlouho a v jaké formě? Až se zdokonalí vyhledávací stroje a dotazovací jazyky, bude pomoc specialisty méně potřebná. Také se zdá nepravděpodobné, že by lidé osobně navštěvovali fyzického průvodce virtuálními zdroji. Místo toho budou očekávat, že zmíněný pomocník průvodce bude také přístupný online, tudíž by knihovník mohl být nahrazen méně kvalifikovaným zaměstnancem vzdáleného webového centra.

Bylo by zajímavé spekulovat o časovém horizontu, ve kterém zmíněné funkce zmizí. Pro knihovníky je však podstatné to, že technologické i jiné faktory určující rychlost těchto změn prostě nemohou sami ovlivnit.

Opravdu nová intelektuální role pro knihovníky budoucnosti je vytvářet a udržovat nově koncipovaná metadata. Katalogizování a udržování fondů vždy přinášelo tvorbu jednoduchých metadat, jako jsou třeba prosté kartičky v papírovém katalogu nebo jejich současný počítačový ekvivalent, např. záznamy typu Dublin core. Již taková jednoduchá metadata, jestliže jsou připojena k elektronické publikaci, dávají fondu vlastnost sebekatalogizace. Metadata vytvářená společně s dokumentem a řídící jeho další automatizované zpracování z velké části, nebo dokonce zcela odstraní nutnost dalších lidských zásahů do vytváření informačních fondů.

Ať tak nebo tak, současný vývoj webu ukazuje, že význam metadat v blízké budoucnosti enormně vzroste. Abychom pochopili proč a jaké to přinese nové intelektuální výzvy, musíme porozumět současnému stavu obsahu webu, zejména tomu, co je na webu špatné a co se pro vyřešení toho problému dělá.

Každý, kdo užíval síťové vyhledávače, se brzy setkal s obecným problémem: získal na zadaný dotaz příliš mnoho irelevantních odpovědí, i když podíl indexovaných stránek představuje pouze 20 % webu. S exponenciálně narůstajícím rozsahem sítě budou mít tyto primitivní techniky v budoucnosti stále menší úspěšnost, i když vyhledávací stroje jsou v současnosti přecejen užitečné a velmi populární. Klíčem k vyhledávání relevantních informací je možnost formulovat velmi kvalitní dotazy, což ovšem vyžaduje strukturované informace, které web dosud postrádá. „Najdi X v Y, pokud je Z“ je otázka vyšší kvality než pouhé „Najdi X“, což je většinou vše, co je v současnosti možné.

Jazyk užívaný k zápisu webových stránek, HTML (HyperText Markup Language), nemá způsob jak identifikovat prvky, které vytvářejí strukturu uvnitř dokumentu, a má jen velice primitivní možnosti použití metadat na úrovni celého dokumentu. Z mnoha důvodů trpí jazyk HTML řadou dalších problémů, které vedly k tomu, že tento jazyk není zcela jednotný, mnohdy je navíc špatně používán, což vytváří problémy při dalším zpracování informací nacházejících se v síti.

Jako krok kupředu se jeví náhrada HTML novým jazykem nazvaným XML (eXtended Markup Language). XML umožňuje strukturování dokumentů do libovolné hloubky složitosti, přesto však systematicky, což umožňuje jejich jednoduché zpracování. Technicky vzato, XML není skutečný jazyk, ale metajazyk, tedy soubor pravidel popisujících jak vytvořit strukturovaný jazyk. Pravidla XML jsou velice jednoduchá, a tím i pružná při vytváření libovolných nových jazyků založených na principech XML. Stejně jako HTML je odvozen od ISO SGML (Standard Generalised Markup Language), který je používán v typografii již více než deset let.

XML není pouze jednodušší než SGML, ale překvapivě je také mnohem mocnějším nástrojem. SGML si kladl za cíl vyjít vstříc všem možným požadavkům typografů, a tak skončil jako příliš složitý a omezeně použitelný mimo oblast typografie, pro niž byl vytvořen. Výsledkem bylo, že XML, ačkoliv funguje teprve dva roky, už zcela zastínil SGML, který zastaral.

Zde se objevuje jedna z možností budoucího uplatnění knihovníků. Struktura předpokládá taxonomii, tedy pojmenování částí. Prvky struktury musí být pojmenovány tak, aby se na ně mohlo odkazovat jak při výměně informací, tak při formulaci dotazů. Takové taxonomické jednotky – pojmenované prvky a jejich struktury či namespaces, jak jsou nazývány ve webovské hantýrce – musí být definovány. Pro určité oblasti už bylo definováno mnoho pojmenovaných prvků, vytvářejících popisné jazyky, které ve svém názvu obvykle obsahují slovo „markup“, tedy „popisný“, například Human Resources Markup Language, což je jméno jednoho zhruba ze sta již existujících jazyků. Bouřlivě se rozvíjely především popisné jazyky pro potřeby finančního sektoru a oblasti elektronického obchodu (e-commerce).

Lze sice definovat dohodnuté pojmenované prvky pro informační výměnu mezi organizacemi spolupracujícími v daném oboru, ale žádná struktura prvků nebude schopna obsáhnout vše. Dokonce nikdy ani nebude možno se o to pokusit, protože by to ohrozilo efektivnost zpracování informací a možnost udržovat patřičné soubory. Jedním ze základních principů webu je zachovat možnost distribuovaného vývoje. Proto vně specifických organizovaných seskupení přinese budoucnost velké množství různorodých struktur s pojmenovanými prvky, mezi nimiž bude nutno vytvořit rozhraní pro informační výměnu, pro něž bude zapotřebí nového lingvisty, překladatele struktur pojmenovaných prvků.

Tam, kde není možné jednoznačně přiřadit prvky jedné struktury prvkům struktury druhé, se musí vytvořit pravidla pro zpracování informací obsažených v určitém prvku při převodu z jedné struktury do druhé. Toto je v zásadě lingvistický a sémantický problém, nikoli programátorský, tedy problém z oblasti knihovníkům vlastní, byť ve zcela netradičním kontextu.

 

Základní význam metadat

V publikacích je běžně soustřeďována pozornost na možnosti jazyka XML při vytváření a popisu struktur, avšak skutečným strategickým významem XML není stuktura, ale metadata. Jednoduchá, téměř nepoužitelná metadata v HTML budou nahrazena schématem RDF (Resource Description Framework), které je samo zapsáno v XML. Podobně jako XML představuje i RDF soubor pravidel, která však popisují informační zdroje, jimiž může být cokoliv, počínaje jediným slovem až po celý informační fond, ať již lokální nebo vzdálený. To umožní zachytit metadata v mnohem větší kvantitě a kvalitě, než bylo kdy předtím možné.

 

Přinejmenším to tak začalo. Mimořádná pružnost RDF se nakonec ukázala být mnohem mocnějším nástrojem, než si kdy její tvůrci pomysleli. Kromě toho, že RDF umožňuje vytvářet kvalitnější metadata, která by informace popsala přesněji a umožnila formulovat kvalitnější dotazy, jeho hlavním přínosem je, že jím lze definovat zpracování informace a sémantickou úroveň informací. Metadata zpracování informací, která popisují jak s informacemi nakládat, ocenili zejména představitelé elektronického obchodu, zatímco metadata sémantické úrovně by měla potěšit knihovníky, neboť v jejich existenci leží i jejich budoucnost.

Klást dokonalejší dotazy je pouze jedním z cílů XML. Důležitějším cílem je přeměna ze strojem čitelného webu na stroji srozumitelný web, tedy vytvořit to, čemu tvůrce webu Tim Berners-Lee říkal sémantický (významový) web. To bude možné uskutečnit novým druhem metadat – sémantickými informacemi – popisujícím ne to, co data jsou nebo jak je zpracovávat, ale také co znamenají. Záměrem sémantického webu je umožnit automatizované logické myšlení. Pro zlepšení relevance výsledků vrácených běžnými vyhledávacími stroji nerozhoduje, zda je logické myšlení užíváno a priori nebo nepřímo. Podstatné je, že rozsáhlý informační prostor, který web představuje, se stane zpracovatelným, nikoli jen přístupným.

Představte si tu obrovskou intelektuální výzvu. Bude nutno vytvořit nepřeberné množství sémantických metadat, popisujících význam věcí v termínech srozumitelných stroji. Jde o nový soubor řídicích činností velmi vysoké úrovně. Nebude však zahrnovat pouze výběr a souhrn existujících sémantických tvrzení (zobecněnou formou dřívějších věcných hesel a klíčových slov), ale i vytváření nových, která dosud neexistují, nebo náhradu jiných, která jsou nedostačně přesná. Čím blíže k originálnímu autorskému procesu budou metadata vytvářena, tím lepší bude kvalita těchto sémantických informací.

V tom bude pravděpodobně spočívat nová smysluplná role knihovníka – místo toho aby byl jen vzdáleným příjemcem ukončené práce ostatních, stane se stínovým autorem odpovědným za vytváření nových typů metadat jako součásti původního tvůrčího procesu. Psaní nových sémantických tvrzení (věcného popisu), která jsou využívána jinými sice za zanedbatelnou úplatu, ale často, by se mohla stát možnou cestou k výdělku na živobytí. „Kolikrát jsi citován, tolikrát jsi člověkem“ by tak mohlo dostat zcela nový význam!

Zamysleme se nyní nad samotným jazykem. Smysl dokumentu spočívá v kombinaci textu a významu používané řeči. Věk elektronických médií všech druhů a kultura mládeže doprovázejí překotné změny ve slovníku a smyslu jazyka v čase, což snad není nikde evidentnější než v globální angličtině. Sledování a registrování těchto lingvistických změn v metadatech sémantické úrovně je nejen další intelektuální výzvou pro knihovníka budoucnosti, ale i životní nezbytností pro informační fondy přístupné online. Bez toho by nebyly fondy pro další generace použitelné. To je příklad, jak může být k informaci přidána hodnota souběžnou intelektuální aktivitou, při které se vytvářejí metadata jak na specifické, tak na obecné úrovni.

Další prostor pro aktivitu ideálně vyhovující zkušenostem knihovníků představuje časový kontext. Média mají snahu zkracovat popisy událostí i veřejných vystoupení a podtrhovat v nich aktuální prvky. Časový kontext bude proto pro pochopení historických událostí životně důležitý. Vyjadřování politika by mohlo být nesrozumitelné bez znalosti kontextu událostí, na které reaguje, či opozičních politiků, které kritizuje. S tím souvisí další typ nepřímé intelektuální aktivity přidávající hodnotu k informacím, a to stanovení kontextu definováním vztahů na sémantické úrovni mezi dokumenty nebo mezi jednotlivými prvky uvnitř dokumentu.

Věcný popis (sémantické výroky), lingvistický smysl a časový kontext, to všechno budou metadata braná v úvahu při formulaci dotazů vysoké kvality nebo při stanovování relevance odpovědí. Dokončení následujícího kroku ve vývoji webu bude požadovat obrovskou a dlouhodobou intelektuální aktivitu. To je úplně nová profesní příležitost a knihovníci mají skvělou možnost ji uchopit. Když nechytí šanci za pačesy, pak jsou jejich vyhlídky opravdu neradostné.

 

Příležitost pro statečné knihovníky?

 

Role knihovníka bude velmi odlišná, protože jiná bude i knihovna. Přicházející změny jsou hnány pokrokem techniky a budou mimo kontrolu knihovníků. Nové sémantické úrovně aktivit, které se stanou jejich perspektivní rolí, tu ještě nejsou, ale naštěstí zatím neexistují ani sebevytvářející online knihovny, kvůli nimž budou tradiční role knihovníků nepotřebné. Jak online knihovny, tak knihovníci jsou závislí na té samé věci, na metadatech. Je proto dobrý důvod doufat v relativně bezbolestný přerod. Říká se, že čas změn je čas příležitostí. Příležitosti pro statečné a přizpůsobivé knihovníky, které by zvyšovaly jejich cenu, jsou zajisté velké. Knihovníci se buď musí chopit nového světa metadat a ovládnout jej, nebo jím budou smeteni. 1)

Poznámky

1) Z angličtiny přeložil Antonín Vítek

Citát

Jean-Jacques Salomon: Technologický úděl

Nakl. Filosofia, Praha 1997, s. 251

Nejrafinovanější a nejtvrdší technologie nezmohly nic proti společenským hnutím, která jsou předmětem nejměkčích věd.

Ke stažení

OBORY A KLÍČOVÁ SLOVA: Počítače, internet

O autorovi

Andrew Hardie

Eur. Ing., C. Eng. Andrew Hardie (*1950) absolvoval r. 1972 King’s College v Londýně. Několik let se zabýval systémy řízení průmyslu, standardy pro Ethernet, TCP/IP, SGML a SCSI. Psáno pro Vesmír. (e-mail: ash@cellar.demon.co.uk).

Doporučujeme

Genová terapie ALS: jsme na začátku naděje

Genová terapie ALS: jsme na začátku naděje

Je to krutá a zatím nevyléčitelná nemoc. Amyotrofická laterální skleróza. Americká léková agentura FDA však nedávno schválila pro medicínskou...
(Ne)umělá sladidla

(Ne)umělá sladidla uzamčeno

Adam Obr  |  3. 6. 2024
Když loni v létě zařadilo WHO aspartam na seznam látek, které mají potenciál způsobovat rakovinu, dosáhla diskuse o škodlivosti nekalorických...
Příběhy řasových éček

Příběhy řasových éček

Richard Lhotský  |  3. 6. 2024
Přídatné látky v potravinách, familiárně přezdívané pro svůj kód éčka, vzbuzují u řady lidí obavy a strach. Přesto se mezi nimi najdou i látky...