Aktuální číslo:

Arabidopsis má „přečtený“ bibliom

| 9. 9. 2010

| Vesmír 89, 507, 2010/9

Dnešní biolog tráví podstatnou část pracovní doby u počítače, a to nejenom kvůli návykovosti webu a e‑mailu. S dostupností genomických expresních dat se u modelových organismů počítá jako se samozřejmou věcí. Neustále se objevují nové databáze. Martin Krallinger s kolegy připravil nástroj (PLAN2L, Plant Anotation to Literature – viz zope.bioinfo.cnio.es/plan2l/plan2l.html), který usiluje o shrnutí znalostí o jednotlivých genech a jimi kódovaných proteinech huseníčku Thalova (Arabidopsis thaliana), tak jak jsou sepsány ve vědeckých článcích. Vyhledávání tedy nenabídne prostý souhrn článků, ve kterých se zadané klíčové slovo vyskytuje, ale rovnou i automatizovaný výběr vět, které nejvíce vypovídají o proteinových interakcích, lokalizaci, související regulaci genové exprese a mnoha dalších vlastnostech.

Relevanci výsledků nechť posoudí každý sám, mně se nezdá vůbec špatná. Lze jistě očekávat jak zlepšování „pokrytí“ této databáze, tak vznik bibliomů nových. Strohost a rigidnost psané vědecké komunikace se možná stává důležitou výhodou. Sestaví někdo v zájmu ještě snazšího strojového zpracování i seznam povolených slov a obratů?