Arabidopsis má „přečtený“ bibliom
| 9. 9. 2010Dnešní biolog tráví podstatnou část pracovní doby u počítače, a to nejenom kvůli návykovosti webu a e‑mailu. S dostupností genomických expresních dat se u modelových organismů počítá jako se samozřejmou věcí. Neustále se objevují nové databáze. Martin Krallinger s kolegy připravil nástroj (PLAN2L, Plant Anotation to Literature – viz zope.bioinfo.cnio.es/plan2l/plan2l.html), který usiluje o shrnutí znalostí o jednotlivých genech a jimi kódovaných proteinech huseníčku Thalova (Arabidopsis thaliana), tak jak jsou sepsány ve vědeckých článcích. Vyhledávání tedy nenabídne prostý souhrn článků, ve kterých se zadané klíčové slovo vyskytuje, ale rovnou i automatizovaný výběr vět, které nejvíce vypovídají o proteinových interakcích, lokalizaci, související regulaci genové exprese a mnoha dalších vlastnostech.
Relevanci výsledků nechť posoudí každý sám, mně se nezdá vůbec špatná. Lze jistě očekávat jak zlepšování „pokrytí“ této databáze, tak vznik bibliomů nových. Strohost a rigidnost psané vědecké komunikace se možná stává důležitou výhodou. Sestaví někdo v zájmu ještě snazšího strojového zpracování i seznam povolených slov a obratů?
Ke stažení
- článek ve formátu pdf [512,6 kB]