i

Aktuální číslo:

2021/11

Téma měsíce:

Velká data

(Ne)chemické toulky chemickým prostorem

 |  1. 11. 2021
 |  Vesmír 100, 672, 2021/11
 |  Téma: Velká data

Zkusme si představit všechny chemické látky, které by bylo možno připravit, od vodíku až po makromolekuly včetně nukleových kyselin a bílkovin. Kolik by jich mohlo být? Veškeré pokusy o odhad velikosti množiny všech možných chemických látek, takzvaného chemického prostoru, velmi rychle přecházejí do astronomických čísel…

Pro zjednodušení se budeme držet jen menších molekul, které jsou z farmakologického hlediska obzvláště zajímavé pro svoji zvýšenou šanci prostupovat do organismu při perorálním užití, a není tedy třeba je aplikovat injekčně. Odhad počtu takových malých molekul se pohybuje kolem 1060 [1]. Vezmeme-li v potaz stávající odhady, že pozorovatelný vesmír sestává z přibližně 1080 atomů [2], pak by pro přípravu použitelného vzorku od každé malé molekuly nebylo v našem vesmíru zdaleka dost hmoty.

Vzhledem k velikosti chemického prostoru tedy není příliš efektivní jím jen tak tápat, připravovat chemické látky zcela namátkově, testovat je na všechny možné způsoby a doufat, že časem narazíme na něco užitečného. Určení směru, kterým se v chemickém prostoru vydat pro látky s požadovanými vlastnostmi, se opírá o znalosti už známých látek a jejich experimentálně naměřených vlastností. Látky mající alespoň některé z požadovaných vlastností, od už zmíněné perorální dostupnosti až po schopnost vázat se na konkrétní protein v lidských buňkách, tzv. farmakologický cíl, často bývají i vhodným výchozím bodem pro další výzkum. Rozhodování, jaké konkrétní nové látky připravit, je komplexní proces, ve kterém hrají nemalou roli i praktické zkušenosti a intuice jednotlivých výzkumníků. V rozhodování jim v rostoucí míře napomáhají výpočetní metody, jejichž prostřednictvím lze chemický prostor systematicky uspořádávat, mapovat a vytipovávat v něm zajímavé oblasti.

Mapa chemického světa

Intuitivní způsob vizualizace chemického prostoru spočívá v rozmístění látek jako bodů v klasickém souřadnicovém systému. Na jednotlivých osách mohou být libovolné vyčíslitelné vlastnosti látek. Můžeme například začít molární hmotností, kterou umístíme na první osu, a seřadíme tak všechny možné látky do jedné přímky. Když budeme pokračovat a přidáme druhou osu s další z mnoha možných vlastností, například rozdělovací koeficient oktanol/voda, vyjadřující poměr lipofilie a hydrofilie dané látky, rozdělí se nám látky do dvourozměrného prostoru. Do třetí osy dejme třeba molární refraktivitu látek, vyjadřující jejich polarizovatelnost vnějším elektrickým polem, a máme už látky jako body v klasickém trojrozměrném prostoru (obr. 1). Stejně snadno můžeme přidat čtvrtou, pátou…, n-tou osu ke každé z nepřeberného množství možných vyčíslitelných vlastností látek, od zmíněných fyzikálně-chemických vlastností až po experimentální data, jako naměřená biologická aktivita na specifické farmakologické cíle. Vznikne nám tak mnohorozměrný prostor, ve kterém se vyskytují v různých rozměrech shluky látek různého rozsahu i hustoty, podobně jako hvězdy v pozorovatelném vesmíru tvoří kompaktní hvězdokupy i rozlehlé galaxie.

Látky v chemickém prostoru lze zároveň pospojovat podle jejich vzájemných asociací (např. reaktant–produkt, strukturní podobnosti apod.), a dát tak jednotlivým látkám i jejich shlukům další kontext.

Látky v úzkém shluku na základě svých podobných strukturních a fyzikálně-chemických vlastností mají zvýšenou šanci mít i podobnou biologickou aktivitu na daný farmakologický cíl. Tato souvislost strukturních vlastností látek s jejich biologickou aktivitou je jádrem konceptu známého v cheminformatice jako „Structure-Activity Relationship“ (SAR). Téměř každý cheminformatický model si lze představit jako způsob pro odhad neznámých vlastností látek na základě jejich známých souřadnic anebo asociací v chemickém prostoru. Modelem vytvořený odhad je možno obratem vynést jako novou osu a následně jej použít pro filtrování látek, jejich vizualizaci nebo dokonce přímo jako vstup do dalších modelů.

Nyní vidíte 22 % článku. Co dál:

Jsem předplatitel, mám plný přístup
Jsem návštěvník
Chci si přečíst celé číslo
Předplatným pomůžete zajistit budoucnost Vesmíru. Více o předplatném
TÉMA MĚSÍCE: Velká data
OBORY A KLÍČOVÁ SLOVA: Chemie

O autorech

Ivan Čmelo

Daniel Svozil

Další články k tématu

I geografie má velká datakomerce

Práce s rozsáhlými soubory dat patří ke geografii odnepaměti. Čím podrobněji se snažíme popsat svět kolem nás, tím více dat musíme vytvořit, a to...

Digitální ekosystémuzamčeno

Tušíme, že veškerá naše interakce s digitálním světem je „někde“ zaznamenávána a že „nějaká“ umělá inteligence z těchto záznamů určuje, jaké...

Datová revoluce v biologiiuzamčeno

„Všechny modely jsou špatné (ale některé jsou užitečné),“ napsal statistik George Box v roce 1979. Narážel na fakt, že pouze modely, od...

Divoká plavba mořem dat

Jak velká jsou velká data? Najít jednoznačnou odpověď na podobné otázky není snadné; soudci posuzující, zda množství zadržených drog je „větší než...

Doporučujeme

Xenoboti se začali rozmnožovat, poradila jim umělá inteligence

Xenoboti se začali rozmnožovat, poradila jim umělá inteligence audio

Jaroslav Petr  |  4. 12. 2021
Vědci z Vermontské, Tuftsovy a Harvardovy univerzity objevili novou formu biologické reprodukce a vytvořili sebereplikující se živé roboty. Tyto...
Skleníkové peklo na Venuši a šance na život

Skleníkové peklo na Venuši a šance na život

Julie Nováková, Martin Ferus  |  1. 11. 2021
Byla Venuše už od svého zrození horkým peklem? Co když ještě donedávna překypovala životem a z modrého, Zemi podobného drahokamu ji ve žhnoucí pec...
Předpovíme osud?

Předpovíme osud? uzamčeno

Evoluce genomu vedoucí ke vzniku výhodných znaků je z velké části ovlivňována náhodnými procesy. Má však určitá omezení, díky kterým je do jisté...

Předplatným pomůžete zajistit budoucnost Vesmíru

Tištěná i elektronická
verze časopisu
Digitální archiv
od roku 1994
Speciální nabídka
pro školy a studenty

 

Objednat předplatné