i

Aktuální číslo:

2024/4

Téma měsíce:

Obaly

Obálka čísla

(Ne)chemické toulky chemickým prostorem

 |  1. 11. 2021
 |  Vesmír 100, 672, 2021/11
 |  Téma: Velká data

Zkusme si představit všechny chemické látky, které by bylo možno připravit, od vodíku až po makromolekuly včetně nukleových kyselin a bílkovin. Kolik by jich mohlo být? Veškeré pokusy o odhad velikosti množiny všech možných chemických látek, takzvaného chemického prostoru, velmi rychle přecházejí do astronomických čísel…

Pro zjednodušení se budeme držet jen menších molekul, které jsou z farmakologického hlediska obzvláště zajímavé pro svoji zvýšenou šanci prostupovat do organismu při perorálním užití, a není tedy třeba je aplikovat injekčně. Odhad počtu takových malých molekul se pohybuje kolem 1060 [1]. Vezmeme-li v potaz stávající odhady, že pozorovatelný vesmír sestává z přibližně 1080 atomů [2], pak by pro přípravu použitelného vzorku od každé malé molekuly nebylo v našem vesmíru zdaleka dost hmoty.

Vzhledem k velikosti chemického prostoru tedy není příliš efektivní jím jen tak tápat, připravovat chemické látky zcela namátkově, testovat je na všechny možné způsoby a doufat, že časem narazíme na něco užitečného. Určení směru, kterým se v chemickém prostoru vydat pro látky s požadovanými vlastnostmi, se opírá o znalosti už známých látek a jejich experimentálně naměřených vlastností. Látky mající alespoň některé z požadovaných vlastností, od už zmíněné perorální dostupnosti až po schopnost vázat se na konkrétní protein v lidských buňkách, tzv. farmakologický cíl, často bývají i vhodným výchozím bodem pro další výzkum. Rozhodování, jaké konkrétní nové látky připravit, je komplexní proces, ve kterém hrají nemalou roli i praktické zkušenosti a intuice jednotlivých výzkumníků. V rozhodování jim v rostoucí míře napomáhají výpočetní metody, jejichž prostřednictvím lze chemický prostor systematicky uspořádávat, mapovat a vytipovávat v něm zajímavé oblasti.

Mapa chemického světa

Intuitivní způsob vizualizace chemického prostoru spočívá v rozmístění látek jako bodů v klasickém souřadnicovém systému. Na jednotlivých osách mohou být libovolné vyčíslitelné vlastnosti látek. Můžeme například začít molární hmotností, kterou umístíme na první osu, a seřadíme tak všechny možné látky do jedné přímky. Když budeme pokračovat a přidáme druhou osu s další z mnoha možných vlastností, například rozdělovací koeficient oktanol/voda, vyjadřující poměr lipofilie a hydrofilie dané látky, rozdělí se nám látky do dvourozměrného prostoru. Do třetí osy dejme třeba molární refraktivitu látek, vyjadřující jejich polarizovatelnost vnějším elektrickým polem, a máme už látky jako body v klasickém trojrozměrném prostoru (obr. 1). Stejně snadno můžeme přidat čtvrtou, pátou…, n-tou osu ke každé z nepřeberného množství možných vyčíslitelných vlastností látek, od zmíněných fyzikálně-chemických vlastností až po experimentální data, jako naměřená biologická aktivita na specifické farmakologické cíle. Vznikne nám tak mnohorozměrný prostor, ve kterém se vyskytují v různých rozměrech shluky látek různého rozsahu i hustoty, podobně jako hvězdy v pozorovatelném vesmíru tvoří kompaktní hvězdokupy i rozlehlé galaxie.

Látky v chemickém prostoru lze zároveň pospojovat podle jejich vzájemných asociací (např. reaktant–produkt, strukturní podobnosti apod.), a dát tak jednotlivým látkám i jejich shlukům další kontext.

Látky v úzkém shluku na základě svých podobných strukturních a fyzikálně-chemických vlastností mají zvýšenou šanci mít i podobnou biologickou aktivitu na daný farmakologický cíl. Tato souvislost strukturních vlastností látek s jejich biologickou aktivitou je jádrem konceptu známého v cheminformatice jako „Structure-Activity Relationship“ (SAR). Téměř každý cheminformatický model si lze představit jako způsob pro odhad neznámých vlastností látek na základě jejich známých souřadnic anebo asociací v chemickém prostoru. Modelem vytvořený odhad je možno obratem vynést jako novou osu a následně jej použít pro filtrování látek, jejich vizualizaci nebo dokonce přímo jako vstup do dalších modelů.

Nyní vidíte 22 % článku. Co dál:

Jsem předplatitel, mám plný přístup
Jsem návštěvník
Chci si přečíst celé číslo
Předplatným pomůžete zajistit budoucnost Vesmíru. Více o předplatném
TÉMA MĚSÍCE: Velká data
OBORY A KLÍČOVÁ SLOVA: Chemie

O autorech

Ivan Čmelo

Daniel Svozil

Další články k tématu

I geografie má velká datakomerce

Práce s rozsáhlými soubory dat patří ke geografii odnepaměti. Čím podrobněji se snažíme popsat svět kolem nás, tím více dat musíme vytvořit, a to...

Digitální ekosystémuzamčeno

Tušíme, že veškerá naše interakce s digitálním světem je „někde“ zaznamenávána a že „nějaká“ umělá inteligence z těchto záznamů určuje, jaké...

Datová revoluce v biologiiuzamčeno

„Všechny modely jsou špatné (ale některé jsou užitečné),“ napsal statistik George Box v roce 1979. Narážel na fakt, že pouze modely, od...

Divoká plavba mořem dat

Jak velká jsou velká data? Najít jednoznačnou odpověď na podobné otázky není snadné; soudci posuzující, zda množství zadržených drog je „větší než...

Doporučujeme

Přírodovědec v ekosystému vědní politiky

Přírodovědec v ekosystému vědní politiky uzamčeno

Josef Tuček  |  2. 4. 2024
Petr Baldrian vede Grantovou agenturu ČR – nejvýznamnější domácí instituci podporující základní výzkum s ročním rozpočtem 4,6 miliardy korun. Za...
Od krytí k uzavření rány

Od krytí k uzavření rány

Peter Gál, Robert Zajíček  |  2. 4. 2024
Popáleniny jsou v některých částech světa až třetí nejčastější příčinou neúmyslného zranění a úmrtí u malých dětí. Život výrazně ohrožují...
Česká seismologie na poloostrově Reykjanes

Česká seismologie na poloostrově Reykjanes

Jana Doubravová, Jakub Klicpera  |  2. 4. 2024
Island přitahuje návštěvníky nejen svou krásnou přírodou, ale také množstvím geologických zajímavostí, jako jsou horké prameny, gejzíry a aktivní...