i

Aktuální číslo:

2025/7

Téma měsíce:

Umění

Obálka čísla

(Ne)chemické toulky chemickým prostorem

 |  1. 11. 2021
 |  Vesmír 100, 672, 2021/11
 |  Téma: Velká data

Zkusme si představit všechny chemické látky, které by bylo možno připravit, od vodíku až po makromolekuly včetně nukleových kyselin a bílkovin. Kolik by jich mohlo být? Veškeré pokusy o odhad velikosti množiny všech možných chemických látek, takzvaného chemického prostoru, velmi rychle přecházejí do astronomických čísel…

Pro zjednodušení se budeme držet jen menších molekul, které jsou z farmakologického hlediska obzvláště zajímavé pro svoji zvýšenou šanci prostupovat do organismu při perorálním užití, a není tedy třeba je aplikovat injekčně. Odhad počtu takových malých molekul se pohybuje kolem 1060 [1]. Vezmeme-li v potaz stávající odhady, že pozorovatelný vesmír sestává z přibližně 1080 atomů [2], pak by pro přípravu použitelného vzorku od každé malé molekuly nebylo v našem vesmíru zdaleka dost hmoty.

Vzhledem k velikosti chemického prostoru tedy není příliš efektivní jím jen tak tápat, připravovat chemické látky zcela namátkově, testovat je na všechny možné způsoby a doufat, že časem narazíme na něco užitečného. Určení směru, kterým se v chemickém prostoru vydat pro látky s požadovanými vlastnostmi, se opírá o znalosti už známých látek a jejich experimentálně naměřených vlastností. Látky mající alespoň některé z požadovaných vlastností, od už zmíněné perorální dostupnosti až po schopnost vázat se na konkrétní protein v lidských buňkách, tzv. farmakologický cíl, často bývají i vhodným výchozím bodem pro další výzkum. Rozhodování, jaké konkrétní nové látky připravit, je komplexní proces, ve kterém hrají nemalou roli i praktické zkušenosti a intuice jednotlivých výzkumníků. V rozhodování jim v rostoucí míře napomáhají výpočetní metody, jejichž prostřednictvím lze chemický prostor systematicky uspořádávat, mapovat a vytipovávat v něm zajímavé oblasti.

Mapa chemického světa

Intuitivní způsob vizualizace chemického prostoru spočívá v rozmístění látek jako bodů v klasickém souřadnicovém systému. Na jednotlivých osách mohou být libovolné vyčíslitelné vlastnosti látek. Můžeme například začít molární hmotností, kterou umístíme na první osu, a seřadíme tak všechny možné látky do jedné přímky. Když budeme pokračovat a přidáme druhou osu s další z mnoha možných vlastností, například rozdělovací koeficient oktanol/voda, vyjadřující poměr lipofilie a hydrofilie dané látky, rozdělí se nám látky do dvourozměrného prostoru. Do třetí osy dejme třeba molární refraktivitu látek, vyjadřující jejich polarizovatelnost vnějším elektrickým polem, a máme už látky jako body v klasickém trojrozměrném prostoru (obr. 1). Stejně snadno můžeme přidat čtvrtou, pátou…, n-tou osu ke každé z nepřeberného množství možných vyčíslitelných vlastností látek, od zmíněných fyzikálně-chemických vlastností až po experimentální data, jako naměřená biologická aktivita na specifické farmakologické cíle. Vznikne nám tak mnohorozměrný prostor, ve kterém se vyskytují v různých rozměrech shluky látek různého rozsahu i hustoty, podobně jako hvězdy v pozorovatelném vesmíru tvoří kompaktní hvězdokupy i rozlehlé galaxie.

Látky v chemickém prostoru lze zároveň pospojovat podle jejich vzájemných asociací (např. reaktant–produkt, strukturní podobnosti apod.), a dát tak jednotlivým látkám i jejich shlukům další kontext.

Látky v úzkém shluku na základě svých podobných strukturních a fyzikálně-chemických vlastností mají zvýšenou šanci mít i podobnou biologickou aktivitu na daný farmakologický cíl. Tato souvislost strukturních vlastností látek s jejich biologickou aktivitou je jádrem konceptu známého v cheminformatice jako „Structure-Activity Relationship“ (SAR). Téměř každý cheminformatický model si lze představit jako způsob pro odhad neznámých vlastností látek na základě jejich známých souřadnic anebo asociací v chemickém prostoru. Modelem vytvořený odhad je možno obratem vynést jako novou osu a následně jej použít pro filtrování látek, jejich vizualizaci nebo dokonce přímo jako vstup do dalších modelů.

Nyní vidíte 22 % článku. Co dál:

Jsem předplatitel, mám plný přístup
Jsem návštěvník
Chci si přečíst celé číslo
Předplatným pomůžete zajistit budoucnost Vesmíru. Více o předplatném
TÉMA MĚSÍCE: Velká data
OBORY A KLÍČOVÁ SLOVA: Chemie

O autorech

Ivan Čmelo

Daniel Svozil

Další články k tématu

I geografie má velká datakomerce

Práce s rozsáhlými soubory dat patří ke geografii odnepaměti. Čím podrobněji se snažíme popsat svět kolem nás, tím více dat musíme vytvořit, a to...

Digitální ekosystémuzamčeno

Tušíme, že veškerá naše interakce s digitálním světem je „někde“ zaznamenávána a že „nějaká“ umělá inteligence z těchto záznamů určuje, jaké...

Datová revoluce v biologiiuzamčeno

„Všechny modely jsou špatné (ale některé jsou užitečné),“ napsal statistik George Box v roce 1979. Narážel na fakt, že pouze modely, od...

Divoká plavba mořem dat

Jak velká jsou velká data? Najít jednoznačnou odpověď na podobné otázky není snadné; soudci posuzující, zda množství zadržených drog je „větší než...

Doporučujeme

Věstonická superstar

Věstonická superstar video

Soška tělnaté ženy z ústředního tábořiště lovců mamutů u dnešních Dolních Věstonic pod Pálavou je jistě nejznámějším archeologickým nálezem...
K čemu je umění?

K čemu je umění? uzamčeno

Petr Tureček  |  7. 7. 2025
Výstižná teorie lidské evoluce by měla nabídnout vysvětlení, proč trávíme tolik času zdánlivě zbytečnými činnostmi. Proč, jako například lvi,...
Paradoxní příběh paradoxu obezity

Paradoxní příběh paradoxu obezity uzamčeno

Petr Sucharda  |  7. 7. 2025
Obezita představuje jednu z nejzávažnějších civilizačních chorob, jejíž důsledky zasahují do téměř všech oblastí lidského zdraví. Její definice...