(Ne)chemické toulky chemickým prostorem
| 1. 11. 2021Zkusme si představit všechny chemické látky, které by bylo možno připravit, od vodíku až po makromolekuly včetně nukleových kyselin a bílkovin. Kolik by jich mohlo být? Veškeré pokusy o odhad velikosti množiny všech možných chemických látek, takzvaného chemického prostoru, velmi rychle přecházejí do astronomických čísel…
Pro zjednodušení se budeme držet jen menších molekul, které jsou z farmakologického hlediska obzvláště zajímavé pro svoji zvýšenou šanci prostupovat do organismu při perorálním užití, a není tedy třeba je aplikovat injekčně. Odhad počtu takových malých molekul se pohybuje kolem 1060 [1]. Vezmeme-li v potaz stávající odhady, že pozorovatelný vesmír sestává z přibližně 1080 atomů [2], pak by pro přípravu použitelného vzorku od každé malé molekuly nebylo v našem vesmíru zdaleka dost hmoty.
Vzhledem k velikosti chemického prostoru tedy není příliš efektivní jím jen tak tápat, připravovat chemické látky zcela namátkově, testovat je na všechny možné způsoby a doufat, že časem narazíme na něco užitečného. Určení směru, kterým se v chemickém prostoru vydat pro látky s požadovanými vlastnostmi, se opírá o znalosti už známých látek a jejich experimentálně naměřených vlastností. Látky mající alespoň některé z požadovaných vlastností, od už zmíněné perorální dostupnosti až po schopnost vázat se na konkrétní protein v lidských buňkách, tzv. farmakologický cíl, často bývají i vhodným výchozím bodem pro další výzkum. Rozhodování, jaké konkrétní nové látky připravit, je komplexní proces, ve kterém hrají nemalou roli i praktické zkušenosti a intuice jednotlivých výzkumníků. V rozhodování jim v rostoucí míře napomáhají výpočetní metody, jejichž prostřednictvím lze chemický prostor systematicky uspořádávat, mapovat a vytipovávat v něm zajímavé oblasti.
Mapa chemického světa
Intuitivní způsob vizualizace chemického prostoru spočívá v rozmístění látek jako bodů v klasickém souřadnicovém systému. Na jednotlivých osách mohou být libovolné vyčíslitelné vlastnosti látek. Můžeme například začít molární hmotností, kterou umístíme na první osu, a seřadíme tak všechny možné látky do jedné přímky. Když budeme pokračovat a přidáme druhou osu s další z mnoha možných vlastností, například rozdělovací koeficient oktanol/voda, vyjadřující poměr lipofilie a hydrofilie dané látky, rozdělí se nám látky do dvourozměrného prostoru. Do třetí osy dejme třeba molární refraktivitu látek, vyjadřující jejich polarizovatelnost vnějším elektrickým polem, a máme už látky jako body v klasickém trojrozměrném prostoru (obr. 1). Stejně snadno můžeme přidat čtvrtou, pátou…, n-tou osu ke každé z nepřeberného množství možných vyčíslitelných vlastností látek, od zmíněných fyzikálně-chemických vlastností až po experimentální data, jako naměřená biologická aktivita na specifické farmakologické cíle. Vznikne nám tak mnohorozměrný prostor, ve kterém se vyskytují v různých rozměrech shluky látek různého rozsahu i hustoty, podobně jako hvězdy v pozorovatelném vesmíru tvoří kompaktní hvězdokupy i rozlehlé galaxie.
Látky v chemickém prostoru lze zároveň pospojovat podle jejich vzájemných asociací (např. reaktant–produkt, strukturní podobnosti apod.), a dát tak jednotlivým látkám i jejich shlukům další kontext.
Látky v úzkém shluku na základě svých podobných strukturních a fyzikálně-chemických vlastností mají zvýšenou šanci mít i podobnou biologickou aktivitu na daný farmakologický cíl. Tato souvislost strukturních vlastností látek s jejich biologickou aktivitou je jádrem konceptu známého v cheminformatice jako „Structure-Activity Relationship“ (SAR). Téměř každý cheminformatický model si lze představit jako způsob pro odhad neznámých vlastností látek na základě jejich známých souřadnic anebo asociací v chemickém prostoru. Modelem vytvořený odhad je možno obratem vynést jako novou osu a následně jej použít pro filtrování látek, jejich vizualizaci nebo dokonce přímo jako vstup do dalších modelů.