Siemens2025Siemens2025Siemens2025Siemens2025Siemens2025Siemens2025

Aktuální číslo:

2025/11

Téma měsíce:

Vlny

Obálka čísla

214 000 000

 |  5. 9. 2022
 |  Vesmír 101, 516, 2022/9

Tolik proteinových struktur bylo publikováno na konci července 2022 [1] ve volně přístupné internetové databázi AlphaFold Protein Structure Database [2]. Jedná se o 3D modely proteinových struktur téměř všech známých genů, které kódují nějaký protein. Struktury předpověděl program AlphaFold – algoritmus založený na hlubokém učení [3], který vyvinula firma DeepMind (vlastněná Googlem podobně jako společnost Alphabet) ve spolupráci s evropským institutem EMBL-EBI.

AlphaFold zazářil na konci roku 2020, kdy se stal šampionem v testu podobně založených programů (CASP14). Tím se oficiálně podařilo dříve nemyslitelné – předpovídat proteinové struktury jen na základě sekvence aminokyselin. Predikce se obejde bez drahé a zdlouhavé purifikace a krystalografie proteinů. AlphaFold předpovídá tvary proteinů často s přesností srovnatelnou s experimentálními metodami (údajně má tuto kvalitu 35 % z celkového počtu nyní dostupných modelů) a navíc umí jistotu jednotlivých částí proteinového modelu ohodnotit.

Od roku 2020 AlphaFold postupně procházel databázi proteinových sekvencí UniProt a počítal jeden model za druhým. Až prošel téměř všechny známé sekvence proteinů ze všech možných organismů. Proteinové struktury jsou nyní volně k dispozici. Samotný algoritmus jeho tvůrci poskytli také volně, takže počítat může každý i bez drahého vybavení (např. pomocí Google Colab [4] nebo balíčku gget [5]). A to včetně těch, kteří pomýšlejí na případné komerční využití výsledků.

I přes čerstvé úspěchy má AlphaFold nedostatky v predikci změny struktury způsobené mutacemi nebo interakcí více proteinů. Zatím také není jasné, zda dokáže dostatečně detailně předpovědět místa, na něž se vážou malé molekuly, což může omezit využitelnost algoritmu v objevování nových léčiv. I tak je ale zřejmé, že nastala další éra proteomiky, kdy jsou popisovány celé nové proteinové rodiny. Dostupnost takového množství dat umožňuje například hledat průmyslově využitelné enzymy na základě podobnosti. Snadné generování struktur jistě vyžaduje adaptovat se na nastalou situaci a možná změnit styl pokládání některých vědeckých otázek či upravit plánování experimentů. Sofistikované aplikace využívající uvolněná data na sebe určitě nenechají dlouho čekat. Kurátoři databáze navíc slibují její pravidelnou aktualizaci, stejně tak jako zdokonalování (učicího se) algoritmu skrze nové trénovací datasety.

[1] Callaway E.: Nature, 2022, DOI: 10.1038/d41586-022-02083-2.

[2] https://alphafold.com.

[3] Neruda R.: Vesmír 100, 31, 2021/1.

[4] Mirdita M. et al.: Nat. Methods, 2022, DOI: 10.1038/s41592-022-01488-1.

[5] Luebbert L., Pachter L.: bioRxiv (preprint), 2022, DOI: 10.1101/2022.05.17.492392.

Ke stažení

OBORY A KLÍČOVÁ SLOVA: Biochemie, Molekulární biologie
RUBRIKA: Mozaika

O autorovi

Vojtěch Tláskal

Mgr. Vojtěch Tláskal, Ph.D., (*1991) vystudoval obor Mikrobiologie na Přírodovědecké fakultě UK v Praze a pracoval na Mikrobiologickém ústavu AV ČR. V současnosti pokračuje jako postdoktorand v Ústavu půdní biologie a biogeochemie v Biologickém centru AV ČR v Českých Budějovicích. Zabývá se rolí metanotrofních a nitrifikačních bakterií v půdních habitatech.
Tláskal Vojtěch

Doporučujeme

Lidské ucho v počítači

Lidské ucho v počítači uzamčeno

Pavel Jungwirth, Ondřej Ticháček  |  3. 11. 2025
Podle známého výroku Richarda Feynmana člověk něčemu pořádně porozumí, až když to sám sestrojí. A já (Pavel Jungwirth) jsem si z velmi osobních...
Deset let gravitačních vln

Deset let gravitačních vln

Ondřej Zelenka  |  3. 11. 2025
Letos v září jsme oslavili 10 let od první přímé detekce gravitačních vln. Jejich zaznamenáním jsme nejen doplnili další dílek skládačky důkazů...
Horké vlny v měnícím se klimatu

Horké vlny v měnícím se klimatu

Jan Kyselý, Ondřej Lhotka  |  3. 11. 2025
Tent o příspěvek navazuje na článek Horké vlny v měnícím se klimatu: otazníky zůstávají (Vesmír 91, 28, 2012/1) a shrnuje aktuální stav poznatků...