Zaplňujeme mezery v lidském genomu
| 5. 5. 2025Před více než dvaceti lety byl přečten první lidský genom. Byl to náročný a ambiciózní projekt, který přinesl mnohá překvapení – třeba zjištění, že lidských genů je něco přes dvacet tisíc, nikoli sto tisíc, jak se u tak „komplexního“ organismu, jako je člověk, předpokládalo. (I kukuřice má více genů než my.)
Lidský genom ale pořád nebyl kompletní. Proto Karen Miga a Adam Phillippy v roce 2019 založili konsorcium T2T (Telomere-to-Telomere) s oprávněnou nadějí, že technologie a algoritmy již pokročily natolik, aby bylo možno přečíst všech 23 chromozomů opravdu od telomery po telomeru, neboli od jednoho konce chromozomu k druhému. Pro svůj záměr nadchli desítky vědců z celého světa a na jaře 2022 ohlásili přečtení zbývajících 8 % lidské DNA [1].
Co se v ní skrývalo? Především rozsáhlé oblasti s repetitivními sekvencemi. I přesto ale tyto části obsahovaly důležité oblasti. Příkladem jsou centromery nezbytné pro správné rozdělení chromozomů při buněčném dělení (3 % lidské DNA), telomery chránící konce chromozomů či části akrocentrických chromozomů (s asymetricky umístěnou centromerou, tj. chromozomy 13, 14, 15, 21, 22), které se mohou účastnit translokací – přeskládání vedoucí někdy až k změně počtu chromozomů. Dlouhé repetitivní sekvence DNA (satelitní DNA) na akrocentrických chromozomech jsou zase důvodem, proč se tyto části DNA z analýz typicky vynechávají; u mnoha medicínských aplikací se navíc dodnes používá stará verze lidského genomu hg19 z roku 2009.
Posledním zcela přečteným chromozomem se stal Y [2], který se dědí z otce na syna. To je mimo jiné důvod, proč lze v kulturách, v nichž se po mužské linii dědí i příjmení, na základě Y s určitou pravděpodobností přiřadit k příjmení i konkrétní variantu tohoto chromozomu, anebo proč lze na základě Y zjistit, z jaké geografické oblasti nejspíše pocházeli předci z mužské linie.
Chromozom Y obsahuje obrovské palindromy, které se čtou stejně z obou stran. Navíc tyto palindromy obsahují silně variabilní počet genů z několika genových rodin, jejichž smazání může způsobit neplodnost. Druhá půlka chromozomu Y, která odolávala přečtení, zase obsahuje mozaiku dvou střídajících se druhů satelitní DNA, opět ve velmi variabilní délce. Vzhledem k tomu, že s věkem a u určitých druhů rakovin část buněk tento chromozom úplně ztratí (s negativními důsledky pro zdraví), můžeme spekulovat o tom, jestli právě miliony repetitivních písmen DNA nemají ochrannou funkci. U klasických studií, v nichž hledáme varianty genů spojené s konkrétními chorobami a porovnáváme je s genovou výbavou zdravých jedinců, jsou pohlavní chromozomy často kvůli zjednodušení z analýzy vyloučeny. Genetické faktory podmiňující vznik některých chorob nám proto dosud unikaly.
Výzkum dnes směřuje k tomu, aby bylo možné rutinně sekvenovat opravdu kompletní genomy. Každý z nás by tak mohl mít jako součást své zdravotní dokumentace k dispozici kompletní sekvenci všech 46 chromozomů. Místo testů na konkrétní genetické predispozice nebo panely genů by tak stačilo kdykoli v databázi vyhledat a prozkoumat tu část genomu, která lékaře zrovna zajímá, a to včetně těch nejrepetitivnějších.
[1] Nurk S. et al.: Science, 2022, DOI: 10.1126/science.abj6987
[2] Rhie A. et al.: Nature, 2023, DOI: 10.1038/s41586-023-06457-y
Ke stažení
článek ve formátu pdf [605,14 kB]
O autorovi
Monika Čechová
Monika Čechová, Ph.D., (*1987) vystudovala aplikovanou informatiku a bioinformatiku na Fakultě informatiky Masarykovy univerzity (FI MU) a poté pokračovala studiem biologie na Penn State, USA. Nyní se na FI MU zaměřuje na bioinformatiku kompletních genomů a dědičnost repetitivních částí DNA.
