Výpočty pomocou nukleových kyselín
Už i školák vie, že výpočty majú rôznu zložitosť. Sčítanie považujeme za jednoduchšie ako násobenie. Príčina je v tom, že násobenie vyžaduje viac námahy než sčítanie. Presnejšie, na vynásobenie dvoch n-ciferných čísiel potrebujeme približne n2 krokov (elementárnych operácií), kdežto sčítanie ich vyžaduje iba ~ n. Všetko sa dá sformulovať oveľa precíznejšie. Namiesto školáka alebo bežného počítača odborníci používajú idealizovaný počítač, ktorý vymyslel už pred vyše 60 rokmi Alan Turing. Tento počítač je tvorený, v tej najjednoduchšej forme, jednou dlhou páskou rozdelenou na políčka a hlavicou. Na každom políčku pásky je zapísaný nejaký symbol. V jednom kroku dokáže hlavica prečítať symbol z políčka, na ktorom je nastavená, prepísať ho na iný a posunúť sa o jedno políčko doprava alebo doľava. Dôležité je, že na tomto tzv. Turingovom stroji je možné robiť tie isté výpočty, ako povedzme na najnovšom počítači značky Cray. Výpočtovú zložitosť teraz môžeme formalizovať ako počet krokov, ktoré musí urobiť Turingov stroj na výpočet daného problému. Už spomínané sčítanie a násobenie patrí do tzv. P-triedy výpočtovej zložitosti, ktorá je charakteristická tým, že počet krokov N potrebných na výpočet daného problému je daný ako polynóm od parametra veľkosti vstupu n (keďže nás zaujímajú “veľké vstupy″, stačí sa obmedziť na najvyššiu mocninu tohto polynómu)
N ~ nr,
kde r je konštanta. Do P-triedy patrí okrem násobenia a sčítania aj násobenie dvoch n × n matíc, pre ktoré platí
N ~ n3 ,
a tisíce ďalších výpočtových problémov. Existujú však i problémy zložitejšie. Uvažujme napr. známy problém obchodného cestujúceho, ktorý má za úlohu navštíviť n miest, tak aby jeho cesta bola najkratšia možná. Najjednoduchším spôsobom riešenia takejto úlohy je nájsť všetky možné cesty, spočítať ich dĺžku a zistiť, ktorá z nich je najkratšia. Problém je však v tom, že počet možných ciest je rovný počtu všetkých permutácií n miest, ktorých je n!. Takže počet krokov, ktoré vyžaduje riešenie úlohy týmto spôsobom, je
N ~ n! rovná se přibližně nn .
Toto je samozrejme tá najhoršia metóda, ako riešiť problém obchodného cestujúceho. Existujú aj lepšie prístupy, ale vždy je počet krokov exponenciálne veľký, napr. približne 2n. Problémy tohto typu patria do tzv. NP-triedy výpočtovej zložitosti. Vráťme se ešte na chvíľu k násobeniu. Školácky algoritmus vyžaduje na riešenie n2 krokov. V 60. rokoch sa podarilo prekvapivo Karacubovi objaviť algoritmus, ktorý vyžaduje iba n1,6 krokov, a dokonca Schönhage ukázal, že na jeho strojoch (trochu odlišných od Turingových) násobenie je rovnako zložité ako sčítanie a vyžaduje n elementárnych operácií. Vzniká teda otázka, či sa raz nepodarí objaviť polynomiálny algoritmus na riešenie problému obchodného cestujúceho. Radi by sme na túto otázku odpovedali, je to však snáď najväčší otvorený problém teoretickej informatiky. Väčšina odborníkov je presvedčená, že je to nemožné a že problém obchodného cestujúceho, ako i celú triedu tzv. NP-úplných problémov nebude nikdy možné riešiť polynomiálnymi algoritmami. Na ilustráciu porovnajme n2 polynomiálny algoritmus a 2n exponenciálny algoritmus. Nech pre n=10 potrebujú obidva na rozriešenie problému 1s, potom na rozriešenie problému s n = 100 potrebuje prvý 100 s, avšak druhý až 1014 rokov. (Pozn. red.: Vek vesmíru je odhadovaný rádovo na 1010 roků.) Vzhľadom k tomu, že do NP-triedy patria mnohé dôležité problémy, každý efektívny algoritmus ich riešenia vyvolá mimoriadny záujem. Rovnako to bolo i s prácou Leonarda M. Adlemana uverejnenou koncom minulého roku (Science 266, 1021 – 1024, 1995). Adleman je známy počítačový teoretik z Kalifornskej univerzity v Los Angeles a preto boli mnohí prekvapení, že sa v jeho práci objavujú fotografie výsledkov gelovej elektroforézy, experimentálne protokoly a podobné veci, ktoré sa bežne vyskytujú v prácach venovaných napr. klonovaniu DNA, a snáď si v prvom momente mysleli, že i v takom prestížnom časopise môže úradovať “tlačiarenský škriatok″. Nie je to však pravda. Adleman navrhol nový spôsob riešenia NP-úplných výpočtových problémov pomocou genetických manipulácií. Svoju metódu ilustroval riešením problému “hľadania hamiltonovskej cesty v orientovanom grafe″. Študovaný graf je na obrázku, a ako vidíme, skladá sa z vrcholov pospájaných hranami, na ktorých je zadaná šípkou ich orientácia. Pre orientovaný graf so vstupným vrcholom vin a výstupným vrcholom vout existuje hamiltonovská cesta vtedy, ak existuje postupnosť vrcholov a hrán, ktorá spája vstupný a výstupný vrchol, pričom každý vrchol je v nej práve raz. Na obrázku s vin = 0 a vout = 6 je to postupnosť 0→1→2→3→4→5→6. V prípade takéhoto jednoduchého grafu je samozrejme ľahké rozhodnúť, či má hamiltonovskú cestu. Pre väčšie grafy je to však problém značne zložitejší a vyžaduje exponenciálny počet krokov.
Adlemanov postup možno zosumarizovať do 4 bodov:
- Vygenerovať náhodnú cestu grafom.
- O cestách, ktoré nezačínajú vo vin a nekončia vo vout, ďalej neuvažovať.
- Ak má graf n-vrcholov, uvažovať iba o cestách, ktoré prechádzajú presne n-vrcholmi, a to každým vrcholom práve raz.
- Ak nejaká cesta zvýšila, potom hamiltonovská cesta existuje, v opačnom prípade nie.
Adleman každému vrcholu i v grafe priradil oligomér Oi nukleovej kyseliny o dĺžke 20 nukleotidov, pričom ich postupnosť bola vybraná náhodne (pretože máme 4 druhy nukleotidov, počet možností je 420, a je teda málo pravdepodobné, aby rôzne vrcholy mali podobné sekvencie). Pre každú hranu i,j grafu bol nasyntetizovaný oligonukleotid Oi,j spôsobom, ktorý je zrejmý z nasledovnej schémy
V prípade i=0 a i=6 (vstupný a výstupný vrchol cesty) boli ako O0,i a Oi,6 použité priamo O0 a O6. Takáto konštrukcia zachováva orientáciu hrán (Oi,j sa nerovná Oj,i). Oligomér komplementárny (v zmysle Watsona a Cricka) ku Oi si označíme ako Oki. A teraz môžeme prejsť k popisu vlastných experimentov (detailný popis je v citovanom článku). Pre každý vrchol v grafe (okrem vstupného a výstupného) a pre každú hranu bolo navzájom zmiešaných 50 pmol Oki a 50 pmol Oi,j. Oki oligonukleotidy slúžili ako svorky, ktoré spojili dohromady oligonukleotidy patriace susedným hranám. Takže ligačná reakcia viedla ku vzniku DNA molekúl, ktoré kódovali cesty grafom. V ďalšom kroku bola použitá polymerázová reťazová reakcia (PCR), kde ako priméry boli použité oligonukleotidy O0 a Ok6 (podrobnosti PCR metódy sú v článku Š. Vilčeka, Vesmír 69, 309, 1990/6).
Takýmto spôsobom boli “namnožené″ cesty, ktoré začínali vo vrchole 0 a končili vo vrchole 6. Grafy, ktoré obsahovali práve 7 vrcholov, boli izolované pomocou elektroforézy, kde boli identifikované ako pás zodpovedajúci 140 párom nukleotidov. Na izoláciu ciest grafom, ktoré prechádzali každým vrcholom práve raz, bol použitý systém magnetických guličiek s naviazanými oligonukleotidmi Ok1 až Ok5. Reťazce DNA boli denaturáciou najprv navzájom rozdelené a potom sa postupne izolovali jednoreťazcové polynukleotidy, ktoré obsahovali aspoň jeden vrchol č. 1, v ďalšom kroku aspoň jeden vrchol č. 2 atď., až po vrchol č. 5. Ako výsledok sa získali nukeové kyseliny, ktoré kódovali hamiltonovskú cestu grafom. Sekvenovaním danej nukleovej kyseliny sa následne získala aj postupnosť vrcholov. Kľúčovým princípom úžasnej efektívnosti danej metódy je enormný paralelizmus ligačnej reakcie, veď počas prvého kroku prebehlo 1014 ligácií. Tento počet môže byť použitím mikromolárnych množstiev zvýšený až na 1020. Na porovnanie, bežné počítače pracujú rýchlosťou 106 operácií za sekundu a najrýchlejšie superpočítače rýchlosťou 1012 operácií za sekundu. Naviac, v DNA je informácia odpovedajúca 1 bitu uložená v objeme 1 nm3, kým napr. vo videokazetách 1 bit zodpovedá 1012 nm3. Metóda sa môže na prvý pohľad zdať dosť kuriózna, takou však zo začiatku bola aj metóda simulovaného žíhania navrhnutá V. Černým pred 12 rokmi na základe analógií so štatistickou fyzikou, ktorá je dnes jedným z najmocnejších nástrojov na riešenie zložitých optimalizačných problémov. Ďalšie rozvinutie Adlemanovho prístupu, s využitím aj iných enzymatických reakcií, ktoré sa zúčastňujú transkripcie, translácie a ďalších procesov, súvisiacich so spracovaním nukleových kyselín v bunke, možno povedie k tomu, že počítač budúcnosti bude tvorený nukleovou kyselinou a enzýmami, ktoré spracovávajú informáciu v nej zakódovanú.
Aby sme boli verní odkazu J. A. Komenského, ktorý chcel, aby učenie bolo hrou, dovoľujeme si na záver zadať čitateľovi úlohu: “Navrhnite spôsob riešenia problému obchodného cestujúceho pomocou Adlemanovej metódy.″
Citát
IRVING LANGMUIR /1881-1957/, americký fyzik
Objevy nemůžete naplánovat. Ale můžete naplánovat práci, která pravděpodobně k objevům povede.
Metoda PCR
DNA je vzácný materiál. Úhrnná délka molekul DNA jediného lidského organizmu sice odpovídá zhruba vzdálenosti ze Země ke Slunci, dáme-li ji ale “na hromádku″, je jí stále ještě tak málo, že není vidět. S nedostatkem DNA se molekulární biologové v laboratořích potýkali vlastně neustále – až do doby, než začala být šířeji využívána metoda zvaná dnes familiárně písíár (PCR = polymerase chain reaction = polymerázová řetězová reakce). Umožňuje ve velmi krátké době (řádově dny) vyrobit téměř neomezené množství DNA. Pozoruhodné na tom je i to, že vlastně vůbec ani nemusíme mít tušení o pořadí nukleotidů v konkrétní molekule DNA. Úplně postačí znát jen kratičký úsek asi 20 – 30 bází. I co do množství výchozího materiálu je metoda velmi “skromná″. Je možné vyrobit velké množství kopií i jen několika málo, nebo dokonce jediné molekuly. Byla to vlastně až PCR, která umožnila výzkum fosilní DNA, která se zachová obvykle jen v mizivém množství.
Princip je zhruba následující. Podle známého krátkého úseku DNA (oligonukleotidu) nasyntetizujeme jeho komplementární kopii – po jednotlivých nukleotidech “poskládáme″ fragment molekuly DNA (tzv. primer). Molekulu DNA, kterou chceme “množit″, nejprve teplem denaturujeme, tzn. oddělíme od sebe komplementární řetězce dvoušroubovice a přidáme primer, který se naváže na příslušné místo jednoho z řetězců původní molekuly podle principu komplementarity bází (AT, CG, TA, GC). Poté přidáme do směsi Taq-polymerázu, která v místě, kde končí primer, začne dosyntetizovávat chybějící komplementární řetězec.(Taq-polymeráza, izolovaná původně z termofilních bakterií, se používá z důvodů její tepelné stability. Enzym je aktivní i při teplotách okolo 90 °C, které panují při denaturaci DNA.) Z jedné molekuly DNA tedy vznikly dvě. Proces se opakuje tak dlouho, dokud nemáme požadované množství DNA. Dnes již cyklus denaturace – vazba primerů – syntéza provádějí některé přístroje zcela automaticky. Jak je snad zřejmé, výroba kopií postupuje geometrickou řadou.