Martin Kravec. MCMC algoritmus na rekonštrukciu duplikačných histórií. Master thesis, Comenius University in Bratislava, 2011. Supervised by Tomáš Vinař.
Download preprint: 11kravecth.pdf, 1364Kb
Download from publisher: not available
Related web page: not available
Bibliography entry: BibTeX
Abstract:
V bunkách živých organizmov sa nachádza DNA, ktorá je nosicom genetickej informácie. Ak máme DNA sekvencie súcasných druhov, zaujímavou úlohou je predikcia ancestrálnej DNA sekvencie. Za predpokladu, že v rámci evolúcie uvažujeme iba proces jednoduchých mutácií, t.j. substitúcií jedného znaku za iný, je rekonštrukcia ancestrálnych sekvencií pomerne jednoduchá. Situácia sa komplikuje, ak zacneme uvažovat zložitejšie operácie väcšieho rozsahu, duplikácie. V tejto práci zavedieme pravdepodobnostný model evolúcie duplikovaných úsekov DNA (génových zhlukov) a inferenciu vzorkovaním za pomoci MCMC algoritmu. Ukážeme algoritmus na výpocet vierohodnosti histórií, ale najmä predstavíme nový algoritmus pre navrhovanie jednotlivých duplikácií pomocou dynamického programovania a stochastického spätného prechodu. Predbežné výsledky ukazujú, že implementácia tohoto algoritmu umožnuje rýchle MCMC vzorkovanie a získanie kvalitných výsledkov pri aplikácii tejto metódy na reálne dáta.