Martin Kravec. MCMC algoritmus na rekonštrukciu duplikačných histórií. Master thesis, Comenius University in Bratislava, 2011. Supervised by Tomáš Vinař.

Download preprint: 11kravecth.pdf, 1364Kb

Download from publisher: not available

Related web page: not available

Bibliography entry: BibTeX

Abstract:

V bunkách živých organizmov sa nachádza DNA,
ktorá je nosicom genetickej informácie.
Ak máme DNA sekvencie súcasných druhov,
zaujímavou úlohou je predikcia ancestrálnej DNA sekvencie.
Za predpokladu, že v rámci evolúcie uvažujeme
iba proces jednoduchých mutácií,
t.j. substitúcií jedného znaku za iný,
je rekonštrukcia ancestrálnych sekvencií pomerne jednoduchá.
Situácia sa komplikuje, ak zacneme uvažovat
zložitejšie operácie väcšieho rozsahu, duplikácie.
V tejto práci zavedieme pravdepodobnostný model
evolúcie duplikovaných úsekov DNA (génových zhlukov)
a inferenciu vzorkovaním za pomoci MCMC algoritmu.
Ukážeme algoritmus na výpocet vierohodnosti histórií,
ale najmä predstavíme nový algoritmus
pre navrhovanie jednotlivých duplikácií
pomocou dynamického programovania
a stochastického spätného prechodu.
Predbežné výsledky ukazujú, že implementácia tohoto algoritmu
umožnuje rýchle MCMC vzorkovanie
a získanie kvalitných výsledkov
pri aplikácii tejto metódy na reálne dáta.