Andrej Ridzik. Použitie komparatívnej informácie pri hľadaní génov. Bachelor thesis, Comenius University in Bratislava, 2011. Supervised by Broňa Brejová.

Download preprint: 11ridzikth.pdf, 1064Kb

Download from publisher: not available

Related web page: not available

Bibliography entry: BibTeX

Abstract:

Jedným zo základných problémov bioinformatiky je hľadanie (predikcia)
génov v DNA sekvenciách. Tento problém je bežne riešený Viterbiho
algoritmom na skrytých Markovových modeloch (HMM). Pri hľadaní génov
sa často využívajú aj externé dáta - EST sekvencie, proteínové
sekvencie, viacnásobné zarovnania DNA sekvencií a iné, ktoré môžu
pri predikcii výrazne pomôcť. Program ExonHunter okrem implementácie
HMM obsahuje aj mechanizmus na spracovanie externých dát. Pôvodné
implementácie nevyužívali možnosť využitia informácie z viacnásobných
celogenómových zarovnaní, ktoré sme sa rozhodli do programu
ExonHunter doplniť. Upravený program s modulom, ktorý zabezpečuje
využitie informácie zo zarovnaní, sme testovali na sade DNA sekvencií
octovej mušky Drosophila melanogaster. Z dôvodu použitia jednoduchej
skórovacej matice sa nám nepodarilo zaznamenať zlepšenie presnosti
predikcie testovaných sekvencií. Predpokladáme však, že s použitím
lepších matíc vytváraných známymi postupmi z literatúry dôjde
k zlepšeniu presnosti a náš modul bude v budúcnosti slúžiť
ako užitočná súčasť programu na hľadanie génov - ExonHunter.