Andrej Ridzik. Použitie komparatívnej informácie pri hľadaní génov. Bachelor thesis, Comenius University in Bratislava, 2011. Supervised by Broňa Brejová.
Download preprint: 11ridzikth.pdf, 1064Kb
Download from publisher: not available
Related web page: not available
Bibliography entry: BibTeX
Abstract:
Jedným zo základných problémov bioinformatiky je hľadanie (predikcia) génov v DNA sekvenciách. Tento problém je bežne riešený Viterbiho algoritmom na skrytých Markovových modeloch (HMM). Pri hľadaní génov sa často využívajú aj externé dáta - EST sekvencie, proteínové sekvencie, viacnásobné zarovnania DNA sekvencií a iné, ktoré môžu pri predikcii výrazne pomôcť. Program ExonHunter okrem implementácie HMM obsahuje aj mechanizmus na spracovanie externých dát. Pôvodné implementácie nevyužívali možnosť využitia informácie z viacnásobných celogenómových zarovnaní, ktoré sme sa rozhodli do programu ExonHunter doplniť. Upravený program s modulom, ktorý zabezpečuje využitie informácie zo zarovnaní, sme testovali na sade DNA sekvencií octovej mušky Drosophila melanogaster. Z dôvodu použitia jednoduchej skórovacej matice sa nám nepodarilo zaznamenať zlepšenie presnosti predikcie testovaných sekvencií. Predpokladáme však, že s použitím lepších matíc vytváraných známymi postupmi z literatúry dôjde k zlepšeniu presnosti a náš modul bude v budúcnosti slúžiť ako užitočná súčasť programu na hľadanie génov - ExonHunter.