Peter Kováč. Implementácia externých zdrojov dát v hľadaní génov. Bachelor thesis, Comenius University in Bratislava, 2010. Supervised by Broňa Brejová.
Download preprint: 10kovacth.pdf, 1558Kb
Download from publisher: http://stella.uniba.sk/zkp-storage/dzb/dostupne/FM/2010/2010-FM-wOWBUf/
Related web page: http://compbio.fmph.uniba.sk/exonhunter/
Bibliography entry: BibTeX
Abstract:
Hľadanie (predikcia) génov v DNA sekvenciách je jedným zo základných problémov bioinformatiky. Problém sa často rieši Viterbiho algoritmom na skrytých Markovových modeloch (HMM). Pri hľadaní génov sa využívajú aj externé dáta - EST sekvencie, proteínové sekvencie, zarovnania viacerých DNA sekvencií a iné. Program ExonHunter okrem HMM obsahuje aj mechanizmus na spraco- vanie externých dát. Pôvodné implementácie zahrnutia EST a proteínových sekvencií do predikcie nevyhovovali kvôli dlhému času spracovania. Programy zodpovedajúce za spracovanie sme preto vymenili za potenciálne rýchlejšie. Upravený program sme testovali na DNA sekvenciách mušky Drosophila melanogaster. V prípade EST sekvencií sa nám podarilo dosiahnuť zlepšenie času za cenu mierneho zhoršenia presnosti predikcie. V prípade proteínových sekvencií sme zlepšili aj čas aj presnosť. Porovnanie s inými programami ukázalo, že ExonHunter je dobrý hlavne pri predikciách s využitím externých informácií.