http://compbio.fmph.uniba.sk/vyuka/mbi/index.php?title=CI02&feed=atom&action=history
CI02 - História úprav
2024-03-29T13:05:58Z
História úprav pre túto stránku na wiki
MediaWiki 1.23.3
http://compbio.fmph.uniba.sk/vyuka/mbi/index.php?title=CI02&diff=2781&oldid=prev
Brona: /* Počítanie pokrytia genómov */
2022-09-30T13:40:56Z
<p><span dir="auto"><span class="autocomment">Počítanie pokrytia genómov</span></span></p>
<table class='diff diff-contentalign-left'>
<col class='diff-marker' />
<col class='diff-content' />
<col class='diff-marker' />
<col class='diff-content' />
<tr style='vertical-align: top;'>
<td colspan='2' style="background-color: white; color:black; text-align: center;">← Staršia verzia</td>
<td colspan='2' style="background-color: white; color:black; text-align: center;">Verzia zo dňa a času 13:40, 30. september 2022</td>
</tr><tr><td colspan="2" class="diff-lineno">Riadok 47:</td>
<td colspan="2" class="diff-lineno">Riadok 47:</td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* Pokrytie genómu: predpokladáme, že každé čítanie začína na náhodnej <del class="diffchange diffchange-inline">pozícií </del>zo všetkých možných G</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* Pokrytie genómu: predpokladáme, že každé čítanie začína na náhodnej <ins class="diffchange diffchange-inline">pozícii </ins>zo všetkých možných G</div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>* Takže ak premenná Y_i bude začiatok i-tého čítania, jej rozdelenie bude rovnomerné</div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>* Takže ak premenná Y_i bude začiatok i-tého čítania, jej rozdelenie bude rovnomerné</div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** P(Y_i=1) = P(Y_i=2) = ... = P(Y_i=G) = 1/G</div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** P(Y_i=1) = P(Y_i=2) = ... = P(Y_i=G) = 1/G</div></td></tr>
</table>
Brona
http://compbio.fmph.uniba.sk/vyuka/mbi/index.php?title=CI02&diff=2780&oldid=prev
Brona: /* Počítanie pokrytia genómov */
2022-09-30T13:40:39Z
<p><span dir="auto"><span class="autocomment">Počítanie pokrytia genómov</span></span></p>
<table class='diff diff-contentalign-left'>
<col class='diff-marker' />
<col class='diff-content' />
<col class='diff-marker' />
<col class='diff-content' />
<tr style='vertical-align: top;'>
<td colspan='2' style="background-color: white; color:black; text-align: center;">← Staršia verzia</td>
<td colspan='2' style="background-color: white; color:black; text-align: center;">Verzia zo dňa a času 13:40, 30. september 2022</td>
</tr><tr><td colspan="2" class="diff-lineno">Riadok 35:</td>
<td colspan="2" class="diff-lineno">Riadok 35:</td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>==Počítanie pokrytia genómov==</div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>==Počítanie pokrytia genómov==</div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* Pozrite <del class="diffchange diffchange-inline">tiez </del>grafy k pravdepodobnosti: {{pdf|Ci-coverage}}</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* Pozrite <ins class="diffchange diffchange-inline">tiež </ins>grafy k pravdepodobnosti: {{pdf|Ci-coverage}}</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* <del class="diffchange diffchange-inline">Nas problem</del>: <del class="diffchange diffchange-inline">spocitanie </del>pokrytia</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* <ins class="diffchange diffchange-inline">Náš problém</ins>: <ins class="diffchange diffchange-inline">spočítanie </ins>pokrytia</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** G = <del class="diffchange diffchange-inline">dlzka genomu</del>, napr. 1 000 000 (predpokladajme, že je cirkulárny)</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** G = <ins class="diffchange diffchange-inline">dĺžka genómu</ins>, napr. 1 000 000 (predpokladajme, že je cirkulárny)</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** N = <del class="diffchange diffchange-inline">pocet </del>čítaní (readov), napr. 10 000</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** N = <ins class="diffchange diffchange-inline">počet </ins>čítaní (readov), napr. 10 000</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** L = dlzka <del class="diffchange diffchange-inline">readu</del>, napr. 1000</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** L = dlzka <ins class="diffchange diffchange-inline">čítania</ins>, napr. 1000</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** <del class="diffchange diffchange-inline">Celkova dlzka </del>čítaní NL, pokrytie (coverage) NL/G, v nasom pripade 10x</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** <ins class="diffchange diffchange-inline">Celková dĺžka </ins>čítaní NL, pokrytie (coverage) NL/G, v nasom pripade 10x</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** V priemere <del class="diffchange diffchange-inline">kazda baza pokryta </del>10x</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** V priemere <ins class="diffchange diffchange-inline">každá báza pokrytá </ins>10x</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** <del class="diffchange diffchange-inline">Niektore su </del>ale <del class="diffchange diffchange-inline">pokryte viackrat</del>, <del class="diffchange diffchange-inline">ine </del>menej.</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** <ins class="diffchange diffchange-inline">Niektoré sú </ins>ale <ins class="diffchange diffchange-inline">pokryté viackrát</ins>, <ins class="diffchange diffchange-inline">iné </ins>menej.</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** <del class="diffchange diffchange-inline">Zaujimaju nas otazky </del>typu: <del class="diffchange diffchange-inline">kolko baz ocakavame</del>, <del class="diffchange diffchange-inline">ze </del>bude <del class="diffchange diffchange-inline">pokrytych </del>menej ako 3x?</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** <ins class="diffchange diffchange-inline">Zaujímajú nás otázky </ins>typu: <ins class="diffchange diffchange-inline">koľko báz očakávame</ins>, <ins class="diffchange diffchange-inline">že </ins>bude <ins class="diffchange diffchange-inline">pokrytých </ins>menej ako 3x?</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** <del class="diffchange diffchange-inline">Dolezite </del>pri <del class="diffchange diffchange-inline">planovani </del>experimentov (<del class="diffchange diffchange-inline">ake velke </del>pokrytie potrebujem na dosiahnutie <del class="diffchange diffchange-inline">urcitej </del>kvality)</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** <ins class="diffchange diffchange-inline">Dôležité </ins>pri <ins class="diffchange diffchange-inline">plánovaní </ins>experimentov (<ins class="diffchange diffchange-inline">aké veľké </ins>pokrytie potrebujem na dosiahnutie <ins class="diffchange diffchange-inline">určitej </ins>kvality)</div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* Pokrytie <del class="diffchange diffchange-inline">genomu</del>: <del class="diffchange diffchange-inline">predpokladame</del>, <del class="diffchange diffchange-inline">ze kazde </del>čítanie <del class="diffchange diffchange-inline">zacina </del>na <del class="diffchange diffchange-inline">nahodnej pozicii </del>zo <del class="diffchange diffchange-inline">vsetkych moznych </del>G</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div> </div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* <del class="diffchange diffchange-inline">Takze </del>ak <del class="diffchange diffchange-inline">premenna </del>Y_i bude <del class="diffchange diffchange-inline">zaciatok </del>i-<del class="diffchange diffchange-inline">teho </del>čítania, jej rozdelenie bude <del class="diffchange diffchange-inline">rovnomerne</del></div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* Pokrytie <ins class="diffchange diffchange-inline">genómu</ins>: <ins class="diffchange diffchange-inline">predpokladáme</ins>, <ins class="diffchange diffchange-inline">že každé </ins>čítanie <ins class="diffchange diffchange-inline">začína </ins>na <ins class="diffchange diffchange-inline">náhodnej pozícií </ins>zo <ins class="diffchange diffchange-inline">všetkých možných </ins>G</div></td></tr>
<tr><td colspan="2"> </td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* <ins class="diffchange diffchange-inline">Takže </ins>ak <ins class="diffchange diffchange-inline">premenná </ins>Y_i bude <ins class="diffchange diffchange-inline">začiatok </ins>i-<ins class="diffchange diffchange-inline">tého </ins>čítania, jej rozdelenie bude <ins class="diffchange diffchange-inline">rovnomerné</ins></div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** P(Y_i=1) = P(Y_i=2) = ... = P(Y_i=G) = 1/G</div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** P(Y_i=1) = P(Y_i=2) = ... = P(Y_i=G) = 1/G</div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>* <del class="diffchange diffchange-inline">Aka </del>je <del class="diffchange diffchange-inline">pravdepodobnost ze nejake konkretne </del>i-te čítanie <del class="diffchange diffchange-inline">pokryva konkretnu poziciu </del>j?</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>* <ins class="diffchange diffchange-inline">Aká </ins>je <ins class="diffchange diffchange-inline">pravdepodobnosť že nejaké konkrétne </ins>i-te čítanie <ins class="diffchange diffchange-inline">pokrýva konkrétnu pozíciu </ins>j?</div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** P(Y_i>=j-L+1 and Y_i<=j) = P(Y_i=j-L+1)+...+P(Y_i=j) = L/G, <del class="diffchange diffchange-inline">oznacme tuto </del>hodnotu p, <del class="diffchange diffchange-inline">nasom priklade </del>p=0.001 (1 promile)</div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** P(Y_i>=j-L+1 and Y_i<=j) = P(Y_i=j-L+1)+...+P(Y_i=j) = L/G, <ins class="diffchange diffchange-inline">označme túto </ins>hodnotu p, <ins class="diffchange diffchange-inline">v našom príklade </ins>p=0.001 (1 promile)</div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>* Uvazujme premennu X_j, ktora udava pocet čítaní pokryvajucich poziciu j</div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>* Uvazujme premennu X_j, ktora udava pocet čítaní pokryvajucich poziciu j</div></td></tr>
</table>
Brona
http://compbio.fmph.uniba.sk/vyuka/mbi/index.php?title=CI02&diff=2370&oldid=prev
Brona: /* Počítanie pokrytia genómov */
2020-10-01T11:14:03Z
<p><span dir="auto"><span class="autocomment">Počítanie pokrytia genómov</span></span></p>
<table class='diff diff-contentalign-left'>
<col class='diff-marker' />
<col class='diff-content' />
<col class='diff-marker' />
<col class='diff-content' />
<tr style='vertical-align: top;'>
<td colspan='2' style="background-color: white; color:black; text-align: center;">← Staršia verzia</td>
<td colspan='2' style="background-color: white; color:black; text-align: center;">Verzia zo dňa a času 11:14, 1. október 2020</td>
</tr><tr><td colspan="2" class="diff-lineno">Riadok 73:</td>
<td colspan="2" class="diff-lineno">Riadok 73:</td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** napr pre priklad s troma hodmi kockou P(X_j=2) = 3!/(2!*1!) * (1/4)^2 * (3/4)^1 = 9/64</div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** napr pre priklad s troma hodmi kockou P(X_j=2) = 3!/(2!*1!) * (1/4)^2 * (3/4)^1 = 9/64</div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** Zle sa pocita pre velke N, preto sa niekedy pouziva aproximacia Poissonovym rozdelenim s parametrom lambda = Np, ktore ma <math>P(X_j = k)=e^{-\lambda}\lambda^k / k!</math></div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** Zle sa pocita pre velke N, preto sa niekedy pouziva aproximacia Poissonovym rozdelenim s parametrom lambda = Np, ktore ma <math>P(X_j = k)=e^{-\lambda}\lambda^k / k!</math></div></td></tr>
<tr><td class='diff-marker'>−</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;"><div>** Spat k sekvenovaniu: vieme spocitat rozdelenie pravdepodobnosti a tiez napr. P(X_i<3) = P(X_i=0)+P(X_i=1)+P(X_i=2) = 0.000045+0.00045+0.0023=0.0028 <del class="diffchange diffchange-inline">(</del>v priemere ocakavame 45 baz nepokrytych, 2800 pokrytých menej ako 3 krát<del class="diffchange diffchange-inline">)</del></div></td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div>** Spat k sekvenovaniu: vieme spocitat rozdelenie pravdepodobnosti a tiez napr. P(X_i<3) = P(X_i=0)+P(X_i=1)+P(X_i=2) = 0.000045+0.00045+0.0023=0.0028  </div></td></tr>
<tr><td colspan="2"> </td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div><ins class="diffchange diffchange-inline">* Stredna hodnota poctu baz </ins>v <ins class="diffchange diffchange-inline">celom genome s pokrytim k je G*P(X_i=k)</ins></div></td></tr>
<tr><td colspan="2"> </td><td class='diff-marker'>+</td><td style="color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;"><div><ins class="diffchange diffchange-inline">** V </ins>priemere <ins class="diffchange diffchange-inline">teda </ins>ocakavame 45 baz nepokrytych, 2800 pokrytých menej ako 3 krát <ins class="diffchange diffchange-inline">a pod.</ins></div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** Takyto graf, odhad, vieme lahko spravit pre rozne pocty čítaní a tak naplanovat, kolko čítaní potrebujeme  </div></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"><div>** Takyto graf, odhad, vieme lahko spravit pre rozne pocty čítaní a tak naplanovat, kolko čítaní potrebujeme  </div></td></tr>
<tr><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td><td class='diff-marker'> </td><td style="background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;"></td></tr>
</table>
Brona
http://compbio.fmph.uniba.sk/vyuka/mbi/index.php?title=CI02&diff=2369&oldid=prev
Brona: Vytvorená stránka „==Úvod do pravdepodobnosti== * Myšlienkový experiment, v ktorom vystupuje náhoda, napr. hod ideálnou kockou/mincou * Výsledkom experimentu je nejaká hodnota (napr...“
2020-10-01T10:49:43Z
<p>Vytvorená stránka „==Úvod do pravdepodobnosti== * Myšlienkový experiment, v ktorom vystupuje náhoda, napr. hod ideálnou kockou/mincou * Výsledkom experimentu je nejaká hodnota (napr...“</p>
<p><b>Nová stránka</b></p><div>==Úvod do pravdepodobnosti==<br />
* Myšlienkový experiment, v ktorom vystupuje náhoda, napr. hod ideálnou kockou/mincou<br />
* Výsledkom experimentu je nejaká hodnota (napr. číslo, alebo aj niekoľko čísel, reťazec)<br />
* Túto neznámu hodnotu budeme volať '''náhodná premenná'''<br />
* Zaujíma nás '''pravdepodobnosť''', s akou náhodná premenná nadobúda jednotlivé možné hodnoty<br />
* T.j. ak experiment opakujeme veľa krát, ako často uvidíme nejaký výsledok<br />
<br />
Príklad 1: hodíme idealizovanou kockou, premenná X bude hodnota, ktorú dostaneme<br />
* Možné hodnoty 1,2,..,6, každá rovnako pravdepodobná<br />
* Pišeme napr. Pr(X=2)=1/6<br />
<br />
Príklad 2: hodíme 2x kockou, náhodná premenná X bude súčet hodnôt, ktoré dostaneme<br />
* Možné hodnoty: 2,3,...,12<br />
* Každá dvojica hodnôt (1,1), (1,2),...,(6,6) na kocke rovnako pravdepodobná, t.j. pravdepodobnosť 1/36<br />
* Súčet 5 môžeme dostať 1+4,2+3,3+2,4+1 - t.j. P(X=5) = 4/36<br />
* Súčet 11 môžeme dostať 5+6 alebo 6+5, t.j. P(X=11) = 2/36<br />
* '''Rozdelenie pravdepodobnosti:''' (tabuľka udávajúca pravdepodobnosť pre každú možnú hodnotu) <br />
<pre><br />
hodnota i: 2 3 4 5 6 7 8 9 10 11 12<br />
Pr(X=i): 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36<br />
</pre><br />
* Overte, ze súčet pravdepodobností je 1<br />
<br />
<br />
'''Stredná hodnota E(X):''' <br />
* priemer z možných hodnôt váhovaných ich pravdepodobnosťami<br />
* v našom príklade <math>E(X) = 2\cdot \frac{1}{36} + 3\cdot \frac{2}{36}+ 4\cdot \frac{3}{36}+ 5\cdot \frac{4}{36}+ 6\cdot \frac{5}{36}+ 7\cdot \frac{6}{36}+ 8\cdot \frac{5}{36}+ 9\cdot \frac{4}{36}+ 10\cdot \frac{3}{36}+ 11\cdot \frac{2}{36}+ 12\cdot \frac{1}{36}=7</math><br />
* Ak by sme experiment opakovali veľa krát a zrátali priemer hodnôt X, ktoré nám vyšli, dostali by sme číslo blízke E(X)<br />
* Iný výpočet strednej hodnoty:<br />
** X=X1+X2, kde X1 je hodnota na prvej kocke a X2 je hodnota na druhej kocke<br />
** <math>E(X_1) = 1\cdot \frac{1}{6} + ... + 6\cdot \frac{1}{6} = 3.5</math>, podobne aj E(X2) = 3.5<br />
** Platí, že E(X1+X2)=E(X1) + E(X2) a teda E(X) = 3.5 + 3.5 = 7<br />
** Pozor, pre súčin a iné funkcie takéto vzťahy platiť nemusia, napr. <math>E(X_1 \cdot X_2)</math> nie je vždy <math>E(X_1) \cdot E(X_2)</math><br />
<br />
==Počítanie pokrytia genómov==<br />
<br />
* Pozrite tiez grafy k pravdepodobnosti: {{pdf|Ci-coverage}}<br />
* Nas problem: spocitanie pokrytia<br />
** G = dlzka genomu, napr. 1 000 000 (predpokladajme, že je cirkulárny)<br />
** N = pocet čítaní (readov), napr. 10 000<br />
** L = dlzka readu, napr. 1000<br />
** Celkova dlzka čítaní NL, pokrytie (coverage) NL/G, v nasom pripade 10x<br />
** V priemere kazda baza pokryta 10x<br />
** Niektore su ale pokryte viackrat, ine menej.<br />
** Zaujimaju nas otazky typu: kolko baz ocakavame, ze bude pokrytych menej ako 3x?<br />
** Dolezite pri planovani experimentov (ake velke pokrytie potrebujem na dosiahnutie urcitej kvality)<br />
<br />
* Pokrytie genomu: predpokladame, ze kazde čítanie zacina na nahodnej pozicii zo vsetkych moznych G<br />
* Takze ak premenna Y_i bude zaciatok i-teho čítania, jej rozdelenie bude rovnomerne<br />
** P(Y_i=1) = P(Y_i=2) = ... = P(Y_i=G) = 1/G<br />
<br />
* Aka je pravdepodobnost ze nejake konkretne i-te čítanie pokryva konkretnu poziciu j?<br />
** P(Y_i>=j-L+1 and Y_i<=j) = P(Y_i=j-L+1)+...+P(Y_i=j) = L/G, oznacme tuto hodnotu p, nasom priklade p=0.001 (1 promile)<br />
<br />
* Uvazujme premennu X_j, ktora udava pocet čítaní pokryvajucich poziciu j<br />
** mozne hodnoty 0..N<br />
** i-te čítanie pretina poziciu j s pravdepodobnostou p=L/G<br />
** to iste ako keby sme N krat hodili mincou, na ktorej spadne hlava s pravd. p a znak 1-p a oznacili ako X_j pocet hlav<br />
** Priklad: majme mincu, ktora ma hlavu s pr. 1/4 a hodime ju 3x. <br />
<pre><br />
HHH 1/64<br />
HHT 3/64<br />
HTH 3/64<br />
HTT 9/64<br />
THH 3/64<br />
THT 9/64<br />
TTH 9/64<br />
TTT 27/64<br />
</pre><br />
* P(X_j=3) = 1/64, P(X_j=2)=9/64, P(X_j=1)=27/64, P(X_j=0)=27/64<br />
** taketo rozdelenie pravdepodobnosti sa vola binomicke<br />
** P(X_j = k) = (N choose k) p^k (1-p)^(N-k), kde <math>{N \choose k} = \frac{N!}{k!(N-k)!}</math> a n! = 1*2*...*n<br />
** napr pre priklad s troma hodmi kockou P(X_j=2) = 3!/(2!*1!) * (1/4)^2 * (3/4)^1 = 9/64<br />
** Zle sa pocita pre velke N, preto sa niekedy pouziva aproximacia Poissonovym rozdelenim s parametrom lambda = Np, ktore ma <math>P(X_j = k)=e^{-\lambda}\lambda^k / k!</math><br />
** Spat k sekvenovaniu: vieme spocitat rozdelenie pravdepodobnosti a tiez napr. P(X_i<3) = P(X_i=0)+P(X_i=1)+P(X_i=2) = 0.000045+0.00045+0.0023=0.0028 (v priemere ocakavame 45 baz nepokrytych, 2800 pokrytých menej ako 3 krát)<br />
** Takyto graf, odhad, vieme lahko spravit pre rozne pocty čítaní a tak naplanovat, kolko čítaní potrebujeme <br />
<br />
Chceme tiež odhadnúť '''počet kontigov''' (podľa článku E.S. Lander and M.S. Waterman. "Genomic mapping by fingerprinting random clones: a mathematical analysis." Genomics 2.3 (1988): 231-239 [http://www.cs.cmu.edu/~epxing/Class/10810/readings/lander_waterman.pdf]) <br />
* Ak niekoľko báz vôbec nie je pokrytých čítaniami, preruší sa kontig<br />
* Vieme, koľko báz je v priemere nepokrytých, ale niektoré môžu byť vedľa seba<br />
* Nový kontig vznikne aj ak sa susedné čítania málo prekrývajú<br />
* Predpokladajme, že na spojenie dvoch čítaní potrebujeme prekryv aspoň T=50<br />
* Nech p je pravdepodobnosť, ze dané čítanie i bude posledné v kontigu<br />
* Aby sa to stalo, žiadne čítanie j!=i nesmie začínať v prvých L-T bázach kontigu i<br />
* Každé čítanie tam začína s pravdepodobnosťou q=(L-T)/G<br />
* Ak X je počet čítaní, ktoré zacinaju v tomto useku, tak p = Pr(X=0) = (1-q)^(N-1) podla binomickeho rozdelenia <br />
* v priemere ich tam zacne E(X) = (N-1)(L-T)/G co je zhruba N(L-T)/G<br />
* Jednoduchší vzorec pre p dostaneme ak binomické rozdelenie premennej X aproximujeme Poissonovým s parametrom <math>\lambda=N(L-T)/G</math> (t.j. aby mali rovnakú strednú hodnotu)<br />
* V Poissonovom rozdelení p = Pr(X=0) = exp(-lambda) = exp(-N(L-T)/G)<br />
* Presnosť aproximácie: pre parametre N,L,G,T uvedené vyššie dostaneme z binomického rozdelenia p=7.459e-5, z Poissonovho 7.485e-5<br />
* Pre N čítaní dostaneme priemerný počet kontigov N*p = N*exp(-N(L-T)/G) <br />
* NL/G je pokrytie, N(L-T)/G je pokrytie, ak by sme dĺžku každého čítania skrátili o dĺžku prekryvu<br />
* Pre T=50 dostaneme priemerný počet koncov kontigov 0.75 (ak pokryjeme celý kruh, máme nula koncov, preto je hodnota menšia ako 1). Ak znížime N na 5000 (5x pokrytie) dostaneme 43 kontigov<br />
<br />
* Môže sa zdať zvláštne, ze pri priemernom pocte nepokrytych baz 45 mame pocet koncov v priemere menej ako jedna. Situacia je vsak taka, ze pri opakovaniach tohto experimentu casto dostavame jeden suvisly kontig, ale ak je uz aspon jeden koniec kontigu, byva tam pomerne velka medzera. Tu je napriklad 50 opakovani expertimentu s T=0, priemerny pocet koncov je 0.55, priemerny pocet nepokrytych baz je 49.<br />
<pre><br />
nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 <br />
nepokr: 274 koncov: 2 nepokr: 282 koncov: 1 nepokr: 0 koncov: 0 <br />
nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 nepokr: 8 koncov: 1 <br />
nepokr: 0 koncov: 0 nepokr: 12 koncov: 1 nepokr: 0 koncov: 0 <br />
nepokr: 122 koncov: 1 nepokr: 135 koncov: 1 nepokr: 111 koncov: 1 <br />
nepokr: 13 koncov: 1 nepokr: 1 koncov: 1 nepokr: 56 koncov: 1 <br />
nepokr: 265 koncov: 1 nepokr: 0 koncov: 0 nepokr: 10 koncov: 1 <br />
nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 nepokr: 130 koncov: 1 <br />
nepokr: 217 koncov: 1 nepokr: 3 koncov: 1 nepokr: 0 koncov: 0 <br />
nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 nepokr: 86 koncov: 1 <br />
nepokr: 139 koncov: 2 nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 <br />
nepokr: 76 koncov: 1 nepokr: 221 koncov: 1 nepokr: 26 koncov: 1 <br />
nepokr: 0 koncov: 0 nepokr: 1 koncov: 1 nepokr: 0 koncov: 0 <br />
nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 <br />
nepokr: 0 koncov: 0 nepokr: 0 koncov: 0 nepokr: 12 koncov: 1 <br />
nepokr: 103 koncov: 2 nepokr: 0 koncov: 0 nepokr: 71 koncov: 1 <br />
nepokr: 69 koncov: 1 nepokr: 0 koncov: 0 <br />
</pre> <br />
<br />
* Tento jednoduchy model nepokryva vsetky faktory:<br />
** čítania nemaju rovnaku dlzku<br />
** Problemy v zostavovani kvoli chybam, opakovaniam a pod.<br />
** čítania nie su rozlozene rovnomerne (cloning bias a pod.)<br />
** Vplyv koncov chromozomov pri linearnych chromozomoch<br />
** Uzitocny ako hruby odhad<br />
** Na spresnenie mozeme skusat spravit zlozitejsie modely, alebo simulovat data<br />
<br />
* Poznamka: pravdepodobnosti z binomickeho rozdelenia mozeme lahko spocitat napr. statistickym softverom R. Tu su prikazy, ktore sa na to hodia, pre pripad, ze by vas to zaujimalo:<br />
<pre><br />
dbinom(10,1e4,0.001); #(12.5% miest ma pokrytie presne 10)<br />
pbinom(10,1e4,0.001,lower.tail=TRUE); #(58% miest ma pokrytie najviac 10)<br />
dbinom(0:30,1e4,0.001); #tabulka pravdepodobnosti<br />
[1] 4.517335e-05 4.521856e-04 2.262965e-03 7.549258e-03 1.888637e-02<br />
[6] 3.779542e-02 6.302390e-02 9.007019e-02 1.126216e-01 1.251601e-01<br />
[11] 1.251726e-01 1.137933e-01 9.481826e-02 7.292252e-02 5.207187e-02<br />
[16] 3.470068e-02 2.167707e-02 1.274356e-02 7.074795e-03 3.720595e-03<br />
[21] 1.858621e-03 8.841718e-04 4.014538e-04 1.743354e-04 7.254524e-05<br />
[26] 2.897743e-05 1.112843e-05 4.115040e-06 1.467156e-06 5.050044e-07<br />
[31] 1.680146e-07<br />
</pre><br />
<br />
==Zhrnutie==<br />
* Pravdepobnostny model: myslienkovy experiment, v ktorom vystupuje nahoda, napr. hod idealizovanou kockou<br />
* Vysledok je hodnota, ktoru budeme volat nahodna premenna<br />
* Tabulka, ktora pre kazdu moznu hodnotu nahodnej premennej urci jej pravdepodobnost, sa vola rozdelenie pravdepodobnosti, sucet hodnot v tabulke je 1<br />
* Znacenie typu P(X=7)=0.1<br />
<br />
* Priklad: mame genom dlzky G=1mil., nahodne umiestnime N=10000 čítaní dlzky L=1000<br />
* Nahodna premenna X_i je pocet čítaní pokryvajucich urcitu poziciu i<br />
* Podobne, ako keby sme N krat hodili kocku, ktora ma cca 1 promile sancu padnu ako hlava a 99.9% ako znak a pytame sa, kolko krat padne znak (1 promile sme dostali po zaukruhleni z L/(G-L+1))<br />
* Rozdelenie pravdepobnosti sa v tomto pripade vola binomicke a existuje vzorec, ako ho spocitat<br />
* Takyto model nam moze pomoct urcit, kolko čítaní potrebujeme osekvenovat, aby napr. aspon 95% pozicii bolo pokrytych aspon 4 čítaniami</div>
Brona