1-DAV-202 Data Management 2023/24
Previously 2-INF-185 Data Source Integration

Materials · Introduction · Rules · Contact
· Grades from marked homeworks are on the server in file /grades/userid.txt
· Please submit project proposals until Friday April 12. Topics from potential bachelor topic supervisors can be found in /tasks/temy.txt (in Slovak).
· Due to Easter holidays, Web and Bioinf1 homeworks are due on April 4, 9:00am.


Difference between revisions of "Genomika"

From MAD
Jump to navigation Jump to search
(32 intermediate revisions by 2 users not shown)
Line 2: Line 2:
 
* [[Genomika: cvičenie UCSC browser|cvičenie na prvý týždeň]]
 
* [[Genomika: cvičenie UCSC browser|cvičenie na prvý týždeň]]
 
* [[Predbežné informácie k štátniciam]]
 
* [[Predbežné informácie k štátniciam]]
 +
* [[Genomika: Informácie ku trackom]]
 +
* [[Genomika: Rozvojové projekty]]
 +
* [http://genomika.compbio.fmph.uniba.sk/ Náš browser]
  
 
==Obsahové prerekvizity==
 
==Obsahové prerekvizity==
 
* Metódy v bioinformatike a Integrácia dátových zdrojov
 
* Metódy v bioinformatike a Integrácia dátových zdrojov
 
* Ak ste skúsení v práci na príkazovom riadku v Linuxe, Integráciu je možné brať aj súčasne s Genomikou
 
* Ak ste skúsení v práci na príkazovom riadku v Linuxe, Integráciu je možné brať aj súčasne s Genomikou
 +
 +
==Ciele predmetu==
 +
 +
===Základné ciele:===
 +
* Vystaviť vás interdisciplinárnej komunikácii a spolupráci.
 +
* Budovať schopnosť rýchlo sa oboznámiť s podstatnými znalosťami z vám neznámej oblasti, ktorá vám umožní efektívne komunikovať s klientami a kolegami, ktorí nie sú informatici.
 +
* Rozvíjať schopnosti tímovej spolupráce a organizácie práce.
 +
* Vyskúšať si projekt, kde nastupujete do "rozbehnutého vlaku" (práca s existujúcim softvérom s potrebou vývoja vlastných rozšírení).
 +
 +
===Vedomostná náplň pre všetkých:===
 +
* Zoznámiť sa s modernými technológiami, ktoré sú podstatným zdrojom fenoménu "big data" a sú základom moderného medicínskeho výskumu.
 +
 +
===Pre vážnych záujemcov o bioinformatiku:===
 +
* Vyskúšať si prácu s reálnymi biologickými dátami.
 +
* Prísť do kontaktu s odborníkmi z prírodných vied.
 +
 +
==Hodnotenie==
 +
* Písomná skúška: 50% (spoločná pre biológov aj informatikov)
 +
* Práca skupiny ako celku: 25%
 +
* (Preukázateľný) individuálny prínos k úspešnosti projektu: 25%
 +
* Známky A: 90+, B: 80+, C: 70+, D: 60+, E: 50+
 +
 +
Poznámky k hodnoteniu cvičení:
 +
* Obzvlášť malý alebo veľký podiel na práci skupiny môže vieť k individuálnej zmene váh(v extrémnych prípadoch môže individuálne hodnotenie tvoriť až 50% celej známky)
 +
* Za každú fázu skupinového projektu (t.j. po každom stretnutí) vám budú pridelené čierne a/alebo červené body
 +
** Červené body sú za splnené úlohy a ich počet odzrkadľuje kvalitu, kvantitu a náročnosť práce
 +
** Čierne body sú za úlohy, ktoré vám boli priradené, ale ktoré ste nesplnili, obzvlášť ak od nich závisí ďalší postup ostatných členov skupiny.
 +
** Čierne body môžu byť udelené aj za prístup narúšajúci úspešné napredovanie tímu(neospravedlnená neprítomnosť na stretnutí, narušenie práce spoločného servera a pod.)
 +
** Individuálne hodnotenie je neklesajúca funkcia od počtu červených bodov a nerastúca od počtu čiernych.
  
 
==Prednášky==
 
==Prednášky==
* Prednášky spolu s predmetom PriF.KBCh/N-mCBI-119/15 na Prírodovedeckej fakulte (pre magisterské programy Genetika, Biochémia a Molekulárna biológia)
+
* Spojené s predmetom N-mCBI-119/15 na Prírodovedeckej fakulte (spoločne s magisterskými študentami genetiky, molekulárnej biológie a biochémie)
* Prednášajú [https://www.sav.sk/?lang=sk&doc=user-org-user&user_no=10065 Peter Baráth] (Chemický ústav SAV), <!-- [http://www.biocenter.sk/ib.html Ingrid Bhatia] (Katedra biochémie PriFUK)-->, [http://compbio.fmph.uniba.sk/~bbrejova/ Broňa Brejová] (Katedra informatiky FMFI), [https://sluzby.fmph.uniba.sk/ludia/kollar53 Richard Kollár] (Katedra aplikovanej matematiky a štatistiky FMFI), [http://biochemici.sk/index.php/about/employees/24-nebohacovamartina Martina Neboháčová] (Katedra biochémie PriFUK), [http://www.biocenter.sk/jn.html Jozef Nosek] (Katedra biochémie PriFUK), [http://www.biocenter.sk/lt.html Ľubomír Tomáška] (Katedra genetiky PriFUK), [https://www.researchgate.net/profile/Ivan_Valent Ivan Valent] (Katedra fyzikálnej a teoretickej chémie PriFUK), [http://compbio.fmph.uniba.sk/~tvinar/ Tomáš Vinař] (Katedra aplikovanej informatiky FMFI)
+
* Prednášajúci:
<!-- * [https://moodle.uniba.sk/moodle/moodle16/course/view.php?id=1322 Moodle s materiálmi k prednáškam] -->
+
** [https://www.sav.sk/?lang=sk&doc=user-org-user&user_no=10065 Peter Baráth] (Chemický ústav SAV)  
* Moodle s materiálmi k prednáškam (pribudne neskôr)
+
** [http://compbio.fmph.uniba.sk/~bbrejova/ Broňa Brejová] (Katedra informatiky FMFI)
 +
** [https://sluzby.fmph.uniba.sk/ludia/kollar53 Richard Kollár] (Katedra aplikovanej matematiky a štatistiky FMFI)
 +
** [http://biochemici.sk/index.php/about/employees/24-nebohacovamartina Martina Neboháčová] (Katedra biochémie PriFUK)
 +
** [http://www.biocenter.sk/jn.html Jozef Nosek] (Katedra biochémie PriFUK)  
 +
** [http://www.biocenter.sk/lt.html Ľubomír Tomáška] (Katedra genetiky PriFUK)
 +
** [https://www.researchgate.net/profile/Ivan_Valent Ivan Valent] (Katedra fyzikálnej a teoretickej chémie PriFUK)
 +
** [http://compbio.fmph.uniba.sk/~tvinar/ Tomáš Vinař] (Katedra aplikovanej informatiky FMFI)
 +
* [https://moodle.uniba.sk/moodle/moodle17/course/view.php?id=1322 Moodle s materiálmi k prednáškam]
 
* Učebnica [https://www.amazon.de/Genomika-Jozef-Nosek/dp/1494230623/ref=tmm_pap_title_0?_encoding=UTF8&qid=&sr= čiernobiela], [https://www.amazon.de/Genomika-Jozef-Nosek/dp/1493731335 farebná], vo fakultnej knižnici na prezenčné použitie so signatúrou I-INF-N-20
 
* Učebnica [https://www.amazon.de/Genomika-Jozef-Nosek/dp/1494230623/ref=tmm_pap_title_0?_encoding=UTF8&qid=&sr= čiernobiela], [https://www.amazon.de/Genomika-Jozef-Nosek/dp/1493731335 farebná], vo fakultnej knižnici na prezenčné použitie so signatúrou I-INF-N-20
 +
 +
=== Čo si máte odniesť z prednášky? ===
 +
* Pochopiť podstatné myšlienky prezentácie / textu (o akej technológii sa bavíme, aký typ dát tam vystupuje, akým spôsobom ich získavame, aký je princíp fungovania)?
 +
* Nie je podstatné (ani možné) na 100% ovládať terminológiu
 +
** využívajte znalosti získané v MBI! (je dobré si pred prednáškou zopakovať relevantnú časť)
 +
** treba sa preniesť nad fakt, že nie každému slovu budete rozumieť
 +
** je ok sa na pár minút stratiť v detailoch (ale nie je ok sa stratiť na 70% prednášky)
 +
** treba sa priebežne pýtať rozumné otázky smerujúce k vyjasneniu podstatných vecí
 +
** (tréning k interdisciplinárnej komunikácii ide oboma smermi ;))
 +
** Don't panic! Jediná vec, ktorá nie je v knihe, je Tomášova prednáška.
 +
* Tréning v schopnosti rozlíšiť podstatné od nepodstatného (veľmi dôležitý do budúcnosti)
 +
* V prípade veľkých problémov sa môžeme dohodnúť na konzultáciách ku konkrétnym otázkam
  
 
==Cvičenia==
 
==Cvičenia==
 
* Cvičiaci [http://compbio.fmph.uniba.sk/~bbrejova/ Broňa Brejová] a [http://compbio.fmph.uniba.sk/~tvinar/ Tomáš Vinař]
 
* Cvičiaci [http://compbio.fmph.uniba.sk/~bbrejova/ Broňa Brejová] a [http://compbio.fmph.uniba.sk/~tvinar/ Tomáš Vinař]
* Náplňou cvičení je tvorba prehliadača genómov na báze softvéru [http://genome-euro.ucsc.edu/ UCSC genome browser] pre vybrané genómy. Pri tejto tvorbe si precvičíme prácu s genomickými dátami a vytvoríme aj potenciálne užitočný nástroj
+
* Tvorba prehliadača genómov na báze softvéru [http://genome-euro.ucsc.edu/ UCSC genome browser] pre vybrané genómy.  
* Budeme pracovať ako skupina, ktorá má spoločný cieľ. Konkrétne podciele na najbližší čas si vždy rozdelíme medzi jednotlivých členov (prípadne dvojice) na spoločnom stretnutí.
+
* Ak budú výsledky dobré, reálna šanca na využitie v medzinárodnej komunite!
** Pri väčšom počte študentov sa rozdelíme na 2 alebo 3 skupiny s rôznymi cieľmi
+
* Dve skupiny (s rôznymi cieľmi), stretnutia cca každé dva týždne v rozvrhovanom čase.
* Stretnutie sa uskutoční v rozvrhovom čase pre cvičenia približne raz za dva týždne. Jednotliví členovia skupiny zosumarizujú, čo sa im z predchádzajúcich úloh podarilo a čo nie, na aké problémy narazili, čo sa zaujímavé naučili a pod. Podiskutujeme, ako by sa tieto problémy mohli riešiť, rozmyslíme ďalšie úlohy a dohodneme sa, kto bude čo robiť.
 
* Po skončení diskusnej časti stretnutia začnete na dohodnutých úlohách pracovať v počítačovej miestnosti, pokračujete individuálne do ďalšieho stretnutia
 
* Ak sa v danom týždni nekoná stretnutie celej skupiny, môžete v čase cvičení využiť miestnosť na prácu na projekte, najmä ak chcete koordinovať viac ľudí. V prípade záujmu môžeme prísť aj my a niečo poradiť (dohodnite si to vopred).
 
  
==Hodnotenie==
+
===Je toto reálny model niečoho s čím sa môžem stretnúť v praxi?===
* Prednášková časť je ukončená písomnou skúškou, ktorá tvorí 50% známky, skúšku organizuje prof. Nosek
+
* Vo väčšine firiem nastupujete do rozbehnutého projektu.
* 50% známky je za prácu na cvičeniach, pričom cca 25% známky je celkový dojem z úspešnosti skupiny ako celku a 25% z individuálneho prínosu daného študenta
+
* Nie je neobvyklé, že skupina ľudí odíde a zanechá po sebe nesúrodú dokumentáciu a rozrobenú prácu, na ktorej vy musíte pokračovať.
* Známky A: 90+, B: 80+, C: 70+, D: 60+, E: 50+
+
* Nie príliš schopný manažér.
 +
* Firmy so stabilným produktom používajú zabehnuté technológie (z vášho pohľadu legacy postupy s prvkami zastaralých programovacích jazykov); nie je finančne ani časovo možné neustále refaktorovať na nové platformy
 +
* V tomto projekte: hlavná časť softvéru v C/C++, Perl; databáza MySQL - jadro podporného softvéru vyvinuté na prelome tisícročí
 +
* Ťažiskom projektu je vyhľadávanie, spracovanie a porozumenie dátam
 +
* Vývoj softvéru je pomocný prvok s dôrazom na dosiahnutie konkrétneho cieľa; kľúčová je reprodukovateľnosť, vítaná je znovupoužiteľnosti v iných kontextoch
 +
 
 +
===Typický priebeh cvičenia===
 +
* Krátke prezentácie členov tímu o postupe / dosiahnutí cieľov (vrátane prezentácie informácii, ktoré by mohli byť užitočné kolegom pri ich práci)
 +
* Diskusia k aktuálnym problémom, brain storming ohľadom riešenia aktuálnych problémov
 +
* Nové ciele, rozdelenie práce
 +
* Začnete pracovať na nových cieľoch, cvičiaci pomôžu riešiť technické problémy / zodpovedať otázky. Z cvičenia by ste mali odchádzať s predstavou čo idete robiť a ako dlho vám to bude trvať.
 +
* Po skončení cvičenia pokračujete individuálne do ďalšieho stretnutia (komunikácia v rámci skupiny je samozrejme vítaná).
 +
 
 +
 
 +
==Malassezia globosa a Malassezia sympodialis==
 +
* Budeme používať skratky malGlo a malSym
 +
* Sú to mikroorganizmy, ktoré patria medzi huby (fungi).
 +
* Bežne žijú na ľudskej pokožke, živia sa kožným mazom.
 +
* Môžu spôsobovať problémy, ako lupiny vo vlasoch, ekzém, infekcie.
 +
* Obrázky: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4069738/figure/F1/
 +
* Saunders CW, Scheynius A, Heitman J. Malassezia fungi are specialized to live on skin and associated with dandruff, eczema, and other skin diseases. PLoS pathogens. 2012 Jun 21;8(6):e1002701. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3380954/]
 +
 
 +
 
 +
Malassezia globosa
 +
* genóm publikovaný firmou Procter and Gamble, ktorá vyrába šampón Head and Shoulders, ktorý obsahuje antigungálne látky
 +
* Xu J, Saunders CW, Hu P, Grant RA, Boekhout T, Kuramae EE, Kronstad JW, DeAngelis YM, Reeder NL, Johnstone KR, Leland M. Dandruff-associated Malassezia genomes reveal convergent and divergent virulence traits shared with plant and human fungal pathogens. Proceedings of the National Academy of Sciences. 2007 Nov 20;104(47):18730-5. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2141845/]
 +
* Wu G, Zhao H, Li C, Rajapakse MP, Wong WC, Xu J, Saunders CW, Reeder NL, Reilman RA, Scheynius A, Sun S. Genus-wide comparative genomics of Malassezia delineates its phylogeny, physiology, and niche adaptation on human skin. PLoS genetics. 2015 Nov 5;11(11):e1005614. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4634964/]
 +
* Genóm [https://www.ncbi.nlm.nih.gov/genome/701?genome_assembly_id=30575], proteíny [http://www.uniprot.org/proteomes/UP000008837], RNA-seq [https://www.ncbi.nlm.nih.gov/bioproject/PRJNA286710]
 +
* Tím: Becza, Hraška, Jariabka, Krajčovič, Smolík, Šuppa, Zeleňák
 +
 
 +
Malassezia sympodialis
 +
* Gioti A, Nystedt B, Li W, Xu J, Andersson A, Averette AF, Münch K, Wang X, Kappauf C, Kingsbury JM, Kraak B. Genomic insights into the atopic eczema-associated skin commensal yeast Malassezia sympodialis. MBio. 2013 Mar 1;4(1):e00572-12. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3560662/]
 +
* Zhu Y, Engström PG, Tellgren-Roth C, Baudo CD, Kennell JC, Sun S, Billmyre RB, Schröder MS, Andersson A, Holm T, Sigurgeirsson B. Proteogenomics produces comprehensive and highly accurate protein-coding gene annotation in a complete genome assembly of Malassezia sympodialis. Nucleic acids research. 2017 Jan 18;45(5):2629-43. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5389616/]
 +
* Genóm [https://www.ncbi.nlm.nih.gov/genome/16894?genome_assembly_id=302004], proteíny [http://www.uniprot.org/proteomes/UP000186303], RNA-seq [https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-4589/]
 +
* Tím: Ižip, Mayer, Metohajrová, Novák, Rabatin, D. Simeunovič, R. Simeunovič
 +
 
 +
Ďalšie príbuzné genómy
 +
* [https://www.ncbi.nlm.nih.gov/genome/?term=txid55193%5BOrganism%3Aexp%5D]
 +
 
 +
==Ǔlohy pre vás==
  
Poznámky k hodnoteniu cvičení
+
* Skúste si spraviť [[Genomika: cvičenie UCSC browser|cvičenie]] na prácu s UCSC prehliadačom
* Ak niektorí študenti budú mať obzvlášť malý alebo obzvlášť veľký podiel na práci skupiny, môže byť váha ich individuálneho hodnotenia zvýšená (v extrémnych prípadoch až 50% celej známky)
+
* Do pondelka 26.2.: poslať B. Brejovej email obsahujúci vaše meno, gmailové konto a githubové konto, ktoré chcete na predmete využívať, prijať pozvánku za člena Github projektu
* Za každú fázu skupinového projektu (t.j. po každom stretnutí) vám budú pridelené čierne a/alebo červené body
+
* Rozmyslite si v skupinách aké spôsoby koordinácie chcete používať, návrhy nižšie
** Červené body sú za splnené úlohy a ich počet odzrkadľuje kvalitu, kvantitu a náročnosť práce
+
* Pre ďalšie dve prednášky je vhodné si z MBI zopakovať úvod do biológie pre informatikov (cvičenie) a prednášku o sekvenovaní a zostavovaní genómov
** Čierne body sú za úlohy, ktoré vám boli priradené, ale ktoré ste nesplnili, obzvlášť ak od nich závisí ďalší postup ostatných členov skupiny. Takisto čierne body dostanete za iné správanie, ktoré narúša úspešné napredovanie skupiny (neospravedlnená neprítomnosť na stretnutí, narušenie práce spoločného servera a pod.)
+
* 1.3. stretnutie malGlo, 8.3. stretnutie malSym
** Individuálne hodnotenie je neklesajúca funkcia od počtu červených bodov a nerastúca od počtu čiernych, presný prepočet určíme neskôr.
 
  
 
==Koordinácia v rámci skupiny a s cvičiacimi==
 
==Koordinácia v rámci skupiny a s cvičiacimi==
* Projekt na GitHube https://github.com/bbrejova/genomika-2017
+
Každá skupina by si mala vytvoriť spôsob organizácie práce a jej výsledkov
** Slúži na ukladanie skriptov a dokumentácie, koordinácia úloh pomocou issues
+
* Mala by existovať verejne dostupná a prehľadná dokumentácia k všetkému, čo ste robili
** Verejne prístupný, píšeme po anglicky, neuvádzame záležitosti súvisiace skôr s predmetom než samotným cieľom našej práce
+
** Kde ste stiahli dáta, ako ste ich spracovali (ideálne postupnosť všetkých relevantných príkazov), poznámky k problematickým krokom
** Nabudúce spolu dohodneme vhodnú štruktúru
+
** Ideálne v angličtine, ale stačia stručné poznámky
 +
* Takisto by mali byť verejne prístupný archív zdrojových kódov všetkých programov, ktorý ste pre predmet napísali
  
* Každý študent má Google document, v ktorom si vedie stručný denník
+
Z minulého roku existuje projekt na GitHube https://github.com/bbrejova/genomika-2017
** Tento denník zdieľajte s cvičiacimi na zápis, budú vám tam dopisovať body
+
* Obsahuje skripty aj dokumentáciu vo forme wiki
** V každej fáze uveďte ako nadpis dátum stretnutia, ktorým fáza začala a pod neho stručný zoznam vecí, ktoré ste spravili s linkami do GitHubu na výsledky vašej práce
+
* Odporúčame použiť, ak nemáte lepší nápad ako prácu zorganizovať
** Uveďte tiež stručný sumár, čo sa vám oproti plánu podarilo alebo nepodarilo, prípadne či s niečím boli ťažkosti, či ste spravili niečo oproti plánu navyše a pod.
+
* Časti z minulého roka nemažte, môžete ich však nejako presunúť do priečinka a pod.
** Tento denník je vhodným podkladom pre ďalšie plánovacie stretnutie, kde sa o vašich výsledkoch budeme rozprávať, treba si ho teda pripraviť pred stretnutím
 
** Ak si na stretnutí spomeniete na niečo, čo chcete pridať k denníku predchádzajúcej fázy, spravte to čím skôr (hneď po stretnutí), potom už predchádzajúcu fázu nemeňte
 
** Najnovšiu fázu majte vždy na vrchu dokumentu, aby sa dala rýchlo nájsť
 
  
* Chceme aj nejaký mailing list / skupinu na oznamy ostatným členom? Alternatívne návrhy k GitHubu a Google docs?
+
Denník skupiny
 +
* Každá skupina má Google document, v ktorom sa na stretnutí spíšu dohodnuté úlohy a komu boli priradené a na ďalšom stretnutí aktuálny stav ich plnenia a pridelené body
 +
* Môžete si tam písať aj ďalšie poznámky o aktuálnom stave prác a problémoch, na aké ste narazili
  
==Plán na prvé týždne==
+
==Predbežný plán cvičení==
 +
Časový plán sa ešte môže zmeniť podľa okolností
  
V prvých troch týždňoch plánujeme stretnutie každý týždeň
+
* 6.4. MalGlo (Becza, Hraška, Jariabka, Krajčovič, Smolík, Šuppa, Zeleňák)
* 23.2.: organizačné detaily, práca s UCSC prehliadačom: [[Genomika: cvičenie UCSC browser|cvičenie]]
+
* 12.4. MalSym (Ižip, Mayer, Metohajrová, Novák, Rabatin, D. Simeunovič, R. Simeunovič)
** úloha do ďalšieho týždňa: vytvoriť si Google doc s denníkom, zdieľať s cvičiacimi, uviesť v ňom svoje meno a GitHub username, prijať pozvánku stať sa členom projektu
+
* 19.4. MalGlo
* 2.3.: celkové ciele skupiny
+
* 26.4. MalSym
** úloha do ďalšieho týždňa: oboznámenie sa s existujúcimi prehliadačmi pre cieľové druhy, získanie genómových sekvencií, začiatok inštalácie browsera (rozdelíme si)
+
* 3.5. nebude
* 9.3: podrobnejšie ciele na prvé fázy
+
* 10.5. MalGlo
** rozdelíme konkrétne úlohy na ďalšie dva týždne
+
* 17.5. MalSym

Revision as of 13:28, 12 April 2018

Stránka k predmetu 2-INF-269/15 Genomika

Obsahové prerekvizity

  • Metódy v bioinformatike a Integrácia dátových zdrojov
  • Ak ste skúsení v práci na príkazovom riadku v Linuxe, Integráciu je možné brať aj súčasne s Genomikou

Ciele predmetu

Základné ciele:

  • Vystaviť vás interdisciplinárnej komunikácii a spolupráci.
  • Budovať schopnosť rýchlo sa oboznámiť s podstatnými znalosťami z vám neznámej oblasti, ktorá vám umožní efektívne komunikovať s klientami a kolegami, ktorí nie sú informatici.
  • Rozvíjať schopnosti tímovej spolupráce a organizácie práce.
  • Vyskúšať si projekt, kde nastupujete do "rozbehnutého vlaku" (práca s existujúcim softvérom s potrebou vývoja vlastných rozšírení).

Vedomostná náplň pre všetkých:

  • Zoznámiť sa s modernými technológiami, ktoré sú podstatným zdrojom fenoménu "big data" a sú základom moderného medicínskeho výskumu.

Pre vážnych záujemcov o bioinformatiku:

  • Vyskúšať si prácu s reálnymi biologickými dátami.
  • Prísť do kontaktu s odborníkmi z prírodných vied.

Hodnotenie

  • Písomná skúška: 50% (spoločná pre biológov aj informatikov)
  • Práca skupiny ako celku: 25%
  • (Preukázateľný) individuálny prínos k úspešnosti projektu: 25%
  • Známky A: 90+, B: 80+, C: 70+, D: 60+, E: 50+

Poznámky k hodnoteniu cvičení:

  • Obzvlášť malý alebo veľký podiel na práci skupiny môže vieť k individuálnej zmene váh(v extrémnych prípadoch môže individuálne hodnotenie tvoriť až 50% celej známky)
  • Za každú fázu skupinového projektu (t.j. po každom stretnutí) vám budú pridelené čierne a/alebo červené body
    • Červené body sú za splnené úlohy a ich počet odzrkadľuje kvalitu, kvantitu a náročnosť práce
    • Čierne body sú za úlohy, ktoré vám boli priradené, ale ktoré ste nesplnili, obzvlášť ak od nich závisí ďalší postup ostatných členov skupiny.
    • Čierne body môžu byť udelené aj za prístup narúšajúci úspešné napredovanie tímu(neospravedlnená neprítomnosť na stretnutí, narušenie práce spoločného servera a pod.)
    • Individuálne hodnotenie je neklesajúca funkcia od počtu červených bodov a nerastúca od počtu čiernych.

Prednášky

Čo si máte odniesť z prednášky?

  • Pochopiť podstatné myšlienky prezentácie / textu (o akej technológii sa bavíme, aký typ dát tam vystupuje, akým spôsobom ich získavame, aký je princíp fungovania)?
  • Nie je podstatné (ani možné) na 100% ovládať terminológiu
    • využívajte znalosti získané v MBI! (je dobré si pred prednáškou zopakovať relevantnú časť)
    • treba sa preniesť nad fakt, že nie každému slovu budete rozumieť
    • je ok sa na pár minút stratiť v detailoch (ale nie je ok sa stratiť na 70% prednášky)
    • treba sa priebežne pýtať rozumné otázky smerujúce k vyjasneniu podstatných vecí
    • (tréning k interdisciplinárnej komunikácii ide oboma smermi ;))
    • Don't panic! Jediná vec, ktorá nie je v knihe, je Tomášova prednáška.
  • Tréning v schopnosti rozlíšiť podstatné od nepodstatného (veľmi dôležitý do budúcnosti)
  • V prípade veľkých problémov sa môžeme dohodnúť na konzultáciách ku konkrétnym otázkam

Cvičenia

  • Cvičiaci Broňa Brejová a Tomáš Vinař
  • Tvorba prehliadača genómov na báze softvéru UCSC genome browser pre vybrané genómy.
  • Ak budú výsledky dobré, reálna šanca na využitie v medzinárodnej komunite!
  • Dve skupiny (s rôznymi cieľmi), stretnutia cca každé dva týždne v rozvrhovanom čase.

Je toto reálny model niečoho s čím sa môžem stretnúť v praxi?

  • Vo väčšine firiem nastupujete do rozbehnutého projektu.
  • Nie je neobvyklé, že skupina ľudí odíde a zanechá po sebe nesúrodú dokumentáciu a rozrobenú prácu, na ktorej vy musíte pokračovať.
  • Nie príliš schopný manažér.
  • Firmy so stabilným produktom používajú zabehnuté technológie (z vášho pohľadu legacy postupy s prvkami zastaralých programovacích jazykov); nie je finančne ani časovo možné neustále refaktorovať na nové platformy
  • V tomto projekte: hlavná časť softvéru v C/C++, Perl; databáza MySQL - jadro podporného softvéru vyvinuté na prelome tisícročí
  • Ťažiskom projektu je vyhľadávanie, spracovanie a porozumenie dátam
  • Vývoj softvéru je pomocný prvok s dôrazom na dosiahnutie konkrétneho cieľa; kľúčová je reprodukovateľnosť, vítaná je znovupoužiteľnosti v iných kontextoch

Typický priebeh cvičenia

  • Krátke prezentácie členov tímu o postupe / dosiahnutí cieľov (vrátane prezentácie informácii, ktoré by mohli byť užitočné kolegom pri ich práci)
  • Diskusia k aktuálnym problémom, brain storming ohľadom riešenia aktuálnych problémov
  • Nové ciele, rozdelenie práce
  • Začnete pracovať na nových cieľoch, cvičiaci pomôžu riešiť technické problémy / zodpovedať otázky. Z cvičenia by ste mali odchádzať s predstavou čo idete robiť a ako dlho vám to bude trvať.
  • Po skončení cvičenia pokračujete individuálne do ďalšieho stretnutia (komunikácia v rámci skupiny je samozrejme vítaná).


Malassezia globosa a Malassezia sympodialis

  • Budeme používať skratky malGlo a malSym
  • Sú to mikroorganizmy, ktoré patria medzi huby (fungi).
  • Bežne žijú na ľudskej pokožke, živia sa kožným mazom.
  • Môžu spôsobovať problémy, ako lupiny vo vlasoch, ekzém, infekcie.
  • Obrázky: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4069738/figure/F1/
  • Saunders CW, Scheynius A, Heitman J. Malassezia fungi are specialized to live on skin and associated with dandruff, eczema, and other skin diseases. PLoS pathogens. 2012 Jun 21;8(6):e1002701. [1]


Malassezia globosa

  • genóm publikovaný firmou Procter and Gamble, ktorá vyrába šampón Head and Shoulders, ktorý obsahuje antigungálne látky
  • Xu J, Saunders CW, Hu P, Grant RA, Boekhout T, Kuramae EE, Kronstad JW, DeAngelis YM, Reeder NL, Johnstone KR, Leland M. Dandruff-associated Malassezia genomes reveal convergent and divergent virulence traits shared with plant and human fungal pathogens. Proceedings of the National Academy of Sciences. 2007 Nov 20;104(47):18730-5. [2]
  • Wu G, Zhao H, Li C, Rajapakse MP, Wong WC, Xu J, Saunders CW, Reeder NL, Reilman RA, Scheynius A, Sun S. Genus-wide comparative genomics of Malassezia delineates its phylogeny, physiology, and niche adaptation on human skin. PLoS genetics. 2015 Nov 5;11(11):e1005614. [3]
  • Genóm [4], proteíny [5], RNA-seq [6]
  • Tím: Becza, Hraška, Jariabka, Krajčovič, Smolík, Šuppa, Zeleňák

Malassezia sympodialis

  • Gioti A, Nystedt B, Li W, Xu J, Andersson A, Averette AF, Münch K, Wang X, Kappauf C, Kingsbury JM, Kraak B. Genomic insights into the atopic eczema-associated skin commensal yeast Malassezia sympodialis. MBio. 2013 Mar 1;4(1):e00572-12. [7]
  • Zhu Y, Engström PG, Tellgren-Roth C, Baudo CD, Kennell JC, Sun S, Billmyre RB, Schröder MS, Andersson A, Holm T, Sigurgeirsson B. Proteogenomics produces comprehensive and highly accurate protein-coding gene annotation in a complete genome assembly of Malassezia sympodialis. Nucleic acids research. 2017 Jan 18;45(5):2629-43. [8]
  • Genóm [9], proteíny [10], RNA-seq [11]
  • Tím: Ižip, Mayer, Metohajrová, Novák, Rabatin, D. Simeunovič, R. Simeunovič

Ďalšie príbuzné genómy

Ǔlohy pre vás

  • Skúste si spraviť cvičenie na prácu s UCSC prehliadačom
  • Do pondelka 26.2.: poslať B. Brejovej email obsahujúci vaše meno, gmailové konto a githubové konto, ktoré chcete na predmete využívať, prijať pozvánku za člena Github projektu
  • Rozmyslite si v skupinách aké spôsoby koordinácie chcete používať, návrhy nižšie
  • Pre ďalšie dve prednášky je vhodné si z MBI zopakovať úvod do biológie pre informatikov (cvičenie) a prednášku o sekvenovaní a zostavovaní genómov
  • 1.3. stretnutie malGlo, 8.3. stretnutie malSym

Koordinácia v rámci skupiny a s cvičiacimi

Každá skupina by si mala vytvoriť spôsob organizácie práce a jej výsledkov

  • Mala by existovať verejne dostupná a prehľadná dokumentácia k všetkému, čo ste robili
    • Kde ste stiahli dáta, ako ste ich spracovali (ideálne postupnosť všetkých relevantných príkazov), poznámky k problematickým krokom
    • Ideálne v angličtine, ale stačia stručné poznámky
  • Takisto by mali byť verejne prístupný archív zdrojových kódov všetkých programov, ktorý ste pre predmet napísali

Z minulého roku existuje projekt na GitHube https://github.com/bbrejova/genomika-2017

  • Obsahuje skripty aj dokumentáciu vo forme wiki
  • Odporúčame použiť, ak nemáte lepší nápad ako prácu zorganizovať
  • Časti z minulého roka nemažte, môžete ich však nejako presunúť do priečinka a pod.

Denník skupiny

  • Každá skupina má Google document, v ktorom sa na stretnutí spíšu dohodnuté úlohy a komu boli priradené a na ďalšom stretnutí aktuálny stav ich plnenia a pridelené body
  • Môžete si tam písať aj ďalšie poznámky o aktuálnom stave prác a problémoch, na aké ste narazili

Predbežný plán cvičení

Časový plán sa ešte môže zmeniť podľa okolností

  • 6.4. MalGlo (Becza, Hraška, Jariabka, Krajčovič, Smolík, Šuppa, Zeleňák)
  • 12.4. MalSym (Ižip, Mayer, Metohajrová, Novák, Rabatin, D. Simeunovič, R. Simeunovič)
  • 19.4. MalGlo
  • 26.4. MalSym
  • 3.5. nebude
  • 10.5. MalGlo
  • 17.5. MalSym