1-DAV-302: Princípy dátovej vedy Zima 2022 Prednášky a poznámky |
![]() |
Info | Domáce úlohy | Prednášky a poznámky
Na tejto stránke nájdete orientačný rozvrh semestra. Tento rozvrh
bude aktualizovaný vždy po skončení príslušného týždňa prednášok,
takisto budú pribúdať študijné materiály.
| ||
Literatúra: | ||
---|---|---|
|
Týždeň 19.09.2022-23.09.2022 | |
Úvod, administratíva. Ako klásť otázky? Spôsoby ukladania dát. Kde hľadať dáta? Literatúra: Skie:1.2; Skie:3.1-3.2,Gru:9 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Úvod, otázky: [ PDF, 950 Kb ] Ukladanie a získavanie dát: [ PDF, 426 Kb ] |
Týždeň 26.09.2022-30.09.2022 | |
Systematické chyby vs. šum, chýbajúce dáta Typy dát z hľadiska štatistiky; skórovanie a zoraďovanie Literatúra: Skie:3.3, Gru:10; Skie:4 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Čistenie dát: [ PDF, 1021 Kb ] Typy dát z pohľadu štatistiky: [ PDF, 220 Kb ] |
Týždeň 03.10.2022-07.10.2022 | |
Teoretické a realistické rozdelenia, transformácie dát Závislosť, kovariancia, korelácia vs. kauzalita Literatúra: Skie:5.1-5.2, Gru:5; Skie:2.3 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Pravdepdobnostné rozdelenia: [ PDF, 174 Kb ] Korelácia a kauzalita: [ PDF, 291 Kb ] |
Týždeň 10.10.2022-14.10.2022 | |
Testovanie hypotéz Zhlukovanie Literatúra: Skie:5.3-5.5, Gru:7; Skie:10.5-10.6, Gru:20 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Testovanie hypotéz: [ PDF, 316 Kb ] Zhlukovanie: [ PDF, 230 Kb ] |
Príklady v jazyku R: [ R, 4 Kb ] |
Týždeň 17.10.2022-21.10.2022 | |
Hosťovská prednáška (Slovenské elektrárne) Vlastné vektory a vlastné hodnoty, PCA (analýza hlavných komponentov) Literatúra: Skie:8.4-8.5, Gru:4 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Vlastné vektory, vlastné hodnoty, PCA: [ PDF, 231 Kb ] |
Týždeň 24.10.2022-28.10.2022 | |
Lineárna a polynomiálna regresia. Preučenia a podučenie. Literatúra: Skie:9.1-9.5, Gru:14-15 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Regresia: [ PDF, 443 Kb ] Overfit: [ Jupyter notebook, 974 Kb ] |
Týždeň 30.10.2022-04.11.2022 | |
Logisticka regresia. Literatúra: Skie:9.6-9.7, Gru:16 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Stanford (ch 5, 9.3): [ linka ] |
Týždeň 06.11.2022-11.11.2022 | |
Neurónové siete. Rozhodovacie stromy, náhodné lesy, XGBoost. Literatúra: Skie:11.6, Gru:18; Skie:11.2-11.3, Gru:17 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Neuronove site: [ Jupyter notebook, 31 Kb ] Decision trees in sklearn: [ linka ] |
Týždeň 13.11.2022-18.11.2022 | |
Metódy založené na najbližších susedoch. Odporúčacie systémy. Literatúra: Skie:10.2, Gru:12 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
FAISS kniznica: [ linka ] Stanford notes: [ linka ] |
Týždeň 20.11.2022-25.11.2022 | |
P1: Reprezentácia všeličoho (obrázky, texty, audio). Zaujimave ML zo sveta. P2: Pravdepodobnostné modely. Vierohodnosť. Bayesovské siete a inference. Naivný Bayesovský klasifikátor. Literatúra: Skie: 11.1, Gru:21; Gru:23 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Asorted examples of recent ML: [ linka ] Sklearn feature extraction: [ linka ] |
Koľko kaprov je v jazere: [ Jupyter notebook, 15 Kb ] |
Týždeň 27.11.2022-02.12.2022 | |
Bayesovské siete (pokr.) Príklad: SPAM filter Skryté Markovove modely. Príklad: vyvážené a falošné mince Literatúra: Gru:13 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
SPAM filter: [ Jupyter notebook, 93 Kb ] vyvážené a falošné mince: [ Jupyter notebook, 93 Kb ] |
Týždeň 04.12.2022-09.12.2022 | |
Spracovanie veľkých dát. Literatúra: Skie: 12 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
You do not need big data (notes): [ PDF, 21 Kb ] hyperloglog: [ linka ] count-min sketch: [ linka ] |
Týždeň 11.12.2022-16.12.2022 | |
Etické princípy v dátovej vede. Literatúra: Gru:26 |
|
Slajdy: | Poznámky a ďalšie materiály: |
---|---|
Etické princípy (prednáška): [ PDF, 211 Kb ] |