1-DAV-302: Princípy dátovej vedy
Zima 2022
Prednášky a poznámky


Info | Domáce úlohy | Prednášky a poznámky


Na tejto stránke nájdete orientačný rozvrh semestra. Tento rozvrh bude aktualizovaný vždy po skončení príslušného týždňa prednášok, takisto budú pribúdať študijné materiály.
 
Literatúra:

 
Týždeň 19.09.2022-23.09.2022
Úvod, administratíva. Ako klásť otázky?
Spôsoby ukladania dát. Kde hľadať dáta?
Literatúra: Skie:1.2; Skie:3.1-3.2,Gru:9
Slajdy:Poznámky a ďalšie materiály:
Úvod, otázky:PDF, 950 Kb ]
Ukladanie a získavanie dát:PDF, 426 Kb ]

Týždeň 26.09.2022-30.09.2022
Systematické chyby vs. šum, chýbajúce dáta
Typy dát z hľadiska štatistiky; skórovanie a zoraďovanie
Literatúra: Skie:3.3, Gru:10; Skie:4
Slajdy:Poznámky a ďalšie materiály:
Čistenie dát:PDF, 1021 Kb ]
Typy dát z pohľadu štatistiky:PDF, 220 Kb ]

Týždeň 03.10.2022-07.10.2022
Teoretické a realistické rozdelenia, transformácie dát
Závislosť, kovariancia, korelácia vs. kauzalita
Literatúra: Skie:5.1-5.2, Gru:5; Skie:2.3
Slajdy:Poznámky a ďalšie materiály:
Pravdepdobnostné rozdelenia:PDF, 174 Kb ]
Korelácia a kauzalita:PDF, 291 Kb ]

Týždeň 10.10.2022-14.10.2022
Testovanie hypotéz
Zhlukovanie
Literatúra: Skie:5.3-5.5, Gru:7; Skie:10.5-10.6, Gru:20
Slajdy:Poznámky a ďalšie materiály:
Testovanie hypotéz:PDF, 316 Kb ]
Zhlukovanie:PDF, 230 Kb ]
Príklady v jazyku R:R, 4 Kb ]

Týždeň 17.10.2022-21.10.2022
Hosťovská prednáška (Slovenské elektrárne)
Vlastné vektory a vlastné hodnoty, PCA (analýza hlavných komponentov)
Literatúra: Skie:8.4-8.5, Gru:4
Slajdy:Poznámky a ďalšie materiály:
Vlastné vektory, vlastné hodnoty, PCA:PDF, 231 Kb ]

Týždeň 24.10.2022-28.10.2022
Lineárna a polynomiálna regresia. Preučenia a podučenie.
Literatúra: Skie:9.1-9.5, Gru:14-15
Slajdy:Poznámky a ďalšie materiály:
Regresia:PDF, 443 Kb ]
Overfit:Jupyter notebook, 974 Kb ]

Týždeň 30.10.2022-04.11.2022
Logisticka regresia.
Literatúra: Skie:9.6-9.7, Gru:16
Slajdy:Poznámky a ďalšie materiály:
Stanford (ch 5, 9.3):linka ]

Týždeň 06.11.2022-11.11.2022
Neurónové siete.
Rozhodovacie stromy, náhodné lesy, XGBoost.
Literatúra: Skie:11.6, Gru:18; Skie:11.2-11.3, Gru:17
Slajdy:Poznámky a ďalšie materiály:
Neuronove site:Jupyter notebook, 31 Kb ]
Decision trees in sklearn:linka ]

Týždeň 13.11.2022-18.11.2022
Metódy založené na najbližších susedoch. Odporúčacie systémy.
Literatúra: Skie:10.2, Gru:12
Slajdy:Poznámky a ďalšie materiály:
FAISS kniznica:linka ]
Stanford notes:linka ]

Týždeň 20.11.2022-25.11.2022
P1: Reprezentácia všeličoho (obrázky, texty, audio). Zaujimave ML zo sveta.
P2: Pravdepodobnostné modely. Vierohodnosť. Bayesovské siete a inference. Naivný Bayesovský klasifikátor.
Literatúra: Skie: 11.1, Gru:21; Gru:23
Slajdy:Poznámky a ďalšie materiály:
Asorted examples of recent ML:linka ]
Sklearn feature extraction:linka ]
Koľko kaprov je v jazere:Jupyter notebook, 15 Kb ]

Týždeň 27.11.2022-02.12.2022
Bayesovské siete (pokr.) Príklad: SPAM filter
Skryté Markovove modely. Príklad: vyvážené a falošné mince
Literatúra: Gru:13
Slajdy:Poznámky a ďalšie materiály:
SPAM filter:Jupyter notebook, 93 Kb ]
vyvážené a falošné mince:Jupyter notebook, 93 Kb ]

Týždeň 04.12.2022-09.12.2022
Spracovanie veľkých dát.
Literatúra: Skie: 12
Slajdy:Poznámky a ďalšie materiály:
You do not need big data (notes):PDF, 21 Kb ]
hyperloglog:linka ]
count-min sketch:linka ]

Týždeň 11.12.2022-16.12.2022
Etické princípy v dátovej vede.
Literatúra: Gru:26
Slajdy:Poznámky a ďalšie materiály:
Etické princípy (prednáška):PDF, 211 Kb ]


Maintained by 1-DAV-302 personnel