Vizualizácia dát · 1-DAV-105 · LS 2021/22


The new course website is at https://bbrejova.github.io/viz/

Skúška

From viz
Revision as of 09:24, 11 May 2021 by Martina (talk | contribs)
Jump to navigation Jump to search

Základné pravidlá

Z pravidiel predmetu:

  • Váha písomky v záverečnom hodnotení je 20%, ústnej skúšky 10%
  • Z obidvoch ale musíte získať aspoň polovicu bodov, inak máte známku Fx
  • U oboch máte nárok na dva opravné termíny

Písomka

  • Trvanie 60-90 minút.
  • Vypĺňate text do Google doc, zadanie v slovenčine distribuované cez classroom.
  • V prípade potreby môžete použiť kalkulačku (softvérovú alebo hardvérovú) so základnými aritmetickými operáciami a funkciami (sčítanie, odčítanie, násobenie, delenie, odmocnina, logaritmus).
  • Môžete tiež použiť čistý papier a pero na poznámky, výpočty a podobne (neodovzdáva sa).
  • Ste prihlásení v MS Teams na špeciálnej schôdzi, kde budú na začiatku pokyny a počas písomky môžu byť občas upozornenia na chyby v zadaní alebo iné organizačné oznamy. Máte vypnutý mikrofón aj kameru.
  • Ak máte otázku k zadaniu, zdvihnite ruku, pripojíme sa ku vám súkromným hovorom.
  • Môžeme vás kontaktovať súkromným hovorom aj v rámci kontroly, v tom prípade zapnite mikrofón a kameru a zdieľajte nám svoju obrazovku.
  • Okrem zadania, do ktorého píšete pomocou Google doc a povolenej komunikácie v rámci MS Teams s vyučujúcimi, nemáte povolené žiadne iné pomôcky.
  • Je teda zakázané
    • Komunikovať so spolužiakmi a ďalšími osobami okrem vyučujúcich akýmkoľvek spôsobom
    • Hľadať informácie v akýchkoľvek zdrojoch (materiály k predmetu, vaše súbory, internet, papierové materiály)
    • Používať iný softvér, ako napríklad programátorské prostredia a podobne
  • Pred začiatkom skúšky vypnite všetky programy na komunikáciu okrem MS Teams, pozatvárajte okná a stránky nesúvisiace so skúškou

Ústna skúška

Individuálny hovor s vyučujúcimi cez MS Teams

  • Ku každému termínu ústnych skúšok zverejníme približný harmonogram.
  • Od uvedeného času buďte prihlásení na MS Teams, čakajte na náš hovor. Časy sú orientačné, môžeme vás kontaktovať aj neskôr. Nemali by ste však čakať dlhšie ako hodinu.
  • Počas hovoru si zapnite mikrofón a kameru, v prípade potreby zdieľajte obrazovku.

Na riadnom termíne bude obsahom skúšky:

  • otázky k projektu,
  • diskusia k písomke.

U projektu by ste mali dôkladne rozumieť častiam kódu, na ktorých ste spolupracovali a mali by ste ich vedieť modifikovať.

  • Môžeme požadovať, aby ste v niektorom grafe alebo výpočte spravili určitú zmenu
  • Dôležitejšie než dospieť k požadovanému výsledku je ukázať nám, ako by ste postupovali. Môžete vyhľadávať potrebné informácie v dokumentácii a iných zdrojoch ale komentujte čo a prečo robíte.

Pred uvedeným termínom si na počítači prichystajte:

  • kópiu notebooku pre váš projekt otvorenú v Colabe, pričom načítajte dáta a spustite všetky bunky, aby bolo možné rýchlo začať niečo meniť a skúšať,
  • súbor so správou k projektu, lebo môže byť potrebné ho zdieľať, aby sme o ňom mohli diskutovať

Pri opravných termínoch ústnej skúšky môžeme namiesto o projekte diskutovať o niektorých riešeniach individuálnych alebo skupinových zadaní, ktoré budete aj modifikovať. O tomto vás budeme v prípade potreby vopred informovať.

Obsah písomky

  • Na písomke nebudú úlohy týkajúce sa programovania v Pythone a detailov príkazov z knižníc Pandas, Matplotlib atď
  • Obsahom písomky budú preberané pojmy podľa sylabov uvedených nižšie

Sylabus k písomke

Typy dát:

  • Dlhé vs široké tabuľky
  • Typy premenných (kategorické, nominálne, ordinálne, numerické, diskrétne, spojité, pomerové, intervalové)

Základné typy grafov:

  • Bodové, čiarové, plošné, stĺpcové/pruhové, koláčové, skladané pruhové, histogram, paralelné súradnice, teplotná mapa, dot plot, strip plot, radarový graf
  • Rôzne aspekty grafov: lineárne vs. logaritmické osi, začiatok v nule, triedenie stĺpcov, small multiples

Základné štatistické pojmy:

  • Priemer, medián, modus, kvantily a kvartily, minimum, maximum, kvartilové rozpätie, rozptyl a smerodajné odchýlka odľahlé hodnoty, Pearsonov a Spearmanov korelačný koeficient
  • Vlastnosti rôznych mier: zmena pri lineárnej transformácii premennej ax+b, citlivosť na odľahlé hodnoty, vlastnosti korelačného koeficientu
  • Krabicový graf

Pokročilejšie štatistické pojmy:

  • Hustota rozdelenia pravdepodobnosti, distribučná funkcia, empirická kumulatívna distribučná funkcia, normálne rozdelenie, kernel density estimation, violin plot, zhlukovanie

Ďalšie typy grafov:

  • Word cloud, waterfall chart, Gantt chart

Ľudské vnímanie:

  • Štádia spracovania vizuálneho signálu (príznaky/features, vzory/patterns, symboly, význam a interpretácia/meaning).
  • Oko a jeho úloha v spracovaní vizuálneho signálu (sietnica, šedá a žltá škvrna, svetlocitlivé a farbocitlivé bunky, sakadické pohyby).
  • Základné preatentívne príznaky (farba, tvar, veľkosť, poloha/pohyb) a ich hierarchia.
  • Gestalt a jeho zákony (emergence, reification, multistability, invariance, proximity, similarity, closure, symmetry, continuity, common fate)
  • Ilúzie a vizuálne paradoxy (chyby pri vnímaní uhlov, dĺžok, vzdialeností, vzájomnej polohy v kontexte okolia).
  • Základné kognitívne predpojatosti a chyby v úsudku (biases).

Zásady dobrej vizualizácie:

  • Konvergentné a divergentné myslenie a ich úloha v spracovaní dát a vizualizácii.
  • Zásady (Cairo: truthful, functional, insightful, enlightening, beautiful, working).
  • Hierarchia vizuálnych atribútov, good practice vo vizualizácii.

Farby a formáty:

  • Svetlo a farby (spektrálne a imaginárne farby), oko a vnímanie farieb (tyčinky a čapíky, žltá škvrna, chyby a vrodené/získané poruchy vnímania farieb).
  • Kódovanie farieb (chromatický diagram, gamut), aditívne (RGB, HSL, HSV) a subtraktívne (CMYK, RBY) farebné modely. Farby a ich interpretácie (farby v kultúre, upriamenie pozornosti v obrázku).
  • Farebné palety a ich využitie pri vizualizácii (monochromatické, analógové, komplementárne, triády, divergentné/kvalitatívne/sekvenčné palety vo vizualizácii)
  • Reprezentácia a ukladanie dát (digitálne, online, tlač) a vhodné dátové formáty pre vizualizáciu.

Časové rady:

  • Časová zložka (cyklickosť/linearita časovej zložky)
  • Šum a chyby v meraní (detekcia, redukcia/odstránenie, chýbajúce dáta)
  • Trendy v časových dátach (stúpajúci, klesajúci, konštantný/flat) a ich vizualizácia.

Siete a hierarchie:

  • Grafy (uzly a hrany, artikulácie a mosty, kružnice/cykly), relácie (symetria, tranzitivita, kardinalita) a stromy (koreň, uzol, list)
  • Vizualizácia vzťahov (arc diagram, matice, dendrogram, tree maps)

Mapy a geografické dáta:

  • Mierka (small scale/large scale mapy a ich použitie)
  • Projekcie (vplyv na zachovanie uhlov/vzdialeností/plôch)
  • Vizualizácia geografických dát (choropleth, kartogram, isaritmické mapy)

Infografika a interaktivita:

  • Infografika vs. InfoViz (podobnosti a rozdiely)
  • Infografika (publikum a nástroje)
  • Vizuálny jazyk (vizuálne slová, gramatika, symboly)
  • Princípy a zásady tvorby infografiky (Tufteho pricípy)
  • Interaktivita (PHIGS a UX elementy)