Strojové učenie
Domáca úloha 3 - Principal Component Analysis
Metóda PCA často umožňuje zredukovať dimenziu vstupných dát, vďaka
čomu sa iná metóda strojového učenia - ktorá na vstupe dostane zredukované
dáta - môže naučiť požadovanú úlohu efektívnejšie.
Niekedy vopred nepoznáme vhodný počet dimenzií, na ktoré dáta chceme
zredukovať, ale môžeme si pomôcť mierou Proportional Variance Explained (PVE) resp. Cummulative PVE. V mieste, kde sa graf "zalamuje" (elbow) ďalšie komponenty pridávajú už len málo novej informácie.
Úloha:
1. nájdite N-rozmerné dáta, ktorým má algoritmus redukovať dimenziu
2. vyberte si softvérovú platformu a knižnicu, ktorú použijete
3. vyskúšajte redukciu do rozličného počtu dimenzií (od 1 po N-1) pomocou PCA a pre každú vypočítajte PVE. Zobrazte graf a tabuľku PVE a kumulovaného PVE. Info je v kap. 10.2.3. v knižke G. James et.al. An Introduction to Statistical Learning - pozri LIST.
Môžete si vybrať ľubovoľnú softvérovú knižnicu.
Príklady datasetov (alebo si vyberte inú):
Odovzdajte - dáta, programy, ktoré ste použili, odkazy na knižnice, ktoré ste použili a výsledky vo forme tabulky a grafov.
Riešenie prosím odovzdajte ako jeden zip-súbor do systému LIST do 7.12.2016.