Strojové učenie

Domáca úloha 3 - Principal Component Analysis


Metóda PCA často umožňuje zredukovať dimenziu vstupných dát, vďaka čomu sa iná metóda strojového učenia - ktorá na vstupe dostane zredukované dáta - môže naučiť požadovanú úlohu efektívnejšie.

Niekedy vopred nepoznáme vhodný počet dimenzií, na ktoré dáta chceme zredukovať, ale môžeme si pomôcť mierou Proportional Variance Explained (PVE) resp. Cummulative PVE. V mieste, kde sa graf "zalamuje" (elbow) ďalšie komponenty pridávajú už len málo novej informácie.

Úloha:

1. nájdite N-rozmerné dáta, ktorým má algoritmus redukovať dimenziu
2. vyberte si softvérovú platformu a knižnicu, ktorú použijete
3. vyskúšajte redukciu do rozličného počtu dimenzií (od 1 po N-1) pomocou PCA a pre každú vypočítajte PVE. Zobrazte graf a tabuľku PVE a kumulovaného PVE. Info je v kap. 10.2.3. v knižke G. James et.al. An Introduction to Statistical Learning - pozri LIST.

Môžete si vybrať ľubovoľnú softvérovú knižnicu.

Príklady datasetov (alebo si vyberte inú):
Odovzdajte - dáta, programy, ktoré ste použili, odkazy na knižnice, ktoré ste použili a výsledky vo forme tabulky a grafov.

Riešenie prosím odovzdajte ako jeden zip-súbor do systému LIST do 7.12.2016.