Strojové učenie
Projekt
Záverečný projekt je domáca úloha, v ktorej využijete metódy strojového učenia. Čím realistickejší projekt, tým lepšie, ideálny scenár je, že nájdete nejakú reálnu prevádzku, kde sú k dispozícii skutočné dáta a kde je potenciál optimalizovať procesy, ak sa v nich urobí analýza údajov. Napríklad, nejaká spoločnosť dodáva na trh rôzne značky zubných pást cez sieť maloobchodov a hypermarketov a zaujímalo by ich ako sa mení predaj podľa ich rôznych kampaní, cenovej politiky, chuťových prímesí, ktoré používajú a prvkov, ktoré zatraktívňujú balenie, poskytnú vám údaje v nejakej podobe, vy ich najskôr predspracujete, v rôznych vizualizáciách ich analyzujete, potom navrhnete model, ktorý sa bude schopný naučiť predikovať predaj na základe atribútov, interpretujete a overíte výsledok na validačnej množine... V prípade, že využijete dáta z predmetu Praktikum, tak to najskôr treba prekonzultovať s vyučujúcim Dr. Gavuliakom, aby zladil vašu prácu medzi oboma zadaniami. Pekné príklady nájdete aj v učebniciach strojového učenia - väčšinou obsahujú v záverečných kapitolách "case studies". Možno nenájdete realistický príklad, ale v takom prípade si ho môžete skonštruovať a postaviť sa sami do role zákazníka. Štatistické úrady v mnohých krajinách majú na webe vyvesené údaje zo sčítaní ľudu, ekonomické parametre krajiny, alebo inak zozbierané údaje, ktoré je možné voľne získať a stanoviť si cieľový atribút, ktorý chcete predikovať. Dobrý projekt zväčša využije nejakú unsupervised metódu na predspracovanie údajov pre nejakú inú supervised metódu, ale nie je to nutné - akákoľvek práca v oblasti strojového učenia, ktorá nie je priamou triviálnou aplikáciou nejakej metódy (ako býva v domácich úlohách), vyhovuje.
Projekt má obsahovať:
- návrh projektu - ktorý sa odovzdáva do LISTu 30.11. a je v rozsahu max. 1 strany A4 a obsahuje plán, čo by ste v projekte chceli dosiahnuť - aké dáta použijete, odkiaľ pochádzajú, ako ich plánujete spracovať a čo sa má systém naučiť. (ak sa od tohto plánu neskôr odkloníte, tak to zdôvodníte vo výslednej dokumentácii); do 5.12. dostanete spätnú väzbu k vášmu návrhu projektu
- dáta, ktoré ste použili (pôvodné, predspracované, výstupné a akékoľvek iné)
- všetky zdrojové kódy
- súbor readme.txt, kde bude napísané, ako sa zdrojové kódy dajú skompilovať a čo k tomu všetko treba a ako sa dajú použiť na zreplikovanie experimentu
- dokumentáciu (pdf), kde bude vysvetlené čo ste riešili, ako ste to riešili, ako ste spracovali údaje, ako ste nastavili parametre použitých metód, aké výsledky ste dosiahli a čo z toho usudzujete, v dokumente by výsledky mali byť nejak prezentované - napr. grafmi, tabuľkami
Výsledný projekt (zip) odovzdajte do tejto zostavy ako druhý submit - predtým, ako pôjdete na skúšku, pred udelením výslednej známky ho spoločne prediskutujeme. Akceptovaný projekt (10 bodov z 20) je podmienkou ukončenia predmetu.
Kto si nenájde vlastnú tému, pošle mi mail (petrovic@fmph.uniba.sk) a ja mu nejakú určím.