Strojové učenie - Machine Learning - projekty
Zima 2011/2012
Projekt si môžete navrhnúť buď vlastný, alebo vybrať jeden z uvedených.
Projekt by nemal byť iba triviálna aplikácia niektorého algoritmu na
modelový príklad, ale zadanie, ktoré dopredu nepredpokladá konkrétny
algoritmus. Zadanie je teda formulované ako úloha v prirodzenom jazyku
celkom mimo terminológie Machine Learning. Vašou úlohou potom je zvoliť
vhodný algoritmus, predspracovanie dát, vyhodnotenie a štatistické
spracovanie výsledkov.
Projekt sa odovzdáva ako zdrojáky + dáta + krátky report: popis myšlienky, algoritmov, použitých dát, výsledkov, diskusia, záver
Námety na zadania:
- Množina textov, cieľom je klasifikovať tému, ktorej sa text týka
- Časová postupnosť udalostí z nejakej konečnej množiny popisujúcej typy udalostí, cieľom je predpovedať čas a typ nasledujúcej udalosti
- Množina fotografií, cieľom je vedieť klasifikovať fotografie na typ záberu: blízky portrét, krajinka, interier, nocny zaber, pohľad proti slnku, atď. jednotlivé triedy sa môžu aj prekrývať
- Určenie účelu dokumentu - program dostane plain text dokument a má určiť o aký typ dokumentu ide. Príkladmi môžu byť: poviedka, zákon, cenník, objednávka, faktúra, slovník, pozvánka, reklama, odborný článok na konferenciu, populárny článok, atď.
- Lokalizácia robota pravdepodobnostnými metódami
- Automatické rozdelenie mailových adries do skupín podľa spôsobu interakcie (frekvencia, používané slová v správe, dĺžky správ, spoloční adresáti...) program okrem zaradenia do skupiny poskytne aj vysvetlenie prečo tak urobil
- Aplikácia do Facebooku, ktorá spracuje informácie o priateľoch a ich záujmoch a rozdelí ich do skupín podľa ich záujmov, frekvencie interakcie, typov interakcie, prekrývajúcich sa záujmov... vyžaduje si pouťiť facebook api, program by mal vedieť rozdeľovať do skupín podľa viacerých kritérii
- Rozlíšenie medzi bitmapami so zdravým ovocím, nezrelým ovocím a pokazeným ovocím. Stačí, keď program bude brať do úvahy jeden druh ovocia.
- Ohodnotenie zvukových záznamov podľa typu skladby - vážna hudba, rock, rozhovor, monológ, ... - vyžaduje sa frekvenčná analýza, hľadanie súvislých úsekov ktoré tvoria jednotlivé časti zvukovej stopy.
- Ohodnotenie video záznamov podľa typu videa - futbal, hokej, tenis, koncert, správy, inscenácia, atď.
Samozrejme váš program dopredu nesmie vedieť informácie, ktoré sa má naučiť, čiže nemôžete do programu niekam vložiť, že napr. cenník obsahuje vela položiek a čísel, na to má práve prísť príslušný učiaci sa algoritmus.
Zoznam riešených projektov:
- Hľadanie vhodných rozvrhov pre nejakú fakultu evolučnými algoritmami, porovanie rôznych spôsobov evolúcie zahŕňajúce feasible a unfeasible rozvrhy v populácii, štatistické vyhodnotenie, D.Zajacová
- Klasifikácia zvukov hudobných nástrojov, A.Péres
- Klasifikácia emócií v ľudských tvárach, PCA+NN, M.Pecháč
- Rozlíšenie medzi bitmapami so zdravým ovocím, nezrelým ovocím a pokazeným ovocím. Stačí, keď program bude brať do úvahy jeden druh ovocia, M.Ďatko
- Automatické rozdelenie mailových adries do skupín, V.Magyar
- Klasifikácia polarity temperamentu na slovenskom diskusnom fóre, A.Okruhlica