[Strojové učenie 2011/2012]
Cvičenie 12
Preberali sme pojmy PAC-learnability a VC-dimension, podla Mitchella a opakovali
Reinforcement Learning.
Dobrovolna DU za 5 bodov: implementujte Q-learning pre lubovolnu stolovu hru pre dvoch hracov
(napr. dama, mlyn, halma, clovece nezlob se, pripadne aj jednoduchsie hry, pohyb v bludisku
a pod.). V tejto ulohe je podstatne, aby program nasiel nejaku strategiu, ktora je o kus
lepsia ako nahodna.