[Strojové učenie 2011/2012]

Cvičenie 12

Preberali sme pojmy PAC-learnability a VC-dimension, podla Mitchella a opakovali Reinforcement Learning. Dobrovolna DU za 5 bodov: implementujte Q-learning pre lubovolnu stolovu hru pre dvoch hracov (napr. dama, mlyn, halma, clovece nezlob se, pripadne aj jednoduchsie hry, pohyb v bludisku a pod.). V tejto ulohe je podstatne, aby program nasiel nejaku strategiu, ktora je o kus lepsia ako nahodna.