Strojové učenie

Poznámky - RL


pozri: Sutton, Barto: Reinforcement Learning (treba najma vediet formalne zadefinovat model MDP a vediet ako funguje Q-learning) a pripadne rozdiel Sarsa vs. Q-learning, rozdiel medzi V(s) a Q(s,a)