Strojové učenie
Poznámky - RL
pozri:
Sutton, Barto: Reinforcement Learning
(treba najma vediet formalne zadefinovat model MDP a vediet ako funguje Q-learning) a pripadne rozdiel Sarsa vs. Q-learning, rozdiel medzi V(s) a Q(s,a)