Lecture 7
Reading Material:
- Chapter 13 in S. Sutton, and G. Barto, Reinforcement Learning: An Introduction, MIT Press, 2018.
[7] Sutton et al, Policy Gradient Methods For Reinforcement learning with function approximation, NeurIPS, 2000.
Cliquer le lien lecture 7.pdf pour afficher le fichier.