EE-618: Lecture 3

Model-free policy-based and value-based methods; Monte Carlo (MC) method and temporal difference (TD) learning.

Cliquer le lien lecture 3 (2022).pdf pour afficher le fichier.

Suivre les pulsations de l'EPFL sur les réseaux sociaux