Lecture 3
Model-free policy-based and value-based methods; Monte Carlo (MC) method and temporal difference (TD) learning.
Cliquer le lien lecture 3 (2022).pdf pour afficher le fichier.
Model-free policy-based and value-based methods; Monte Carlo (MC) method and temporal difference (TD) learning.
Suivre les pulsations de l'EPFL sur les réseaux sociaux
© 2023 EPFL, tous droits réservés