Lecture 5
Policy gradient methods II: NPG, Sample Based NPG, TRPO, exploration in policy gradients
Cliquer le lien lecture 5 (2023).pdf pour afficher le fichier.
Policy gradient methods II: NPG, Sample Based NPG, TRPO, exploration in policy gradients
Suivre les pulsations de l'EPFL sur les réseaux sociaux
© 2023 EPFL, tous droits réservés