Lecture 6
Policy gradient II : rates, gradient dominance property, distributions mismatch coefficients, natural policy gradient.
Cliquer le lien Lecture 6.pdf pour afficher le fichier.
Policy gradient II : rates, gradient dominance property, distributions mismatch coefficients, natural policy gradient.
Suivre les pulsations de l'EPFL sur les réseaux sociaux
© 2023 EPFL, tous droits réservés