Lecture 2: Dynamic Programming 1
MDPs; value and Q functions; value iteration, policy iteration; operator perspectives
Cliquer le lien lecture 2 (2022).pdf pour afficher le fichier.
MDPs; value and Q functions; value iteration, policy iteration; operator perspectives
Suivre les pulsations de l'EPFL sur les réseaux sociaux
© 2023 EPFL, tous droits réservés