À propos de ce cours

114,818 consultations récentes
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Approx. 22 heures pour terminer
Anglais

Compétences que vous acquerrez

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Approx. 22 heures pour terminer
Anglais

Offert par

Placeholder

Université de l'Alberta

Placeholder

Alberta Machine Intelligence Institute

Programme du cours : ce que vous apprendrez dans ce cours

Évaluation du contenuThumbs Up92%(2,614 notes)Info
Semaine
1

Semaine 1

1 heure pour terminer

Welcome to the Course!

1 heure pour terminer
2 vidéos (Total 10 min), 2 lectures
2 vidéos
Meet your instructors!8 min
2 lectures
Reinforcement Learning Textbook10 min
Read Me: Pre-requisites and Learning Objectives10 min
3 heures pour terminer

Monte Carlo Methods for Prediction & Control

3 heures pour terminer
11 vidéos (Total 58 min), 3 lectures, 2 quiz
11 vidéos
Using Monte Carlo for Prediction6 min
Using Monte Carlo for Action Values2 min
Using Monte Carlo methods for generalized policy iteration2 min
Solving the Blackjack Example3 min
Epsilon-soft policies5 min
Why does off-policy learning matter?4 min
Importance Sampling4 min
Off-Policy Monte Carlo Prediction5 min
Emma Brunskill: Batch Reinforcement Learning12 min
Week 1 Summary3 min
3 lectures
Module 1 Learning Objectives10 min
Weekly Reading40 min
Chapter Summary40 min
1 exercice pour s'entraîner
Graded Quiz30 min
Semaine
2

Semaine 2

5 heures pour terminer

Temporal Difference Learning Methods for Prediction

5 heures pour terminer
6 vidéos (Total 37 min), 2 lectures, 2 quiz
6 vidéos
Rich Sutton: The Importance of TD Learning6 min
The advantages of temporal difference learning5 min
Comparing TD and Monte Carlo5 min
Andy Barto and Rich Sutton: More on the History of RL12 min
Week 2 Summary2 min
2 lectures
Module 2 Learning Objectives10 min
Weekly Reading40 min
1 exercice pour s'entraîner
Practice Quiz30 min
Semaine
3

Semaine 3

6 heures pour terminer

Temporal Difference Learning Methods for Control

6 heures pour terminer
9 vidéos (Total 30 min), 3 lectures, 2 quiz
9 vidéos
Sarsa in the Windy Grid World3 min
What is Q-learning?3 min
Q-learning in the Windy Grid World3 min
How is Q-learning off-policy?4 min
Expected Sarsa3 min
Expected Sarsa in the Cliff World3 min
Generality of Expected Sarsa1 min
Week 3 Summary2 min
3 lectures
Module 3 Learning Objectives10 min
Weekly Reading40 min
Chapter summary40 min
1 exercice pour s'entraîner
Practice Quiz30 min
Semaine
4

Semaine 4

7 heures pour terminer

Planning, Learning & Acting

7 heures pour terminer
11 vidéos (Total 47 min), 4 lectures, 2 quiz
11 vidéos
Comparing Sample and Distribution Models2 min
Random Tabular Q-planning3 min
The Dyna Architecture5 min
The Dyna Algorithm5 min
Dyna & Q-learning in a Simple Maze5 min
What if the model is inaccurate?3 min
In-depth with changing environments5 min
Drew Bagnell: self-driving, robotics, and Model Based RL7 min
Week 4 Summary1 min
Congratulations!2 min
4 lectures
Module 4 Learning Objectives10 min
Weekly Reading40 min
Chapter Summary40 min
Text Book Part 1 Summary40 min
1 exercice pour s'entraîner
Practice Assessment45 min

Avis

Meilleurs avis pour SAMPLE-BASED LEARNING METHODS

Voir tous les avis

À propos du Spécialisation Apprentissage par renforcement

Apprentissage par renforcement

Foire Aux Questions

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.