À propos de ce cours

29,098 consultations récentes
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 23 heures pour terminer
Anglais

Compétences que vous acquerrez

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 23 heures pour terminer
Anglais

Offert par

Placeholder

Université de l'Alberta

Placeholder

Alberta Machine Intelligence Institute

Programme du cours : ce que vous apprendrez dans ce cours

Évaluation du contenuThumbs Up97%(1,158 notes)Info
Semaine
1

Semaine 1

1 heure pour terminer

Welcome to the Final Capstone Course!

1 heure pour terminer
2 vidéos (Total 10 min), 2 lectures
2 vidéos
Meet your instructors!8 min
2 lectures
Reinforcement Learning Textbook10 min
Pre-requisites and Learning Objectives10 min
Semaine
2

Semaine 2

1 heure pour terminer

Milestone 1: Formalize Word Problem as MDP

1 heure pour terminer
4 vidéos (Total 23 min)
4 vidéos
Andy Barto on What are Eligibility Traces and Why are they so named?9 min
Let's Review: Markov Decision Processes6 min
Let's Review: Examples of Episodic and Continuing Tasks3 min
Semaine
3

Semaine 3

1 heure pour terminer

Milestone 2: Choosing The Right Algorithm

1 heure pour terminer
7 vidéos (Total 40 min)
7 vidéos
Let's Review: Expected Sarsa3 min
Let's Review: What is Q-learning?3 min
Let's Review: Average Reward- A New Way of Formulating Control Problems10 min
Let's Review: Actor-Critic Algorithm5 min
Csaba Szepesvari on Problem Landscape8 min
Andy and Rich: Advice for Students5 min
1 exercice pour s'entraîner
Choosing the Right Algorithm
Semaine
4

Semaine 4

1 heure pour terminer

Milestone 3: Identify Key Performance Parameters

1 heure pour terminer
4 vidéos (Total 25 min)
4 vidéos
Let's Review: Non-linear Approximation with Neural Networks4 min
Drew Bagnell on System ID + Optimal Control6 min
Susan Murphy on RL in Mobile Health7 min
1 exercice pour s'entraîner
Impact of Parameter Choices in RL40 min

Avis

Meilleurs avis pour A COMPLETE REINFORCEMENT LEARNING SYSTEM (CAPSTONE)

Voir tous les avis

À propos du Spécialisation Apprentissage par renforcement

Apprentissage par renforcement

Foire Aux Questions

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.