À propos de ce cours
196,938 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 16 heures pour terminer

Recommandé : 4-6 hours/week...

Anglais

Sous-titres : Anglais

Ce que vous allez apprendre

  • Check

    Formalize problems as Markov Decision Processes

  • Check

    Understand basic exploration methods and the exploration / exploitation tradeoff

  • Check

    Understand value functions, as a general-purpose tool for optimal decision-making

  • Check

    Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Compétences que vous acquerrez

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Les étudiants prenant part à ce Course sont
  • Data Scientists
  • Machine Learning Engineers
  • Researchers
  • Scientists
  • Risk Managers

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 16 heures pour terminer

Recommandé : 4-6 hours/week...

Anglais

Sous-titres : Anglais

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
1 heure pour terminer

Welcome to the Course!

4 vidéos (Total 20 min), 2 lectures
4 vidéos
Course Introduction5 min
Meet your instructors!8 min
Your Specialization Roadmap3 min
2 lectures
Reinforcement Learning Textbook10 min
Read Me: Pre-requisites and Learning Objectives10 min
7 heures pour terminer

The K-Armed Bandit Problem

8 vidéos (Total 46 min), 3 lectures, 2 quiz
8 vidéos
Learning Action Values4 min
Estimating Action Values Incrementally5 min
What is the trade-off?7 min
Optimistic Initial Values6 min
Upper-Confidence Bound (UCB) Action Selection5 min
Jonathan Langford: Contextual Bandits for Real World Reinforcement Learning8 min
Week 1 Summary3 min
3 lectures
Module 2 Learning Objectives10 min
Weekly Reading30 min
Chapter Summary30 min
1 exercice pour s'entraîner
Exploration/Exploitation45 min
Semaine
2
4 heures pour terminer

Markov Decision Processes

6 vidéos (Total 24 min), 2 lectures, 2 quiz
6 vidéos
Examples of MDPs4 min
The Goal of Reinforcement Learning3 min
Continuing Tasks5 min
Examples of Episodic and Continuing Tasks3 min
Week 2 Summary1 min
2 lectures
Module 3 Learning Objectives10 min
Weekly Reading30 min
1 exercice pour s'entraîner
MDPs45 min
Semaine
3
3 heures pour terminer

Value Functions & Bellman Equations

9 vidéos (Total 56 min), 3 lectures, 2 quiz
9 vidéos
Value Functions6 min
Rich Sutton and Andy Barto: A brief History of RL7 min
Bellman Equation Derivation6 min
Why Bellman Equations?5 min
Optimal Policies7 min
Optimal Value Functions5 min
Using Optimal Value Functions to Get Optimal Policies8 min
Week 3 Summary4 min
3 lectures
Module 4 Learning Objectives10 min
Weekly Reading30 min
Chapter Summary13 min
2 exercices pour s'entraîner
Value Functions and Bellman Equations45 min
Value Functions and Bellman Equations45 min
Semaine
4
6 heures pour terminer

Dynamic Programming

8 vidéos (Total 42 min), 3 lectures, 2 quiz
8 vidéos
Iterative Policy Evaluation8 min
Policy Improvement4 min
Policy Iteration8 min
Flexibility of the Policy Iteration Framework4 min
Efficiency of Dynamic Programming5 min
Week 4 Summary2 min
Congratulations!3 min
3 lectures
Module 5 Learning Objectives10 min
Weekly Reading30 min
Chapter Summary30 min
1 exercice pour s'entraîner
Dynamic Programming45 min
4.8
53 avisChevron Right

Principaux examens pour Fundamentals of Reinforcement Learning

par ABSep 7th 2019

Concepts are bit hard, but it is nice if you undersand it well, espically the bellman and dynamic programming.\n\nSometimes, visualizing the problem is hard, so need to thoroghly get prepared.

par NSAug 4th 2019

The ideal course to go with the book Reinforcement Learning: An Introduction. The quizzes and coding workshops are pitched just right in my opinion, neither too easy nor too hard.

Enseignants

Avatar

Martha White

Assistant Professor
Computing Science
Avatar

Adam White

Assistant Professor
Computing Science

À propos de Université de l'Alberta

UAlberta is considered among the world’s leading public research- and teaching-intensive universities. As one of Canada’s top universities, we’re known for excellence across the humanities, sciences, creative arts, business, engineering and health sciences....

À propos de Alberta Machine Intelligence Institute

The Alberta Machine Intelligence Institute (Amii) is home to some of the world’s top talent in machine intelligence. We’re an Alberta-based research institute that pushes the bounds of academic knowledge and guides business understanding of artificial intelligence and machine learning....

À propos du Spécialisation Apprentissage par renforcement

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Apprentissage par renforcement

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.