À propos de ce cours

148,607 consultations récentes

Résultats de carrière des étudiants

14%

ont commencé une nouvelle carrière après avoir terminé ce cours
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 15 heures pour terminer
Anglais

Ce que vous allez apprendre

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Compétences que vous acquerrez

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

Résultats de carrière des étudiants

14%

ont commencé une nouvelle carrière après avoir terminé ce cours
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 15 heures pour terminer
Anglais

Offert par

Placeholder

Université de l'Alberta

Placeholder

Alberta Machine Intelligence Institute

Programme du cours : ce que vous apprendrez dans ce cours

Évaluation du contenuThumbs Up93%(12,744 notes)Info
Semaine
1

Semaine 1

1 heure pour terminer

Welcome to the Course!

1 heure pour terminer
4 vidéos (Total 20 min), 2 lectures
4 heures pour terminer

An Introduction to Sequential Decision-Making

4 heures pour terminer
8 vidéos (Total 46 min), 3 lectures, 2 quiz
Semaine
2

Semaine 2

3 heures pour terminer

Markov Decision Processes

3 heures pour terminer
7 vidéos (Total 36 min), 2 lectures, 2 quiz
Semaine
3

Semaine 3

3 heures pour terminer

Value Functions & Bellman Equations

3 heures pour terminer
9 vidéos (Total 56 min), 3 lectures, 2 quiz
Semaine
4

Semaine 4

4 heures pour terminer

Dynamic Programming

4 heures pour terminer
10 vidéos (Total 72 min), 3 lectures, 2 quiz

Avis

Meilleurs avis pour FUNDAMENTALS OF REINFORCEMENT LEARNING

Voir tous les avis

À propos du Spécialisation Apprentissage par renforcement

Apprentissage par renforcement

Foire Aux Questions

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.