À propos de ce cours

96 701 consultations récentes
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 15 heures pour terminer
Anglais

Ce que vous allez apprendre

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Compétences que vous acquerrez

  • Artificial Intelligence (AI)
  • Machine Learning
  • Reinforcement Learning
  • Function Approximation
  • Intelligent Systems
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Niveau intermédiaire

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Approx. 15 heures pour terminer
Anglais

Offert par

Placeholder

Université de l'Alberta

Placeholder

Alberta Machine Intelligence Institute

Programme de cours : ce que vous apprendrez dans ce cours

Évaluation du contenuThumbs Up93%(15,188 évaluations)Info
Semaine
1

Semaine 1

1 heure pour terminer

Welcome to the Course!

1 heure pour terminer
4 vidéos (Total 20 min), 2 lectures
4 heures pour terminer

An Introduction to Sequential Decision-Making

4 heures pour terminer
8 vidéos (Total 46 min), 3 lectures, 2 quiz
Semaine
2

Semaine 2

3 heures pour terminer

Markov Decision Processes

3 heures pour terminer
7 vidéos (Total 36 min), 2 lectures, 2 quiz
Semaine
3

Semaine 3

3 heures pour terminer

Value Functions & Bellman Equations

3 heures pour terminer
9 vidéos (Total 56 min), 3 lectures, 2 quiz
Semaine
4

Semaine 4

4 heures pour terminer

Dynamic Programming

4 heures pour terminer
10 vidéos (Total 72 min), 3 lectures, 2 quiz

Avis

Meilleurs avis pour FUNDAMENTALS OF REINFORCEMENT LEARNING

Voir tous les avis

À propos du Spécialisation Apprentissage par renforcement

Apprentissage par renforcement

Foire Aux Questions

D'autres questions ? Visitez le Centre d'Aide pour les Étudiants.