À propos de ce cours

55,869 consultations récentes

Résultats de carrière des étudiants

33%

ont commencé une nouvelle carrière après avoir terminé ce cours

56%

ont bénéficié d'un avantage concret dans leur carrières grâce à ce cours

33%

a obtenu une augmentation de salaire ou une promotion

Certificat partageable

Obtenez un Certificat lorsque vous terminez

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 38 heures pour terminer

Recommandé : 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

Anglais

Sous-titres : Anglais, Coréen

Résultats de carrière des étudiants

33%

ont commencé une nouvelle carrière après avoir terminé ce cours

56%

ont bénéficié d'un avantage concret dans leur carrières grâce à ce cours

33%

a obtenu une augmentation de salaire ou une promotion

Certificat partageable

Obtenez un Certificat lorsque vous terminez

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 38 heures pour terminer

Recommandé : 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

Anglais

Sous-titres : Anglais, Coréen

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1

Semaine 1

5 heures pour terminer

Intro: why should I care?

5 heures pour terminer
14 vidéos (Total 85 min), 6 lectures, 3 quiz
14 vidéos
Why should you care9 min
Reinforcement learning vs all3 min
Multi-armed bandit4 min
Decision process & applications6 min
Markov Decision Process5 min
Crossentropy method9 min
Approximate crossentropy method5 min
More on approximate crossentropy method6 min
Evolution strategies: core idea6 min
Evolution strategies: math problems5 min
Evolution strategies: log-derivative trick8 min
Evolution strategies: duct tape6 min
Blackbox optimization: drawbacks4 min
6 lectures
About the University10 min
What you're getting into1 min
FAQ10 min
Primers1 min
About honors track1 min
Extras10 min
Semaine
2

Semaine 2

3 heures pour terminer

At the heart of RL: Dynamic Programming

3 heures pour terminer
5 vidéos (Total 54 min), 2 lectures, 4 quiz
5 vidéos
State and Action Value Functions13 min
Measuring Policy Optimality6 min
Policy: evaluation & improvement10 min
Policy and value iteration8 min
2 lectures
Advanced Reward Design10 min
Discrete Stochastic Dynamic Programming10 min
3 exercices pour s'entraîner
Reward design8 min
Optimality in RL10 min
Policy Iteration14 min
Semaine
3

Semaine 3

5 heures pour terminer

Model-free methods

5 heures pour terminer
6 vidéos (Total 47 min), 1 lecture, 4 quiz
6 vidéos
Monte-Carlo & Temporal Difference; Q-learning8 min
Exploration vs Exploitation8 min
Footnote: Monte-Carlo vs Temporal Difference2 min
Accounting for exploration. Expected Value SARSA11 min
On-policy vs off-policy; Experience replay7 min
1 lecture
Extras10 min
1 exercice pour s'entraîner
Model-free reinforcement learning10 min
Semaine
4

Semaine 4

5 heures pour terminer

Approximate Value Based Methods

5 heures pour terminer
9 vidéos (Total 104 min), 3 lectures, 5 quiz
9 vidéos
Loss functions in value based RL11 min
Difficulties with Approximate Methods15 min
DQN – bird's eye view9 min
DQN – the internals9 min
DQN: statistical issues6 min
Double Q-learning6 min
More DQN tricks10 min
Partial observability17 min
3 lectures
TD vs MC10 min
Extras10 min
DQN follow-ups10 min
3 exercices pour s'entraîner
MC & TD8 min
SARSA and Q-learning8 min
DQN12 min

Avis

Meilleurs avis pour PRACTICAL REINFORCEMENT LEARNING
Voir tous les avis

À propos de Université nationale de recherche, École des hautes études en sciences économiques

National Research University - Higher School of Economics (HSE) is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communicamathematics, engineering, and more. Learn more on www.hse.ru...

À propos du Spécialisation Apprentissage automatique avancé

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
Apprentissage automatique avancé

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.