À propos de ce cours
72,380 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 39 heures pour terminer

Recommandé : 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

Anglais

Sous-titres : Anglais, Coréen

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 39 heures pour terminer

Recommandé : 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

Anglais

Sous-titres : Anglais, Coréen

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
5 heures pour terminer

Intro: why should i care?

13 vidéos (Total 84 min), 8 lectures, 3 quiz
13 vidéos
Decision process & applications6 min
Markov Decision Process5 min
Crossentropy method9 min
Approximate crossentropy method5 min
More on approximate crossentropy method6 min
Evolution strategies: core idea6 min
Evolution strategies: math problems5 min
Evolution strategies: log-derivative trick8 min
Evolution strategies: duct tape6 min
Blackbox optimization: drawbacks4 min
8 lectures
What you're getting into1 min
Setting up course environment10 min
Note: this course vs github course1 min
Lecture slides10 min
Course teaser placeholder10 min
Primers1 min
About honors track1 min
Extras10 min
Semaine
2
3 heures pour terminer

At the heart of RL: Dynamic Programming

5 vidéos (Total 54 min), 2 lectures, 4 quiz
5 vidéos
Policy: evaluation & improvement10 min
Policy and value iteration8 min
2 lectures
Advanced Reward Design10 min
Discrete Stochastic Dynamic Programming10 min
3 exercices pour s'entraîner
Reward design8 min
Optimality in RL10 min
Policy Iteration14 min
Semaine
3
5 heures pour terminer

Model-free methods

6 vidéos (Total 47 min), 1 lecture, 4 quiz
6 vidéos
Footnote: Monte-Carlo vs Temporal Difference2 min
Accounting for exploration. Expected Value SARSA.11 min
On-policy vs off-policy; Experience replay7 min
1 lecture
Extras10 min
1 exercice pour s'entraîner
Model-free reinforcement learning10 min
Semaine
4
5 heures pour terminer

Approximate Value Based Methods

9 vidéos (Total 104 min), 3 lectures, 5 quiz
9 vidéos
DQN – bird's eye view9 min
DQN – the internals9 min
DQN: statistical issues6 min
Double Q-learning6 min
More DQN tricks10 min
Partial observability17 min
3 lectures
TD vs MC10 min
Extras10 min
DQN follow-ups10 min
3 exercices pour s'entraîner
MC & TD8 min
SARSA and QLeaning8 min
DQN12 min
4.1
65 avisChevron Right

33%

a commencé une nouvelle carrière après avoir terminé ces cours

56%

a bénéficié d'un avantage concret dans sa carrière grâce à ce cours

33%

a obtenu une augmentation de salaire ou une promotion

Principaux examens pour Practical Reinforcement Learning

par AKMay 28th 2019

This is one of the Best Course available on Reinforcement Learning. I have gone through various study material but the depth and practical knowledge given in the course is awesome.

par VOMar 17th 2019

Well Prepared and taught course.. Will highly recommend as the primer for reinforcement learning

Enseignants

Avatar

Pavel Shvechikov

Researcher at HSE and Sberbank AI Lab
HSE Faculty of Computer Science
Avatar

Alexander Panin

Lecturer
HSE Faculty of Computer Science

À propos de Université nationale de recherche, École des hautes études en sciences économiques

National Research University - Higher School of Economics (HSE) is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communicamathematics, engineering, and more. Learn more on www.hse.ru...

À propos du Spécialisation Apprentissage automatique avancé

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
Apprentissage automatique avancé

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.