À propos de ce cours
93,531 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Approx. 43 heures pour terminer

Recommandé : 8 hours/week...

Russe

Sous-titres : Russe

Compétences que vous acquerrez

Random ForestPython ProgrammingMachine LearningSupervised Learning

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Approx. 43 heures pour terminer

Recommandé : 8 hours/week...

Russe

Sous-titres : Russe

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
9 heures pour terminer

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей.

...
13 vidéos (Total 82 min), 8 lectures, 8 quiz
13 vidéos
Как устроена специализация, и зачем ее проходить3 min
МФТИ1 min
Знакомство с машинным обучением11 min
Обучение на размеченных данных5 min
Обучение без учителя5 min
Признаки в машинном обучении8 min
Линейные модели в задачах регрессии9 min
Обучение линейной регрессии6 min
Градиентный спуск для линейной регрессии7 min
Стохастический градиентный спуск4 min
Линейная классификация6 min
Функции потерь в задачах классификации6 min
8 lectures
Формат специализации и получение сертификата10 min
Немного о Yandex10 min
МФТИ10 min
Forum&Chat10 min
Слайды к лекциям10 min
Конспект10 min
Слайды к лекциям10 min
Конспект10 min
6 exercices pour s'entraîner
Основные термины в машинном обучении6 min
Типы задач в машинном обучении6 min
Машинное обучение: задачи и признаки12 min
Линейная регрессия4 min
Градиентный спуск4 min
Линейные модели8 min
Semaine
2
9 heures pour terminer

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных.

...
14 vidéos (Total 126 min), 9 lectures, 8 quiz
14 vidéos
Регуляризация7 min
Оценивание качества алгоритмов7 min
Сравнение алгоритмов и выбор гиперпараметров4 min
Метрики качества в задачах регрессии10 min
Метрики качества классификации4 min
Точность и полнота8 min
Объединение точности и полноты5 min
Качество оценок принадлежности классу12 min
Встроенные датасеты. Sklearn.datasets15 min
Кросс-валидация. Sklearn.cross_validation9 min
Линейные модели. Sklearn.linear_model. Классификация10 min
Линейные модели. Sklearn.linear_model. Регрессия7 min
Метрики качества. Sklearn.metrics13 min
9 lectures
Слайды к лекциям10 min
Конспект10 min
Слайды к лекциям10 min
Конспект10 min
Встроенные датасеты. Sklearn.datasets (ipython notebook)10 min
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10 min
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10 min
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10 min
Метрики качества. Sklearn.metrics (ipython notebook)10 min
6 exercices pour s'entraîner
Проблема переобучения6 min
Проблема переобучения и борьба с ней10 min
Как измерить качество алгоритма?6 min
Метрики качества10 min
Встроенные датасеты и кросс-валидация8 min
Введение в scikit-learn10 min
Semaine
3
7 heures pour terminer

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn.

...
14 vidéos (Total 97 min), 7 lectures, 7 quiz
14 vidéos
Метод максимального правдоподобия4 min
Регрессия как максимизация правдоподобия2 min
Регрессия как оценка среднего4 min
Регуляризация8 min
Задача оценивания вероятностей и логистическая регрессия8 min
Масштабирование признаков6 min
Спрямляющие пространства5 min
Работа с категориальными признаками4 min
Несбалансированные данные5 min
Многоклассовая классификация4 min
Подбор параметров по сетке. Sklearn.grid_search9 min
Задача: bike sharing demand15 min
Задача: bike sharing demand. Продолжение13 min
7 lectures
Слайды к лекциям10 min
Конспект10 min
Слайды к лекциям10 min
Конспект10 min
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10 min
Задача Bike Sharing Demand (ipython notebook)10 min
Задача Bike Sharing Demand. Продолжение (ipython notebook)10 min
6 exercices pour s'entraîner
Метод максимального правдоподобия6 min
Линейные модели: статистический взгляд14 min
Линейные модели: подготовка признаков6 min
Линейные модели: практические аспекты6 min
Подбор параметров по сетке6 min
Анализ данных в scikit-learn12 min
Semaine
4
10 heures pour terminer

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе.

...
17 vidéos (Total 114 min), 10 lectures, 8 quiz
17 vidéos
Обучение решающих деревьев6 min
Критерии информативности7 min
Критерии останова и стрижка деревьев4 min
Решающие деревья и категориальные признаки8 min
Решающие деревья в sklearn10 min
Композиции деревьев6 min
Смещение и разброс9 min
Случайные леса6 min
Трюки со случайными лесами4 min
Случайные леса в sklearn7 min
Композиции простых алгоритмов5 min
Градиентный бустинг7 min
Борьба с переобучением в градиентном бустинге6 min
Градиентный бустинг для регрессии и классификации4 min
Градиентный бустинг над решающими деревьями5 min
Градиентный бустинг в XGBoost5 min
10 lectures
Решающие деревья в sklearn (ipython notebook)10 min
Слайды к лекциям10 min
Конспект10 min
Случайные леса в sklearn (ipython notebook)10 min
Слайды к лекциям10 min
Конспект10 min
XGBoost10 min
Градиентный бустинг в XGBoost (ipython notebook)10 min
Слайды к лекциям10 min
Конспект10 min
6 exercices pour s'entraîner
Построение решающих деревьев8 min
Решающие деревья14 min
Бэггинг6 min
Композиции и случайные леса8 min
Обучение композиций и градиентный бустинг4 min
Градиентный бустинг: обучение и практические аспекты8 min
4.8
249 avisChevron Right

50%

a commencé une nouvelle carrière après avoir terminé ces cours

58%

a bénéficié d'un avantage concret dans sa carrière grâce à ce cours

33%

a obtenu une augmentation de salaire ou une promotion

Meilleurs avis

par RNJan 21st 2017

Один из лучших курсов по обучению на размеченных данных. Немного расстраивали несбалансированность сложности домашних заданий и промежуточных проверок правильности подготовки данных в заданиях.

par YDAug 8th 2018

Отличный курс. Меньше чем за месяц появилось базовое понимание обучения на размеченных данных и принципов ML.\n\nМного практики, грамотные преподаватели и качественные pdf сделали своё дело.

Enseignants

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

À propos de Institut de physique et de technologie de Moscou

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

À propos de Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

À propos de la Spécialisation Машинное обучение и анализ данных

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.