À propos de ce cours
4.8
1,516 notes
221 avis
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Niveau intermédiaire

Heures pour terminer

Approx. 44 heures pour terminer

Recommandé : 8 hours/week...
Langues disponibles

Russe

Sous-titres : Russe

Compétences que vous acquerrez

Random ForestPython ProgrammingMachine LearningSupervised Learning
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Niveau intermédiaire

Heures pour terminer

Approx. 44 heures pour terminer

Recommandé : 8 hours/week...
Langues disponibles

Russe

Sous-titres : Russe

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
Heures pour terminer
9 heures pour terminer

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
Reading
13 vidéos (Total 82 min), 8 lectures, 8 quiz
Video13 vidéos
Как устроена специализация, и зачем ее проходить3 min
МФТИ1 min
Знакомство с машинным обучением11 min
Обучение на размеченных данных5 min
Обучение без учителя5 min
Признаки в машинном обучении8 min
Линейные модели в задачах регрессии9 min
Обучение линейной регрессии6 min
Градиентный спуск для линейной регрессии7 min
Стохастический градиентный спуск4 min
Линейная классификация6 min
Функции потерь в задачах классификации6 min
Reading8 lectures
Формат специализации и получение сертификата10 min
Немного о Yandex10 min
МФТИ10 min
Forum&Chat10 min
Слайды к лекциям10 min
Конспект10 min
Слайды к лекциям10 min
Конспект10 min
Quiz6 exercices pour s'entraîner
Основные термины в машинном обучении6 min
Типы задач в машинном обучении6 min
Машинное обучение: задачи и признаки12 min
Линейная регрессия4 min
Градиентный спуск4 min
Линейные модели8 min
Semaine
2
Heures pour terminer
9 heures pour terminer

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
Reading
14 vidéos (Total 126 min), 9 lectures, 8 quiz
Video14 vidéos
Регуляризация7 min
Оценивание качества алгоритмов7 min
Сравнение алгоритмов и выбор гиперпараметров4 min
Метрики качества в задачах регрессии10 min
Метрики качества классификации4 min
Точность и полнота8 min
Объединение точности и полноты5 min
Качество оценок принадлежности классу12 min
Встроенные датасеты. Sklearn.datasets15 min
Кросс-валидация. Sklearn.cross_validation9 min
Линейные модели. Sklearn.linear_model. Классификация10 min
Линейные модели. Sklearn.linear_model. Регрессия7 min
Метрики качества. Sklearn.metrics13 min
Reading9 lectures
Слайды к лекциям10 min
Конспект10 min
Слайды к лекциям10 min
Конспект10 min
Встроенные датасеты. Sklearn.datasets (ipython notebook)10 min
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10 min
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10 min
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10 min
Метрики качества. Sklearn.metrics (ipython notebook)10 min
Quiz6 exercices pour s'entraîner
Проблема переобучения6 min
Проблема переобучения и борьба с ней10 min
Как измерить качество алгоритма?6 min
Метрики качества10 min
Встроенные датасеты и кросс-валидация8 min
Введение в scikit-learn10 min
Semaine
3
Heures pour terminer
7 heures pour terminer

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
Reading
14 vidéos (Total 97 min), 8 lectures, 7 quiz
Video14 vidéos
Метод максимального правдоподобия4 min
Регрессия как максимизация правдоподобия2 min
Регрессия как оценка среднего4 min
Регуляризация8 min
Задача оценивания вероятностей и логистическая регрессия8 min
Масштабирование признаков6 min
Спрямляющие пространства5 min
Работа с категориальными признаками4 min
Несбалансированные данные5 min
Многоклассовая классификация4 min
Подбор параметров по сетке. Sklearn.grid_search9 min
Задача: bike sharing demand15 min
Задача: bike sharing demand. Продолжение13 min
Reading8 lectures
Слайды к лекциям10 min
Конспект10 min
Слайды к лекциям10 min
Конспект10 min
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10 min
Задача Bike Sharing Demand (ipython notebook)10 min
Задача Bike Sharing Demand. Продолжение (ipython notebook)10 min
Практика Machine Learning10 min
Quiz6 exercices pour s'entraîner
Метод максимального правдоподобия6 min
Линейные модели: статистический взгляд14 min
Линейные модели: подготовка признаков6 min
Линейные модели: практические аспекты6 min
Подбор параметров по сетке6 min
Анализ данных в scikit-learn12 min
Semaine
4
Heures pour terminer
10 heures pour terminer

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
Reading
17 vidéos (Total 114 min), 10 lectures, 8 quiz
Video17 vidéos
Обучение решающих деревьев6 min
Критерии информативности7 min
Критерии останова и стрижка деревьев4 min
Решающие деревья и категориальные признаки8 min
Решающие деревья в sklearn10 min
Композиции деревьев6 min
Смещение и разброс9 min
Случайные леса6 min
Трюки со случайными лесами4 min
Случайные леса в sklearn7 min
Композиции простых алгоритмов5 min
Градиентный бустинг7 min
Борьба с переобучением в градиентном бустинге6 min
Градиентный бустинг для регрессии и классификации4 min
Градиентный бустинг над решающими деревьями5 min
Градиентный бустинг в XGBoost5 min
Reading10 lectures
Решающие деревья в sklearn (ipython notebook)10 min
Слайды к лекциям10 min
Конспект10 min
Случайные леса в sklearn (ipython notebook)10 min
Слайды к лекциям10 min
Конспект10 min
XGBoost10 min
Градиентный бустинг в XGBoost (ipython notebook)10 min
Слайды к лекциям10 min
Конспект10 min
Quiz6 exercices pour s'entraîner
Построение решающих деревьев8 min
Решающие деревья14 min
Бэггинг6 min
Композиции и случайные леса8 min
Обучение композиций и градиентный бустинг4 min
Градиентный бустинг: обучение и практические аспекты8 min
4.8
221 avisChevron Right
Orientation de carrière

71%

a commencé une nouvelle carrière après avoir terminé ces cours
Avantage de carrière

75%

a bénéficié d'un avantage concret dans sa carrière grâce à ce cours
Promotion de carrière

33%

a obtenu une augmentation de salaire ou une promotion

Meilleurs avis

par ZAJul 21st 2017

Курс просто фантастика. Отличное преподавание, много нового. Столько что еще переваривать и переваривать. Немного сжата последняя неделя и на нейронные сети нужно больше времени. Спасибо.

par ADApr 29th 2018

Хороший курс, много времени уделено объяснению теории. На мой взгляд - лучше параллельно читать с "The elements of statistical learning", там некоторые моменты подробнее объясняются.

Enseignants

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

À propos de Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

À propos de Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

À propos de la Spécialisation Машинное обучение и анализ данных

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.