À propos de ce cours
4.7
869 notes
95 avis
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Niveau intermédiaire

Heures pour terminer

Approx. 25 heures pour terminer

Recommandé : 4 недели обучения, через 3-5 часа / неделю...
Langues disponibles

Russe

Sous-titres : Russe...

Compétences que vous acquerrez

Topic ModelData Clustering AlgorithmsMachine LearningData Visualization (DataViz)
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire

Niveau intermédiaire

Heures pour terminer

Approx. 25 heures pour terminer

Recommandé : 4 недели обучения, через 3-5 часа / неделю...
Langues disponibles

Russe

Sous-titres : Russe...

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
Heures pour terminer
7 heures pour terminer

Кластеризация

Добро пожаловать на курс "Поиск структуры в данных"! В этом курсе вы узнаете про задачи машинного обучения, в которых требуется не предсказать целевую переменную, а найти некоторые внутренние закономерности в данных — например, сгруппировать объекты по схожести, или определить наиболее важные признаки. В первом модуле мы изучим задачу кластеризации, направленную на поиск групп близких объектов. Вы узнаете про основные подходы к её решению, а также узнаете, как можно выбрать хороший алгоритм кластеризации, не имея правильных ответов....
Reading
15 vidéos (Total 109 min), 8 lectures, 5 quiz
Video15 vidéos
Как устроена специализация, и зачем ее проходить3 min
Структура уроков1 min
Задача кластеризации4 min
Примеры задач кластеризации5 min
Знакомство с методами кластеризации9 min
Пример: кластеризация текстов по теме13 min
Выбор метода кластеризации7 min
МФТИ1 min
Метод K средних (K-Means)10 min
Expectation Maximization (EM-алгоритм)9 min
Агломеративная иерархическая кластеризация12 min
Графовые методы кластеризации4 min
Методы, основанные на плотности6 min
Оценка качества и рекомендации по решению задачи кластеризации13 min
Reading8 lectures
Блокнот из примера кластеризации текстов20 min
Слайды к лекциям10 min
Конспект10 min
Немного о Yandex10 min
МФТИ10 min
Forum&Chat10 min
Слайды к лекциям10 min
Конспект10 min
Quiz4 exercices pour s'entraîner
Знакомство с кластеризацией6 min
Введение в кластеризацию8 min
Некоторые методы кластеризации8 min
Подробнее о методах кластеризации12 min
Semaine
2
Heures pour terminer
6 heures pour terminer

Понижение размерности и матричные разложения

В предыдущем модуле мы обсуждали, как кластеризовать объекты, а в этом модуле займёмся признаками. Нередко возникают ситуации, в которых далеко не все признаки нужны для решения задачи — или же нужны все, но при этом их слишком много. В этом случае нужно перейти в новое признаковое пространство меньшей размерности. Для этого можно либо отбирать наиболее важные признаки, либо порождать новые на основе исходных — мы обсудим оба подхода. В частности, мы разберёмся с методом главных компонент, который используется в самых разных задачах машинного обучения. Затем мы перейдём к матричным разложениям — мы изучим несколько методов, позволяющих получить приближение исходной матрицы в виде произведения нескольких матриц меньшей размерности. Такая аппроксимация часто используется в задачах машинного обучения, например, для понижения размерности данных, восстановления пропущенных значений в матрицах и построения рекомендательных систем....
Reading
15 vidéos (Total 108 min), 4 lectures, 5 quiz
Video15 vidéos
Одномерный отбор признаков8 min
Жадные методы отбора признаков6 min
Отбор признаков на основе моделей6 min
Понижение размерности4 min
Метод главных компонент: постановка задачи7 min
Метод главных компонент: решение6 min
Матричные разложения13 min
SGD и ALS5 min
Прогнозирование неизвестных значений в матрице6 min
Проблема отсутствия негативных примеров и implicit методы6 min
Вероятностный взгляд на матричные разложения5 min
Неотрицательные матричные разложения: постановка и решение10 min
Неотрицательные матричные разложения: функционалы и инициализация5 min
Обработка пропусков8 min
Reading4 lectures
Слайды к лекциям10 min
Конспект10 min
Слайды к лекциям10 min
Конспект10 min
Quiz4 exercices pour s'entraîner
Отбор признаков6 min
Понижение размерности и отбор признаков14 min
Матричные разложения8 min
Неотрицательные матричные разложения10 min
Semaine
3
Heures pour terminer
4 heures pour terminer

Визуализация и поиск аномалий

Добро пожаловать на третью неделю курса! В ней мы обсудим две задачи: обнаружение аномалий и визуализация данных. Обнаружение аномалий направлено на поиск объектов, которые являются особенными в некотором смысле. Например, это могут объекты с такими значениями признаков, которые далеки от имеющихся в обучающей выборке — вполне ожидаемо, что на таких объектах модель выдаст очень плохие прогнозы. Вы узнаете, как можно формально дать определение аномалий и с помощью каких методов можно решать задачу их поиска. Вторая задача, о которой мы поговорим — это визуализация, то есть отображение многомерной выборки в пространство размерности два или три. В теории визуализация близка к понижению размерности — но за счёт того, что нам нужно найти всего два или три признака, можно использовать очень сложные нелинейные методы....
Reading
8 vidéos (Total 57 min), 5 lectures, 5 quiz
Video8 vidéos
Параметрическое восстановление плотности9 min
Непараметрическое восстановление плотности8 min
Одноклассовый SVM5 min
Задача визуализации5 min
Многомерное шкалирование4 min
Метод t-SNE6 min
Визуализация данных в sklearn12 min
Reading5 lectures
Слайды к лекциям10 min
Конспект10 min
Визуализация данных в sklearn10 min
Слайды к лекциям10 min
Конспект10 min
Quiz4 exercices pour s'entraîner
Восстановление плотности6 min
Поиск аномалий4 min
Методы SNE и t-SNE6 min
Визуализация14 min
Semaine
4
Heures pour terminer
9 heures pour terminer

Тематическое моделирование

Люди уже много веков сохраняют свои знания в виде книг, а крупнейшая на сегодняшний день коллекция информации — Интернет — состоит из огромного количества текстов. Тексты, по сути, являются наиболее популярным видом данных, и поэтому очень важно уметь искать в них закономерности. Тематическое моделирование — это способ семантического анализа коллекции текстовых документов. Тематическая модель позволяет для каждого документа найти темы, которые его описывают, и кроме того показывает, какие слова характеризуют ту или иную тему. Другими словами, мы находим более компактное представление большого набора текстов в виде нескольких тем. С математической точки зрения тематическая модель — это еще один вид матричного разложения, где в качестве исходной матрицы выступает матрица частот слов в документах. На четвертой неделе мы поговорим о том, где применяют тематические модели, какие они бывают, как их строить и как оценивать. ...
Reading
14 vidéos (Total 151 min), 7 lectures, 6 quiz
Video14 vidéos
Постановка задачи тематического моделирования12 min
Базовые тематические модели и EM-алгоритм14 min
Регуляризация тематических моделей10 min
Мультимодальные тематические модели9 min
Внутренние критерии качества тематических моделей9 min
Внешние критерии качества тематических моделей16 min
Визуализация тематических моделей10 min
Тематические модели на практике11 min
Пример использования библиотеки gensim для построения тематической модели10 min
Установка BigARTM в Windows3 min
Установка BigARTM в Linux Mint2 min
Установка BigARTM в Mac OS-X3 min
Пример использования библиотеки BigARTM для построения тематической модели19 min
Reading7 lectures
Слайды к лекциям10 min
Конспект10 min
Ноутбук из демонстрации использования gensim10 min
Ноутбук из демонстрации использования BigARTM10 min
Слайды к лекциям10 min
Конспект10 min
Финальные титры10 min
Quiz4 exercices pour s'entraîner
Постановка задачи и базовые понятия6 min
Тематическое моделирование-18 min
Критерии качества тематических моделей6 min
Тематическое моделирование-26 min
4.7
Orientation de carrière

50%

a commencé une nouvelle carrière après avoir terminé ces cours
Avantage de carrière

83%

a bénéficié d'un avantage concret dans sa carrière grâce à ce cours
Promotion de carrière

33%

a obtenu une augmentation de salaire ou une promotion

Meilleurs avis

par KTJun 1st 2016

Отличны курс! Спасибо большое создателям! Отличная подача материала, хорошие практические примеры и вообще всё просто классно! Категорически рекомендую, в том числе начинающим :)

par TYMar 16th 2017

Последняя неделя этого курса была значительно сложнее всего, что было раньше, но это того стоило. Пока лучший курс из всех, что я знаю на эту тему.

Enseignants

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

À propos de Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

À propos de Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

À propos de la Spécialisation Машинное обучение и анализ данных

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.