À propos de ce cours
2,151 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Russe

Sous-titres : Russe

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Russe

Sous-titres : Russe

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
5 heures pour terminer

Введение, булев поиск

Этим занятием открывается цикл лекций, посвященных информационному поиску. Мы начнем с небольшого экскурса в историю возникновения вэб-поиска, изучим базовые понятия и узнаем, как можно классифицировать разные поисковые системы. Базовый вид поиска – это булев поиск. Мы рассмотрим, как он устроен и как можно исполнять запросы пользователей к такому поиску. Но недостаточно использовать оригинальный текст – чтобы учесть разные морфологические формы одного и того же слова, применяются различные этапы нормализации текста. Это применимо не только к документам, но и к запросам. Отдельно стоит рассмотреть такие важные усовершенствования булева поиска, как координатный поиск, которые учитывает, где именно в тексте находятся конкретные слова, и обработку полноценных фразовых запросов.

...
14 vidéos (Total 70 min), 2 lectures, 5 quiz
14 vidéos
МФТИ1 min
История поисковых систем5 min
Базовые понятия4 min
Классификация поисковых систем4 min
Основы булева поиска. Логические операции3 min
Матрица инцидентности и переход к обратному индексу3 min
Обработка запросов с обратным индексом4 min
Зачем нужна нормализация18 min
Определение языка3 min
Стемминг2 min
Лемматизация текста4 min
Фразовые запросы4 min
Координатный индекс3 min
2 lectures
Mail.Ru Group5 min
Решение10 min
4 exercices pour s'entraîner
Базовые понятия информационного поиска8 min
Булев поиск и матрица инцидентности14 min
Нормализация текста. Стемминг. Лемматизация10 min
Фразовые запросы. Координатный индекс6 min
Semaine
2
4 heures pour terminer

Поисковый индекс

В основе текстового информационного поиска лежит концепция обратного индекса. Эта неделя посвящена разным методам его построения, расширения за счет дополнительной информации и улучшения работы с ним благодаря сжатию словаря и ускорению работы с обратным индексом.

...
9 vidéos (Total 48 min), 1 lecture, 3 quiz
9 vidéos
Построение индекса на реальной коллекции документов8 min
Блочное индексирование. Распределенное индексирование6 min
Инкрементальная индексация3 min
Параметрические индексы и зонные индексы2 min
Сокращение индекса, стоп-слова5 min
Сжатие словаря6 min
Сжатие инвертированного файла7 min
Skip-листы2 min
1 lecture
Решение10 min
2 exercices pour s'entraîner
Обратный индекс, индексация10 min
Сжатие индекса12 min
Semaine
3
5 heures pour terminer

Нечёткий поиск

Эта неделя посвящена двум большим темам, связанным между собой: исправление опечаток в запросах пользователей и выполнение неточных запросов, в которых пользователь сознательно скрывает часть слова за специальным знаком – "*".

...
9 vidéos (Total 54 min), 1 lecture, 4 quiz
9 vidéos
Структуры для словарей. Деревья8 min
Нечёткий поиск5 min
Перестановочный индекс3 min
K-граммный индекс5 min
Расстояние редактирования10 min
Динамический алгоритм нахождения расстояние между словами3 min
Фонетические исправления3 min
Исправления в контексте4 min
1 lecture
Решение10 min
3 exercices pour s'entraîner
Структуры данных8 min
Нечеткий поиск8 min
Исправление ошибок14 min
Semaine
4
4 heures pour terminer

Ранжирование

Выполнение запросов пользователей на большом корпусе документов часто приводит к тому, что запросу удовлетворяет слишком много документов. Для того, чтобы пользователю не пришлось просматривать все найденные документы, поисковая система может отобрать из них только лучшие и показать пользователю в порядке "полезности". Этим занимается ранжирование, о котором и пойдет речь в этой неделе.

...
8 vidéos (Total 41 min), 1 lecture, 3 quiz
8 vidéos
Текстовое ранжирование5 min
Модель мешка слов6 min
Представление документов в виде векторов. Расстояние между документами3 min
Tf-Idf4 min
Принцип вероятностного ранжирования3 min
Бинарная модель независимости6 min
Переход от BIM к BM258 min
1 lecture
Решение10 min
2 exercices pour s'entraîner
Текстовое ранжирование10 min
Вероятностная модель ранжирования14 min

À propos de Institut de physique et de technologie de Moscou

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

À propos de Mail.Ru Group

Mail.Ru Group, международный бренд My.com – крупнейший холдинг в России по дневной мобильной аудитории. В рамках стратегии communitainment Mail.Ru Group развивает единую интегрированную платформу коммуникационных и развлекательных интернет-сервисов. Компании принадлежат лидирующий почтовый сервис, один из крупнейших порталов в рунете, крупнейшие русскоязычные социальные сети – ВКонтакте, Одноклассники и Мой Мир, а также два популярных в России и СНГ мессенджера – Агент Mail.Ru и ICQ....

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous achetez un Certificat, vous bénéficiez d'un accès à tout le contenu du cours, y compris les devoirs notés. Lorsque vous avez terminé et réussi le cours, votre Certificat électronique est ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.