À propos de ce cours
3.9
48 notes
12 avis
Spécialisation
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Niveau avancé

Niveau avancé

Heures pour terminer

Approx. 24 heures pour terminer

Recommandé : 5 weeks of study, 6-8 hours/week...
Langues disponibles

Anglais

Sous-titres : Anglais
Spécialisation
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Niveau avancé

Niveau avancé

Heures pour terminer

Approx. 24 heures pour terminer

Recommandé : 5 weeks of study, 6-8 hours/week...
Langues disponibles

Anglais

Sous-titres : Anglais

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
Heures pour terminer
7 minutes pour terminer

Welcome

...
Reading
5 vidéos (Total 7 min)
Video5 vidéos
Course Structure1 min
Meet Alexey2 min
Meet Pavel37s
Meet Ilya1 min
Heures pour terminer
1 heure pour terminer

(Optional) Machine Learning: Introduction

...
Reading
6 vidéos (Total 43 min), 1 lecture
Video6 vidéos
(Optional) Basic concepts11 min
(Optional) Types of problems and tasks5 min
(Optional) Supervised learning7 min
(Optional) Unsupervised learning6 min
(Optional) Business applications of the machine learning4 min
Reading1 lecture
Slack Channel is the quickest way to get answer to your question10 min
Heures pour terminer
5 heures pour terminer

Spark MLLib and Linear Models

...
Reading
11 vidéos (Total 94 min), 3 lectures, 5 quiz
Video11 vidéos
First example. Linear regression10 min
How MLlib library is arranged10 min
How to train algorithms. Gradient descent method9 min
How to train algorithms. Second order methods8 min
Large scale classification. Logistic regression12 min
Regularization8 min
PCA decomposition9 min
K-means clustering7 min
How to submit your first assignment3 min
How to Install Docker on Windows 7, 8, 104 min
Reading3 lectures
Grading System: Instructions and Common Problems10 min
Docker Installation Guide10 min
Assignments. General requirements10 min
Quiz4 exercices pour s'entraîner
Large scale machine learning. The beginning14 min
Large scale regression and classification. Detailed analysis10 min
Regularization and Unsupervised Techniques10 min
Spark MLLib and Linear Models18 min
Semaine
2
Heures pour terminer
2 heures pour terminer

Machine Learning with Texts & Feature Engineering

...
Reading
12 vidéos (Total 70 min), 5 quiz
Video12 vidéos
Welcome1 min
Feature Engineering for Texts, part 17 min
Feature Engineering for Texts, part 25 min
N-grams4 min
Hashing trick6 min
Categorical Features6 min
Feature Interactions2 min
Spark ML. Feature Engineering for Texts, part 17 min
Spark ML. Feature Engineering for Texts, part 25 min
Spark ML. Categorical Features3 min
Topic Modeling. LDA.7 min
Word2Vec11 min
Quiz5 exercices pour s'entraîner
Feature Enginering for Texts16 min
Categorical Features & Feature Interactions6 min
Spark ML Tutorial: Text Processing6 min
Advanced Machine Learning with Texts8 min
Machine Learning with Texts & Feature Engineering20 min
Semaine
3
Heures pour terminer
6 heures pour terminer

Decision Trees & Ensemble Learning

...
Reading
13 vidéos (Total 64 min), 6 quiz
Video13 vidéos
Welcome1 min
Decision Trees Basics4 min
Decision Trees for Regression6 min
Decision Trees for Classification3 min
Decision Trees: Summary1 min
Bootstrap & Bagging8 min
Random Forest6 min
Gradient Boosted Decision Trees: Intro & Regression7 min
Gradient Boosted Decision Trees: Classification6 min
Stochastic Boosting1 min
Gradient Boosted Decision Trees: Usage Tips & Summary3 min
Spark ML. Decision Trees & Ensembles6 min
Spark ML. Cross-validation3 min
Quiz5 exercices pour s'entraîner
Decision Trees16 min
Bootstrap, Bagging and Random Forest6 min
Gradient Boosted Decision Trees10 min
Spark ML Programming Tutorial: Decision Trees & CV6 min
Decision Trees & Ensemble Learning16 min
Semaine
4
Heures pour terminer
3 heures pour terminer

Recommender Systems

...
Reading
15 vidéos (Total 118 min), 1 lecture, 4 quiz
Video15 vidéos
Recommender Systems, Introduction. Part II4 min
Non-Personalized Recommender Systems9 min
Content-Based Recommender Systems8 min
Recommender System Evaluation10 min
Collaborative Filtering RecSys: User-User and Item-Item10 min
RecSys: SVD I7 min
RecSys: SVD II8 min
RecSys: SVD III5 min
RecSys: MF I7 min
RecSys: MF II6 min
RecSys: iALS I6 min
RecSys: iALS II11 min
RecSys: Hybrid I7 min
RecSys: Hybrid II7 min
Reading1 lecture
Recommender Systems. Spark Assignment10 min
Quiz4 exercices pour s'entraîner
Basic RecSys for Data Engineers14 min
Moderate RecSys for Data Engineers10 min
Advanced RecSys for Data Engineers4 min
Recommender Systems16 min

Enseignants

Avatar

Pavel Mezentsev

Senior Data Scientist
PulsePoint inc
Avatar

Alexey A. Dral

Founder and Chief Executive Officer
BigData Team
Avatar

Ilya Trofimov

Principal Data Scientist
Yandex
Avatar

Evgeny Frolov

Data Scientist, PhD Student @Skoltech
Computational and Data Intensive Science and Engineering

À propos de Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

À propos de la Spécialisation Big Data for Data Engineers

This specialization is made for people working with data (either small or big). If you are a Data Analyst, Data Scientist, Data Engineer or Data Architect (or you want to become one) — don’t miss the opportunity to expand your knowledge and skills in the field of data engineering and data analysis on the large scale. In four concise courses you will learn the basics of Hadoop, MapReduce, Spark, methods of offline data processing for warehousing, real-time data processing and large-scale machine learning. And Capstone project for you to build and deploy your own Big Data Service (make your portfolio even more competitive). Over the course of the specialization, you will complete progressively harder programming assignments (mostly in Python). Make sure, you have some experience in it. This course will master your skills in designing solutions for common Big Data tasks: - creating batch and real-time data processing pipelines, - doing machine learning at scale, - deploying machine learning models into a production environment — and much more! Join some of best hands-on big data professionals, who know, their job inside-out, to learn the basics, as well as some tricks of the trade, from them. Special thanks to Prof. Mikhail Roytberg (APT dept., MIPT), Oleg Sukhoroslov (PhD, Senior Researcher, IITP RAS), Oleg Ivchenko (APT dept., MIPT), Pavel Akhtyamov (APT dept., MIPT), Vladimir Kuznetsov, Asya Roitberg, Eugene Baulin, Marina Sudarikova....
Big Data for Data Engineers

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.