À propos de ce cours
9,338 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 77 heures pour terminer

Recommandé : 5 weeks of study, 6-8 hours/week...

Anglais

Sous-titres : Anglais
Les étudiants prenant part à ce Course sont
  • Data Scientists
  • Data Engineers
  • Machine Learning Engineers
  • Data Analysts
  • Technical Solutions Engineers

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 77 heures pour terminer

Recommandé : 5 weeks of study, 6-8 hours/week...

Anglais

Sous-titres : Anglais

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
7 minutes pour terminer

Welcome

5 vidéos (Total 7 min)
5 vidéos
Course Structure1 min
Meet Alexey2 min
Meet Pavel37s
Meet Ilya1 min
1 heure pour terminer

(Optional) Machine Learning: Introduction

6 vidéos (Total 43 min), 1 lecture
6 vidéos
(Optional) Basic concepts11 min
(Optional) Types of problems and tasks5 min
(Optional) Supervised learning7 min
(Optional) Unsupervised learning6 min
(Optional) Business applications of the machine learning4 min
1 lecture
Slack Channel is the quickest way to get answer to your question10 min
5 heures pour terminer

Spark MLLib and Linear Models

11 vidéos (Total 94 min), 3 lectures, 5 quiz
11 vidéos
First example. Linear regression10 min
How MLlib library is arranged10 min
How to train algorithms. Gradient descent method9 min
How to train algorithms. Second order methods8 min
Large scale classification. Logistic regression12 min
Regularization8 min
PCA decomposition9 min
K-means clustering7 min
How to submit your first assignment3 min
How to Install Docker on Windows 7, 8, 104 min
3 lectures
Grading System: Instructions and Common Problems10 min
Docker Installation Guide10 min
Assignments. General requirements10 min
4 exercices pour s'entraîner
Large scale machine learning. The beginning14 min
Large scale regression and classification. Detailed analysis10 min
Regularization and Unsupervised Techniques10 min
Spark MLLib and Linear Models18 min
Semaine
2
2 heures pour terminer

Machine Learning with Texts & Feature Engineering

12 vidéos (Total 70 min), 5 quiz
12 vidéos
Welcome1 min
Feature Engineering for Texts, part 17 min
Feature Engineering for Texts, part 25 min
N-grams4 min
Hashing trick6 min
Categorical Features6 min
Feature Interactions2 min
Spark ML. Feature Engineering for Texts, part 17 min
Spark ML. Feature Engineering for Texts, part 25 min
Spark ML. Categorical Features3 min
Topic Modeling. LDA.7 min
Word2Vec11 min
5 exercices pour s'entraîner
Feature Enginering for Texts16 min
Categorical Features & Feature Interactions6 min
Spark ML Tutorial: Text Processing6 min
Advanced Machine Learning with Texts8 min
Machine Learning with Texts & Feature Engineering20 min
Semaine
3
6 heures pour terminer

Decision Trees & Ensemble Learning

13 vidéos (Total 64 min), 6 quiz
13 vidéos
Welcome1 min
Decision Trees Basics4 min
Decision Trees for Regression6 min
Decision Trees for Classification3 min
Decision Trees: Summary1 min
Bootstrap & Bagging8 min
Random Forest6 min
Gradient Boosted Decision Trees: Intro & Regression7 min
Gradient Boosted Decision Trees: Classification6 min
Stochastic Boosting1 min
Gradient Boosted Decision Trees: Usage Tips & Summary3 min
Spark ML. Decision Trees & Ensembles6 min
Spark ML. Cross-validation3 min
5 exercices pour s'entraîner
Decision Trees16 min
Bootstrap, Bagging and Random Forest6 min
Gradient Boosted Decision Trees10 min
Spark ML Programming Tutorial: Decision Trees & CV6 min
Decision Trees & Ensemble Learning16 min
Semaine
4
3 heures pour terminer

Recommender Systems

15 vidéos (Total 118 min), 1 lecture, 4 quiz
15 vidéos
Recommender Systems, Introduction. Part II4 min
Non-Personalized Recommender Systems9 min
Content-Based Recommender Systems8 min
Recommender System Evaluation10 min
Collaborative Filtering RecSys: User-User and Item-Item10 min
RecSys: SVD I7 min
RecSys: SVD II8 min
RecSys: SVD III5 min
RecSys: MF I7 min
RecSys: MF II6 min
RecSys: iALS I6 min
RecSys: iALS II11 min
RecSys: Hybrid I7 min
RecSys: Hybrid II7 min
1 lecture
Recommender Systems. Spark Assignment10 min
4 exercices pour s'entraîner
Basic RecSys for Data Engineers14 min
Moderate RecSys for Data Engineers10 min
Advanced RecSys for Data Engineers4 min
Recommender Systems16 min

Enseignants

Avatar

Alexey A. Dral

Founder and Chief Executive Officer
BigData Team
Avatar

Evgeny Frolov

Data Scientist, PhD Student @Skoltech
Computational and Data Intensive Science and Engineering
Avatar

Ilya Trofimov

Principal Data Scientist
Yandex

À propos de Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

À propos du Spécialisation Big Data for Data Engineers

This specialization is made for people working with data (either small or big). If you are a Data Analyst, Data Scientist, Data Engineer or Data Architect (or you want to become one) — don’t miss the opportunity to expand your knowledge and skills in the field of data engineering and data analysis on the large scale. In four concise courses you will learn the basics of Hadoop, MapReduce, Spark, methods of offline data processing for warehousing, real-time data processing and large-scale machine learning. And Capstone project for you to build and deploy your own Big Data Service (make your portfolio even more competitive). Over the course of the specialization, you will complete progressively harder programming assignments (mostly in Python). Make sure, you have some experience in it. This course will master your skills in designing solutions for common Big Data tasks: - creating batch and real-time data processing pipelines, - doing machine learning at scale, - deploying machine learning models into a production environment — and much more! Join some of best hands-on big data professionals, who know, their job inside-out, to learn the basics, as well as some tricks of the trade, from them. Special thanks to Prof. Mikhail Roytberg (APT dept., MIPT), Oleg Sukhoroslov (PhD, Senior Researcher, IITP RAS), Oleg Ivchenko (APT dept., MIPT), Pavel Akhtyamov (APT dept., MIPT), Vladimir Kuznetsov, Asya Roitberg, Eugene Baulin, Marina Sudarikova....
Big Data for Data Engineers

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.