À propos de ce cours
4.7
1,666 notes
351 avis
Spécialisation
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Heures pour terminer

Approx. 15 heures pour terminer

Recommandé : 6 hours/week...
Langues disponibles

Anglais

Sous-titres : Anglais...

Compétences que vous acquerrez

Scala ProgrammingBig DataApache SparkSQL
Spécialisation
100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Heures pour terminer

Approx. 15 heures pour terminer

Recommandé : 6 hours/week...
Langues disponibles

Anglais

Sous-titres : Anglais...

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
Heures pour terminer
12 heures pour terminer

Getting Started + Spark Basics

Get up and running with Scala on your computer. Complete an example assignment to familiarize yourself with our unique way of submitting assignments. In this week, we'll bridge the gap between data parallelism in the shared memory scenario (learned in the Parallel Programming course, prerequisite) and the distributed scenario. We'll look at important concerns that arise in distributed systems, like latency and failure. We'll go on to cover the basics of Spark, a functionally-oriented framework for big data processing in Scala. We'll end the first week by exercising what we learned about Spark by immediately getting our hands dirty analyzing a real-world data set....
Reading
7 vidéos (Total 105 min), 5 lectures, 3 quiz
Video7 vidéos
Data-Parallel to Distributed Data-Parallel10 min
Latency24 min
RDDs, Spark's Distributed Collection9 min
RDDs: Transformation and Actions16 min
Evaluation in Spark: Unlike Scala Collections!20 min
Cluster Topology Matters!8 min
Reading5 lectures
Tools setup10 min
Eclipse tutorial10 min
Intellij IDEA Tutorial10 min
Sbt tutorial10 min
Submitting solutions10 min
Semaine
2
Heures pour terminer
7 heures pour terminer

Reduction Operations & Distributed Key-Value Pairs

This week, we'll look at a special kind of RDD called pair RDDs. With this specialized kind of RDD in hand, we'll cover essential operations on large data sets, such as reductions and joins....
Reading
4 vidéos (Total 59 min), 2 quiz
Video4 vidéos
Pair RDDs6 min
Transformations and Actions on Pair RDDs20 min
Joins17 min
Semaine
3
Heures pour terminer
1 heure pour terminer

Partitioning and Shuffling

This week we'll look at some of the performance implications of using operations like joins. Is it possible to get the same result without having to pay for the overhead of moving data over the network? We'll answer this question by delving into how we can partition our data to achieve better data locality, in turn optimizing some of our Spark jobs....
Reading
4 vidéos (Total 57 min)
Video4 vidéos
Partitioning14 min
Optimizing with Partitioners11 min
Wide vs Narrow Dependencies16 min
Semaine
4
Heures pour terminer
8 heures pour terminer

Structured data: SQL, Dataframes, and Datasets

With our newfound understanding of the cost of data movement in a Spark job, and some experience optimizing jobs for data locality last week, this week we'll focus on how we can more easily achieve similar optimizations. Can structured data help us? We'll look at Spark SQL and its powerful optimizer which uses structure to apply impressive optimizations. We'll move on to cover DataFrames and Datasets, which give us a way to mix RDDs with the powerful automatic optimizations behind Spark SQL....
Reading
5 vidéos (Total 133 min), 2 quiz
Video5 vidéos
Spark SQL17 min
DataFrames (1)26 min
DataFrames (2)30 min
Datasets43 min
4.7
351 avisChevron Right
Orientation de carrière

10%

a commencé une nouvelle carrière après avoir terminé ces cours
Avantage de carrière

83%

a bénéficié d'un avantage concret dans sa carrière grâce à ce cours
Promotion de carrière

12%

a obtenu une augmentation de salaire ou une promotion

Meilleurs avis

par CCJun 8th 2017

The sessions where clearly explained and focused. Some of the exercises contained slightly confusing hints and information, but I'm sure those mistakes will be ironed out in future iterations. Thanks!

par CRApr 10th 2017

Great introduction to spark. Fun assignments. Since it was the first ever session, there were quite a few kinks with the assignments. But the discussion forums rescued me any time I was stuck.

Enseignant

Avatar

Dr. Heather Miller

Research Scientist
EPFL

À propos de École Polytechnique Fédérale de Lausanne

À propos de la Spécialisation Functional Programming in Scala

Discover how to write elegant code that works the first time it is run. This Specialization provides a hands-on introduction to functional programming using the widespread programming language, Scala. It begins from the basic building blocks of the functional paradigm, first showing how to use these blocks to solve small problems, before building up to combining these concepts to architect larger functional programs. You'll see how the functional paradigm facilitates parallel and distributed programming, and through a series of hands on examples and programming assignments, you'll learn how to analyze data sets small to large; from parallel programming on multicore architectures, to distributed programming on a cluster using Apache Spark. A final capstone project will allow you to apply the skills you learned by building a large data-intensive application using real-world data....
Functional Programming in Scala

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.