À propos de ce cours
15,527 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Approx. 16 heures pour terminer

Recommandé : 4 weeks of study, 2-5 hours/week...

Anglais

Sous-titres : Anglais

Ce que vous allez apprendre

  • Check

    U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Check

    Use Spark UI to analyze performance and identify bottlenecks

  • Check

    Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • Check

    B​uild a linear regression model and make predictions using SparkSQL

Compétences que vous acquerrez

Data ScienceApache SparkSQL

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau intermédiaire

Approx. 16 heures pour terminer

Recommandé : 4 weeks of study, 2-5 hours/week...

Anglais

Sous-titres : Anglais

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
3 heures pour terminer

Introduction to Spark

6 vidéos (Total 32 min), 3 lectures, 2 quiz
6 vidéos
Why Distributed Computing?7 min
Spark DataFrames6 min
The Databricks Environment8 min
SQL in Notebooks3 min
Import Data2 min
3 lectures
A Note From UC Davis10 min
Readings and Resources40 min
Assignment #1 - Queries in Spark SQL30 min
2 exercices pour s'entraîner
Assignment #1 Quiz - Queries in Spark SQL30 min
Module 1 Quiz30 min
Semaine
2
2 heures pour terminer

Spark Core Concepts

6 vidéos (Total 25 min), 2 lectures, 2 quiz
6 vidéos
Spark Terminology3 min
Caching5 min
Shuffle Partitions7 min
Spark UI3 min
Broadcast Joins3 min
2 lectures
Readings30 min
Assignment #2 - Spark Internals30 min
2 exercices pour s'entraîner
Assignment #2 Quiz - Spark Internals30 min
Module 2 Quiz30 min
Semaine
3
3 heures pour terminer

Engineering Data Pipelines

7 vidéos (Total 43 min), 2 lectures, 2 quiz
7 vidéos
Spark as a Connector6 min
Accessing Data10 min
File Formats8 min
Schemas and Types4 min
Writing Data6 min
Managed and Unmanaged Tables4 min
2 lectures
Readings1 h
Assignment #3 - Engineering Data Pipelines30 min
2 exercices pour s'entraîner
Assignment #3 Quiz - Engineering Data Pipelines30 min
Module 3 Quiz30 min
Semaine
4
5 heures pour terminer

Machine Learning Applications of Spark

7 vidéos (Total 35 min), 2 lectures, 3 quiz
7 vidéos
Applications of Machine Learning4 min
Machine Learning Fundamentals6 min
Linear Regression6 min
Training Linear Regression Model8 min
Applying Machine Learning with UDFs4 min
Course Summary3 min
2 lectures
Readings1 h
Assignment #4 - Logistic Regression Classifier10 min
2 exercices pour s'entraîner
Assignment #4 Quiz - Logistic Regression Classifier30 min
Module 4 Quiz30 min
4.5
2 avis

Meilleurs avis pour Distributed Computing with Spark SQL

par JBJan 6th 2020

Extremely informative for those who are seeking to learn the fundamentals for distributed computing using Spark SQL.

Enseignants

Image de l'enseignant, Brooke Wenig

Brooke Wenig

Machine Learning Practice Lead at Databricks
Continuing and Professional Education
Image de l'enseignant, Conor Murphy

Conor Murphy

Data Scientist at Databricks
Continuing and Professional Education

À propos de Université de Californie à Davis

UC Davis, one of the nation’s top-ranked research universities, is a global leader in agriculture, veterinary medicine, sustainability, environmental and biological sciences, and technology. With four colleges and six professional schools, UC Davis and its students and alumni are known for their academic excellence, meaningful public service and profound international impact....

À propos du Spécialisation Learn SQL Basics for Data Science

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.