À propos de ce cours
42,521 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau débutant

Approx. 25 heures pour terminer

Recommandé : 10 hours/week...

Anglais

Sous-titres : Anglais

Ce que vous allez apprendre

  • Check

    Understand the basics of SELECT statements

  • Check

    Understand how and why to filter results

  • Check

    Explore grouping and aggregation to answer analytic questions

  • Check

    Work with sorting and limiting results

Compétences que vous acquerrez

Apache HiveApache ImpalaData AnalysisBig DataSQL
Les étudiants prenant part à ce Course sont
  • Machine Learning Engineers
  • Data Scientists
  • Data Engineers
  • Data Analysts
  • Business Analysts

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau débutant

Approx. 25 heures pour terminer

Recommandé : 10 hours/week...

Anglais

Sous-titres : Anglais

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
3 heures pour terminer

Orientation to SQL on Big Data

9 vidéos (Total 47 min), 5 lectures, 2 quiz
9 vidéos
Review and Preparation4 min
Using the Hue Query Editors7 min
Running SQL Utility Statements6 min
Running SQL SELECT Statements5 min
Understanding Different SQL Interfaces4 min
Overview of Beeline and Impala Shell2 min
Using Beeline8 min
Using Impala Shell3 min
5 lectures
Instructions for Downloading and Installing the Exercise Environment30 min
Troubleshooting the VM5 min
(Optional) What about Spark SQL?10 min
Expectations for Learners10 min
(Optional) Using Other SQL Engines10 min
2 exercices pour s'entraîner
Week 1 Core Quiz30 min
Week 1 Honors Quiz5 min
Semaine
2
3 heures pour terminer

SQL SELECT Essentials

16 vidéos (Total 83 min), 4 lectures, 2 quiz
16 vidéos
SQL SELECT Building Blocks2 min
Introduction to the SELECT List7 min
Expressions and Operators7 min
Data Types6 min
Column Aliases5 min
Built-In Functions7 min
Data Type Conversion5 min
The DISTINCT Keyword5 min
Introduction to the FROM Clause3 min
Identifiers7 min
Formatting SELECT Statements4 min
Using Beeline in Non-Interactive Mode5 min
Using Impala Shell in Non-Interactive Mode4 min
Formatting the Output of Beeline and Impala Shell4 min
Saving Hive and Impala Query Results to a File5 min
4 lectures
Order of Operations5 min
Division and Modulo Operators15 min
Common String Functions15 min
Case (In)Sensitivity in SQL10 min
2 exercices pour s'entraîner
Week 2 Core Quiz30 min
Week 2 Honors Quiz5 min
Semaine
3
3 heures pour terminer

Filtering Data

14 vidéos (Total 85 min), 6 lectures, 2 quiz
14 vidéos
About the Datasets4 min
Introduction to the WHERE Clause2 min
Using Expressions in the WHERE Clause9 min
Comparison Operators9 min
Data Types and Precision4 min
Logical Operators7 min
Other Relational Operators4 min
Understanding Missing Values8 min
Handling Missing Values6 min
Conditional Functions9 min
Using Variables with Beeline and Impala Shell7 min
Calling Beeline and Impala Shell from Scripts6 min
Querying Hive and Impala in Scripts and Applications2 min
6 lectures
Data Reference5 min
(Optional) Unicode Characters10 min
Working with Literal Strings15 min
Missing Values with Logical Operators10 min
Missing Values in String Columns5 min
(Optional Exercise) Change VM Desktop Color30 min
2 exercices pour s'entraîner
Week 3 Core Quiz30 min
Week 3 Honors Quiz5 min
Semaine
4
3 heures pour terminer

Grouping and Aggregating Data

15 vidéos (Total 82 min), 6 lectures, 2 quiz
15 vidéos
Introduction to Aggregation2 min
Common Aggregate Functions2 min
Using Aggregate Functions in the SELECT Statement8 min
Introduction to the GROUP BY Clause6 min
Choosing an Aggregate Function and Grouping Column4 min
Grouping Expressions6 min
Grouping and Aggregation, Together and Separately5 min
NULL Values in Grouping and Aggregation4 min
The COUNT Function7 min
Tips for Applying Grouping and Aggregation7 min
Filtering on Aggregates2 min
The HAVING Clause8 min
Understanding Hive and Impala Version Differences10 min
Understanding Hue Version Differences2 min
6 lectures
COUNT(*) and SUM(1)5 min
Interpreting Aggregates: Populations and Samples10 min
The least and greatest Functions5 min
Why Aggregate Expressions Ignore NULL Values5 min
(Optional) Shortcuts for Grouping10 min
How Grouping and Aggregation Can Mislead10 min
2 exercices pour s'entraîner
Week 4 Core Quiz30 min
Week 4 Honors Quiz10 min
4.9
9 avisChevron Right

Principaux examens pour Analyzing Big Data with SQL

par RROct 26th 2019

Good course to understand the need of SQL in data analysis/big data using good examples and real life data and problem sets.

par TPOct 9th 2019

I have used many platforms to get started with SQL but this has been the best by far. Thank you Cloudera.

Enseignant

Avatar

Ian Cook

Senior Curriculum Developer
Cloudera

À propos de Cloudera

At Cloudera, we believe that data can make what is impossible today, possible tomorrow. We empower people to transform complex data into clear and actionable insights. Cloudera delivers an enterprise data cloud for any data, anywhere, from the Edge to AI. Powered by the relentless innovation of the open source community, Cloudera advances digital transformation for the world’s largest enterprises. ...

À propos du Spécialisation Modern Big Data Analysis with SQL

This Specialization teaches the essential skills for working with large-scale data using SQL. Maybe you are new to SQL and you want to learn the basics. Or maybe you already have some experience using SQL to query smaller-scale data with relational databases. Either way, if you are interested in gaining the skills necessary to query big data with modern distributed SQL engines, this Specialization is for you. Most courses that teach SQL focus on traditional relational databases, but today, more and more of the data that’s being generated is too big to be stored there, and it’s growing too quickly to be efficiently stored in commercial data warehouses. Instead, it’s increasingly stored in distributed clusters and cloud storage. These data stores are cost-efficient and infinitely scalable. To query these huge datasets in clusters and cloud storage, you need a newer breed of SQL engine: distributed query engines, like Hive, Impala, Presto, and Drill. These are open source SQL engines capable of querying enormous datasets. This Specialization focuses on Hive and Impala, the most widely deployed of these query engines. This Specialization is designed to provide excellent preparation for the Cloudera Certified Associate (CCA) Data Analyst certification exam. You can earn this certification credential by taking a hands-on practical exam using the same SQL engines that this Specialization teaches—Hive and Impala....
Modern Big Data Analysis with SQL

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

  • • Windows, macOS, or Linux operating system (iPads and Android tablets will not work) • 64-bit operating system (32-bit operating systems will not work) • 8 GB RAM or more • 25GB free disk space or more • Intel VT-x or AMD-V virtualization support enabled (on Mac computers with Intel processors, this is always enabled; on Windows and Linux computers, you might need to enable it in the BIOS) • For Windows XP computers only: You must have an unzip utility such as 7-Zip or WinZip installed (Windows XP’s built-in unzip utility will not work)

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.