À propos de ce cours

52,300 consultations récentes
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau débutant
Approx. 20 heures pour terminer
Anglais
Sous-titres : Anglais

Ce que vous allez apprendre

  • Use different tools to browse existing databases and tables in big data systems

  • Use different tools to explore files in distributed big data filesystems and cloud storage

  • Create and manage big data databases and tables using Apache Hive and Apache Impala

  • Describe and choose among different data types and file formats for big data systems

Compétences que vous acquerrez

Data ManagementDistributed File SystemsCloud StorageBig DataSQL
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau débutant
Approx. 20 heures pour terminer
Anglais
Sous-titres : Anglais

Offert par

Logo Cloudera

Cloudera

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1

Semaine 1

3 heures pour terminer

Orientation to Data in Clusters and Cloud Storage

3 heures pour terminer
7 vidéos (Total 56 min), 3 lectures, 1 quiz
7 vidéos
Browsing Tables with Hue7 min
Browsing Tables with SQL Utility Statements6 min
Browsing HDFS with the Hue File Browser13 min
Browsing HDFS from the Command Line9 min
Understanding S3 and Other Cloud Storage Platforms6 min
Browsing S3 Buckets from the Command Line8 min
3 lectures
Review and Preparation30 min
Instructions for Downloading and Installing the Exercise Environment30 min
Troubleshooting the VM5 min
1 exercice pour s'entraîner
Week 1 Graded Quiz30 min
Semaine
2

Semaine 2

5 heures pour terminer

Defining Databases, Tables, and Columns

5 heures pour terminer
7 vidéos (Total 33 min), 12 lectures, 2 quiz
7 vidéos
Introduction to the CREATE TABLE Statement5 min
Using Different Schemas on the Same Data12 min
Specifying TBLPROPERTIES2 min
Examining, Modifying, and Removing Tables1 min
Hive and Impala Interoperability2 min
Impala Metadata Refresh3 min
12 lectures
Creating Databases and Tables with Hue30 min
Creating Databases and Tables with SQL15 min
Permissions to Create Databases and Tables5 min
The ROW FORMAT Clause25 min
The STORED AS Clause15 min
The LOCATION Clause20 min
CREATE TABLE Shortcuts10 min
Using Hive SerDes15 min
Working with Unstructured and Semi-Structured Data15 min
Examining Table Structure10 min
Dropping Databases and Tables5 min
Modifying Existing Tables35 min
2 exercices pour s'entraîner
Week 2 Practice Quiz20 min
Week 2 Graded Quiz30 min
Semaine
3

Semaine 3

3 heures pour terminer

Data Types and File Types

3 heures pour terminer
5 vidéos (Total 14 min), 12 lectures, 2 quiz
5 vidéos
Overview of Data Types1 min
Choosing the Right Data Types4 min
Overview of File Types3 min
Choosing the Right File Types3 min
12 lectures
Integer Data Types5 min
Decimal Data Types10 min
Character String Data Types10 min
Other Data Types5 min
Examining Data Types10 min
Out-of-Range Values5 min
Text Files5 min
Avro Files5 min
Parquet Files5 min
ORC Files5 min
Other File Types5 min
Creating Tables with Avro and Parquet Files20 min
2 exercices pour s'entraîner
Week 3 Practice Quiz20 min
Week 3 Graded Quiz30 min
Semaine
4

Semaine 4

5 heures pour terminer

Managing Datasets in Clusters and Cloud Storage

5 heures pour terminer
8 vidéos (Total 48 min), 13 lectures, 3 quiz
8 vidéos
Refresh Impala's Metadata Cache after Loading Data2 min
Loading Files into HDFS with Hue's Table Browser10 min
Loading Files into HDFS with Hue's File Browser6 min
Loading Files into HDFS from the Command Line8 min
Loading Files into S3 from the Command Line10 min
Using Hive and Impala to Load Data into Tables3 min
Conclusion2 min
13 lectures
More about HDFS Shell Commands10 min
Chaining and Scripting with HDFS Commands5 min
HDFS Permissions5 min
Other Ways to Load Files into S35 min
S3 Permissions10 min
Missing Values15 min
Character Sets5 min
Using Sqoop to Import Data15 min
More Sqoop Import Options5 min
Using Sqoop to Export Data5 min
SQL LOAD DATA Statements10 min
SQL INSERT Statements10 min
SQL INSERT ... SELECT and CTAS Statements15 min
2 exercices pour s'entraîner
Week 4 Practice Quiz20 min
Week 4 Graded Quiz30 min

Avis

Meilleurs avis pour MANAGING BIG DATA IN CLUSTERS AND CLOUD STORAGE

Voir tous les avis

À propos du Spécialisation Modern Big Data Analysis with SQL

This Specialization teaches the essential skills for working with large-scale data using SQL. Maybe you are new to SQL and you want to learn the basics. Or maybe you already have some experience using SQL to query smaller-scale data with relational databases. Either way, if you are interested in gaining the skills necessary to query big data with modern distributed SQL engines, this Specialization is for you. Most courses that teach SQL focus on traditional relational databases, but today, more and more of the data that’s being generated is too big to be stored there, and it’s growing too quickly to be efficiently stored in commercial data warehouses. Instead, it’s increasingly stored in distributed clusters and cloud storage. These data stores are cost-efficient and infinitely scalable. To query these huge datasets in clusters and cloud storage, you need a newer breed of SQL engine: distributed query engines, like Hive, Impala, Presto, and Drill. These are open source SQL engines capable of querying enormous datasets. This Specialization focuses on Hive and Impala, the most widely deployed of these query engines. This Specialization is designed to provide excellent preparation for the Cloudera Certified Associate (CCA) Data Analyst certification exam. You can earn this certification credential by taking a hands-on practical exam using the same SQL engines that this Specialization teaches—Hive and Impala....
Modern Big Data Analysis with SQL

Foire Aux Questions

  • Access to lectures and assignments depends on your type of enrollment. If you take a course in audit mode, you will be able to see most course materials for free. To access graded assignments and to earn a Certificate, you will need to purchase the Certificate experience, during or after your audit. If you don't see the audit option:

    • The course may not offer an audit option. You can try a Free Trial instead, or apply for Financial Aid.
    • The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

  • Si vous vous abonnez, vous bénéficiez d'une période d'essai gratuite de 7 jours, durant laquelle vous pouvez annuler votre abonnement sans pénalité. Ensuite, nous n'accordons plus de remboursements, mais vous pouvez annuler votre abonnement à tout instant. Consultez notre politique de remboursement complète.

  • Oui, Coursera offre une Aide Financière aux étudiants qui n'ont pas les moyens d'acquitter les frais. Demandez-la en cliquant sur le lien Aide Financière sous le bouton S'inscrire situé à gauche. Vous devrez remplir un formulaire de demande et vous serez averti(e) si elle est acceptée. Vous devrez répéter cette procédure pour chaque cours de la Spécialisation, y compris pour le Projet Final. En savoir plus.

  • • Windows, macOS, or Linux operating system (iPads and Android tablets will not work) • 64-bit operating system (32-bit operating systems will not work) • 8 GB RAM or more • 25GB free disk space or more • Intel VT-x or AMD-V virtualization support enabled (on Mac computers with Intel processors, this is always enabled; on Windows and Linux computers, you might need to enable it in the BIOS) • For Windows XP computers only: You must have an unzip utility such as 7-Zip or WinZip installed (Windows XP’s built-in unzip utility will not work)

  • Ce Cours n'est pas associé à des crédits universitaires, mais certaines universités peuvent décider d'accepter des Certificats de Cours pour des crédits. Vérifiez-le auprès de votre établissement pour en savoir plus. Les Diplômes en ligne et les Certificats Mastertrack™ sur Coursera apportent la possibilité d'obtenir des crédits universitaires.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.