À propos de ce cours

Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire
Approx. 13 heures pour terminer
Français
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Niveau intermédiaire
Approx. 13 heures pour terminer
Français

Offert par

Placeholder

Google Cloud

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1

Semaine 1

6 minutes pour terminer

Introduction

6 minutes pour terminer
2 vidéos (Total 6 min)
2 vidéos
Premiers pas avec Google Cloud Platform et Qwiklabs4 min
1 heure pour terminer

Introduction aux pipelines de données par lots

1 heure pour terminer
5 vidéos (Total 18 min)
5 vidéos
Considérations liées à la qualité1 min
Comment réaliser des opérations dans BigQuery3 min
Limitations3 min
Processus ETL pour résoudre les problèmes liés à la qualité des données4 min
1 exercice pour s'entraîner
EL, ELT et ETL30 min
2 heures pour terminer

Exécuter Spark sur Cloud Dataproc

2 heures pour terminer
9 vidéos (Total 49 min)
9 vidéos
Exécuter Hadoop sur Cloud Dataproc10 min
GCS au lieu de HDFS6 min
Optimiser Dataproc5 min
Optimiser le stockage Dataproc9 min
Optimiser les modèles et l'autoscaling avec Dataproc4 min
Optimiser la surveillance Dataproc3 min
Présentation de l'atelier : Exécution de tâches Apache Spark sur Cloud Dataproc27s
Résumé31s
1 exercice pour s'entraîner
Exécuter Spark sur Cloud Dataproc4 min
Semaine
2

Semaine 2

3 heures pour terminer

Gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer

3 heures pour terminer
11 vidéos (Total 45 min)
11 vidéos
Composants de Data Fusion2 min
Créer un pipeline6 min
Explorer des données avec Wrangler1 min
Atelier : Créer et exécuter un graphique de pipeline dans Cloud Data Fusion17s
Organiser les tâches dans les services GCP avec Cloud Composer1 min
Environnement Apache Airflow1 min
DAG et opérateurs12 min
Planification du workflow6 min
Surveillance et journalisation4 min
Atelier : Présentation de Cloud Composer12s
1 exercice pour s'entraîner
Cloud Data Fusion et Cloud Composer30 min
7 heures pour terminer

Traiter des données sans serveur avec Cloud Dataflow

7 heures pour terminer
12 vidéos (Total 40 min)
12 vidéos
Pourquoi les clients apprécient Dataflow ?3 min
Créer des pipelines Cloud Dataflow dans le code3 min
Considérations à prendre en compte dans l'élaboration de pipelines2 min
Transformer les données avec PTransforms3 min
Atelier : Créer un pipeline Dataflow simple17s
Agréger avec GroupByKey et Combine7 min
Atelier : MapReduce dans Cloud Dataflow18s
Entrées secondaires et fenêtres de données4 min
Atelier : Utiliser les entrées secondaires de pipeline11s
Créer et réutiliser des modèles de pipeline3 min
Pipelines Cloud Dataflow SQL3 min
1 exercice pour s'entraîner
Traiter des données avec Cloud Dataflow30 min
4 minutes pour terminer

Résumé

4 minutes pour terminer
1 vidéo (Total 4 min)
1 vidéo

À propos du Spécialisation Data Engineer, Big Data and ML on Google Cloud en Français

Data Engineer, Big Data and ML on Google Cloud en Français

Foire Aux Questions

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.