Les pipelines de données s'inscrivent généralement dans le paradigme EL (extraction et chargement), ELT (extraction, chargement et transformation) ou ETL (extraction, transformation et chargement). Ce cours vous indiquera quel paradigme utiliser pour le traitement de données par lot en fonction du contexte. Il vous présentera également plusieurs solutions Google Cloud de transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement des données sans serveur avec Dataflow. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant des composants de pipelines de données sur Google Cloud à l'aide de Qwiklabs.
Ce cours fait partie de la Spécialisation Data Engineer, Big Data and ML on Google Cloud en Français
Offert par
À propos de ce cours
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Cours 3 sur 5 dans le
Niveau intermédiaire
Approx. 17 heures pour terminer
Français
Ce que vous allez apprendre
Explorer différentes méthodes de chargement de données (EL, ELT et ETL) et déterminer quand les utiliser
Exécuter Hadoop sur Dataproc, exploiter Cloud Storage et optimiser les tâches Dataproc
Utiliser Dataflow pour créer vos pipelines de traitement de données
Gérer des pipelines de données avec Data Fusion et Cloud Composer
Dates limites flexibles
Réinitialisez les dates limites selon votre disponibilité.
Certificat partageable
Obtenez un Certificat lorsque vous terminez
100 % en ligne
Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Cours 3 sur 5 dans le
Niveau intermédiaire
Approx. 17 heures pour terminer
Français
Offert par
Programme de cours : ce que vous apprendrez dans ce cours
1 minute pour terminer
Présentation
1 minute pour terminer
1 vidéo (Total 1 min)
23 minutes pour terminer
Présentation de la création de pipelines de données par lot
23 minutes pour terminer
6 vidéos (Total 21 min)
2 heures pour terminer
Exécuter Spark sur Dataproc
2 heures pour terminer
11 vidéos (Total 48 min)
10 heures pour terminer
Traiter des données sans serveur avec Dataflow
10 heures pour terminer
14 vidéos (Total 36 min)
À propos du Spécialisation Data Engineer, Big Data and ML on Google Cloud en Français

Foire Aux Questions
Puis-je prévisualiser un cours avant de m'inscrire ?
À quoi ai-je droit si je m'inscris ?
Quand recevrai-je mon Certificat de Cours ?
Pourquoi ne puis-je pas assister à ce cours en auditeur libre ?
Une aide financière est-elle possible ?
D'autres questions ? Visitez le Centre d'Aide pour les Étudiants.