Leveraging Unstructured Data with Cloud Dataproc on Google Cloud Platform en Français, Google Cloud
À propos de ce cours
Ce cours accéléré d'une semaine s'appuie sur les cours précédents de la spécialisation Data Engineering on Google Cloud Platform. À travers un ensemble de présentations vidéo, de démonstrations et d'ateliers pratiques, vous apprendrez à créer et gérer des clusters de calcul pour exécuter des tâches Hadoop, Spark, Pig et/ou Hive sur Google Cloud Platform. Vous découvrirez également comment accéder à diverses options Google Cloud Storage à partir de vos clusters de calcul et comment intégrer les fonctionnalités de machine learning de Google à vos programmes d'analyse.
Lors des ateliers pratiques, vous allez créer et gérer des clusters Dataproc à l'aide de la console Web et de l'interface de ligne de commande (CLI). Vous utiliserez les clusters pour exécuter des tâches Spark et Pig. Vous créerez ensuite des blocs-notes iPython qui s'intègrent à BigQuery et à Google Cloud Storage, et qui utilisent Spark. Enfin, vous intégrerez les API de machine learning à vos analyses de données.
Prérequis
• Avoir suivi la formation Google Cloud Platform Fundamentals: Big Data & Machine Learning (ou une formation équivalente)
• Disposer d'une certaine connaissance de Python...