À propos de ce cours
4.1
157 notes
29 avis
Spécialisation

Cours 4 sur 6 dans le

100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Heures pour terminer

Approx. 15 heures pour terminer

Recommandé : There is about 3-4 hours of video lectures per week. Each week's quiz takes about 30 minutes. ...
Langues disponibles

Anglais

Sous-titres : Anglais, Coréen

Compétences que vous acquerrez

GraphsDistributed ComputingBig DataMachine Learning
Spécialisation

Cours 4 sur 6 dans le

100 % en ligne

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.
Dates limites flexibles

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.
Heures pour terminer

Approx. 15 heures pour terminer

Recommandé : There is about 3-4 hours of video lectures per week. Each week's quiz takes about 30 minutes. ...
Langues disponibles

Anglais

Sous-titres : Anglais, Coréen

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
Heures pour terminer
3 heures pour terminer

Course Orientation

You will become familiar with the course, your classmates, and our learning environment. The orientation will also help you obtain the technical skills required for the course....
Reading
1 vidéo (Total 26 min), 4 lectures, 1 quiz
Reading4 lectures
Syllabus10 min
About the Discussion Forums10 min
Updating Your Profile10 min
Social Media10 min
Quiz1 exercice pour s'entraîner
Orientation Quiz10 min
Heures pour terminer
2 heures pour terminer

Module 1: Spark, Hortonworks, HDFS, CAP

In Module 1, we introduce you to the world of Big Data applications. We start by introducing you to Apache Spark, a common framework used for many different tasks throughout the course. We then introduce some Big Data distro packages, the HDFS file system, and finally the idea of batch-based Big Data processing using the MapReduce programming paradigm. ...
Reading
13 vidéos (Total 108 min), 1 lecture, 1 quiz
Video13 vidéos
1.1.2 Apache Spark11 min
1.1.3 Spark Example: Log Mining9 min
1.1.4 Spark Example: Logistic Regression7 min
1.1.5 RDD Fault Tolerance4 min
1.1.6 Interactive Spark4 min
1.1.7 Spark Implementation4 min
1.2.1 Introduction to Distros3 min
1.2.2 Hortonworks23 min
1.2.3 Cloudera CDH2 min
1.2.4 MapR Distro2 min
1.3.1 HDFS Introduction15 min
1.3.2 YARN and MESOS9 min
Reading1 lecture
Module 1 Overview10 min
Quiz1 exercice pour s'entraîner
Module 1 Quiz30 min
Semaine
2
Heures pour terminer
6 heures pour terminer

Module 2: Large Scale Data Storage

In this module, you will learn about large scale data storage technologies and frameworks. We start by exploring the challenges of storing large data in distributed systems. We then discuss in-memory key/value storage systems, NoSQL distributed databases, and distributed publish/subscribe queues. ...
Reading
24 vidéos (Total 303 min), 1 lecture, 1 quiz
Video24 vidéos
2.1.1 Introduction to MapReduce with Spark3 min
2.1.2 MapReduce: Motivation15 min
2.1.3 MapReduce Programming Model with Spark9 min
2.1.4 MapReduce Example: Word Count9 min
2.1.5 MapReduce Example: Pi Estimation & Image Smoothing15 min
2.1.6 MapReduce Example: Page Rank13 min
2.1.7 MapReduce Summary4 min
2.2.1 Eventual Consistency – Part 110 min
2.2.2 Eventual Consistency – Part 220 min
2.2.3 Consistency Trade-Offs4 min
2.2.4 ACID and BASE19 min
2.2.5 Zookeeper and Paxos: Introduction10 min
2.2.6 Paxos17 min
2.2.7 Zookeeper16 min
2.3.1 Cassandra Introduction27 min
2.3.2 Redis7 min
2.3.3 Redis Demonstration14 min
2.4.1 HBase Usage API15 min
2.4.2 HBase Internals - Part 117 min
2.4.3 HBase Internals - Part 29 min
2.4.4 Spark SQL8 min
2.5.5 Spark SQL Demo8 min
2.5.1 Kafka17 min
Reading1 lecture
Module 2 Overview10 min
Quiz1 exercice pour s'entraîner
Module 2 Quiz30 min
Semaine
3
Heures pour terminer
4 heures pour terminer

Module 3: Streaming Systems

This module introduces you to real-time streaming systems, also known as Fast Data. We talk about Apache Storm in length, Apache Spark Streaming, and Lambda and Kappa architectures. Finally, we contrast all these technologies as a streaming ecosystem. ...
Reading
18 vidéos (Total 216 min), 1 lecture, 1 quiz
Video18 vidéos
3.1.1 Streaming Introduction9 min
3.1.2 "Big Data Pipelines: The Rise of Real-Time"7 min
3.1.3 Storm Introduction: Protocol Buffers & Thrift15 min
3.1.4 A Storm Word Count Example3 min
3.1.5 Writing the Storm Word Count Example10 min
3.1.6 Storm Usage at Yahoo3 min
3.2.1 Anchoring and Spout Replay17 min
3.2.2 Trident: Exactly Once Processing10 min
3.3.1 Inside Apache Storm9 min
3.3.2 The Structure of a Storm Cluster4 min
3.3.3 Using Thrift in Storm10 min
3.3.4 How Storm Schedulers Work12 min
3.3.5 Scaling Storm to 4000 Nodes14 min
3.3.6 Q&A with Bobby Evans (Yahoo) on Storm32 min
3.4.1 Spark Streaming18 min
3.4.2 Lambda and Kappa Architecture4 min
3.4.3 Streaming Ecosystem24 min
Reading1 lecture
Module 3 Overview10 min
Quiz1 exercice pour s'entraîner
Module 3 Quiz30 min
Semaine
4
Heures pour terminer
4 heures pour terminer

Module 4: Graph Processing and Machine Learning

In this module, we discuss the applications of Big Data. In particular, we focus on two topics: graph processing, where massive graphs (such as the web graph) are processed for information, and machine learning, where massive amounts of data are used to train models such as clustering algorithms and frequent pattern mining. We also introduce you to deep learning, where large data sets are used to train neural networks with effective results. ...
Reading
18 vidéos (Total 173 min), 1 lecture, 1 quiz
Video18 vidéos
4.1.2 Pregel - Part 17 min
4.1.3 Pregel - Part 211 min
4.1.4 Pregel - Part 36 min
4.1.5 Giraph Introduction6 min
4.1.6 Giraph Example4 min
4.1.7 Spark GraphX15 min
4.2.1 Big Data Machine Learning Introduction13 min
4.2.2 Mahout: Introduction8 min
4.2.3 Mahout kmeans5 min
4.2.4 Mahout: Naïve Bayes9 min
4.2.5 Mahout: fpm6 min
4.2.6 Spark Naïve Bayes2 min
4.2.7 Spark fpm2 min
4.2.8 Spark ML/MLlib11 min
4.2.9 Introduction to Deep Learning20 min
4.2.10 Deep Neural Network Systems17 min
4.3.1 Closing Remarks1 min
Reading1 lecture
Module 4 Overview10 min
Quiz1 exercice pour s'entraîner
Module 4 Quiz30 min
4.1
29 avisChevron Right

Meilleurs avis

par UNApr 10th 2018

My understanding of Big Data technologies was really enhanced by this course. I have decided to pursue more of these underlying technologies after this course. Good job

par MSNov 27th 2017

Very good introduction of application concepts of cloud data computing. Thank You!

Enseignants

Avatar

Reza Farivar

Data Engineering Manager at Capital One, Adjunct Research Assistant Professor of Computer Science
Department of Computer Science
Avatar

Roy H. Campbell

Professor of Computer Science
Department of Computer Science
Graduation Cap

Commencez à travailler pour obtenir votre master

Ce cours fait partie du diplôme intégralement en ligne Master in Computer Science de University of Illinois at Urbana-Champaign. Si vous êtes admis au programme complet, vos cours sont pris en compte dans votre apprentissage diplômant.

À propos de University of Illinois at Urbana-Champaign

The University of Illinois at Urbana-Champaign is a world leader in research, teaching and public engagement, distinguished by the breadth of its programs, broad academic excellence, and internationally renowned faculty and alumni. Illinois serves the world by creating knowledge, preparing students for lives of impact, and finding solutions to critical societal needs. ...

À propos de la Spécialisation Cloud Computing

The Cloud Computing Specialization takes you on a tour through cloud computing systems. We start in in the middle layer with Cloud Computing Concepts covering core distributed systems concepts used inside clouds, move to the upper layer of Cloud Applications and finally to the lower layer of Cloud Networking. We conclude with a project that allows you to apply the skills you've learned throughout the courses. The first four courses in this Specialization form the lecture component of courses in our online Master of Computer Science Degree in Data Science. You can apply to the degree program either before or after you begin the Specialization....
Cloud Computing

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous vous inscrivez au cours, vous bénéficiez d'un accès à tous les cours de la Spécialisation, et vous obtenez un Certificat lorsque vous avez réussi. Votre Certificat électronique est alors ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.