À propos de ce cours
58,605 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 23 heures pour terminer

Recommandé : 4 weeks of study, estimated 2 hours per week....

Anglais

Sous-titres : Anglais

Ce que vous allez apprendre

  • Check

    How to make systems reliable

  • Check

    Understanding SLIs, SLOs and SLAs

  • Check

    Quantifying risks to and consequences of SLOs

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau avancé

Approx. 23 heures pour terminer

Recommandé : 4 weeks of study, estimated 2 hours per week....

Anglais

Sous-titres : Anglais

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
27 minutes pour terminer

Introduction to SRE

This module is intended to bring you up to speed on the concepts underpinning SRE, CRE, and SLOs. If you're already familiar with these concepts, you may still find new information and perspectives in this module, but it is not necessary to complete it.

...
9 vidéos (Total 15 min), 1 quiz
9 vidéos
Introduction15s
Intro10s
CRE's Three Reliability Principles3 min
Reliability in the Cloud3 min
How SLOs help your business make decisions1 min
How SLOs help you build features faster1 min
How SLOs help you balance operational and project work1 min
Making SLOs work for your organization59s
1 exercice pour s'entraîner
DevOps/SRE1 min
1 heure pour terminer

Targeting Reliability

In this module we’re going to talk about how you measure the desired reliability of a service. We will address what to consider when setting SLOs for your application within your organization. We'll look at the three principles we use to measure the desired reliability of a service: figuring out what you want to promise and to whom, figuring out the metrics you care about that make your service reliability “good", and finally, deciding how much reliability is good enough.

...
7 vidéos (Total 14 min), 4 quiz
7 vidéos
SLOs vs SLAs2 min
The happiness test2 min
How do we measure reliability?3 min
Edge cases2 min
100% is the wrong target1 min
Iterating1 min
4 exercices pour s'entraîner
A working service5 min
SLOs and SLAs7 min
Reliability and iterating1 min
Targeting Reliability Assessment7 min
1 heure pour terminer

Operating for Reliability

In this module, we’ll start by introducing a mechanism for quantifying unreliability using something called an error budget. We'll show how error budgets help you decide when to focus on making a service more reliable. And then we'll learn about some of the engineering and operational improvements that can help you do that.

...
7 vidéos (Total 19 min), 3 quiz
7 vidéos
Error budgets3 min
Everything is a trade-off3 min
Error budgets: advanced concepts2 min
Axes of improvement4 min
Operational approach to increasing reliability2 min
Module summary50s
3 exercices pour s'entraîner
Error budgets5 min
Increasing reliability3 min
Operating for Reliability Assessment5 min
Semaine
2
1 heure pour terminer

Choosing a Good SLI

In this module we will start off by taking a look at some characteristics of monitoring metrics that can make them useful as SLIs and contrast these against other metrics that are less useful. Because the choice of where to measure an SLI is a key variable, we'll cover the five main ways you can measure an SLI and compare their pros and cons.

...
14 vidéos (Total 41 min), 3 quiz
14 vidéos
User happiness in metric form1 min
The properties of good SLI metrics4 min
Ways of measuring SLIs4 min
The SLI menu2 min
The SLI equation1 min
Request / Response SLIs5 min
Data processing SLIs6 min
"But my system is really complex!"2 min
Managing complexity with aggregation2 min
Managing complexity with bucketing3 min
Achieveable SLOs1 min
Aspirational SLOs1 min
Continuous improvement1 min
3 exercices pour s'entraîner
Measuring happiness1 min
Commonly used SLIs2 min
Correctness and Coverage2 min
Semaine
3
5 heures pour terminer

Developing SLOs and SLIs

In this module, we'll start off with an overview of our four step process for developing SLOs and SLIs for a user journey. We'll introduce the fictional company that created our example mobile game, the infrastructure that we'll be working with, and the simple user journey we'll be applying the four step process to.

...
7 vidéos (Total 18 min), 4 quiz
7 vidéos
The 4 step process1 min
Our example game1 min
Loading the profile page1 min
Refining SLI specifications4 min
Looking for observability gaps2 min
Failure modes4 min
2 exercices pour s'entraîner
Postmortem!15 min
Setting Achievable SLO targets15 min
Semaine
4
4 heures pour terminer

Quantifying Risks to SLOs

In this module we'll be taking a critical look at the availability risks for our example service. We want to answer the question: "are our SLO targets and error budgets realistic?"

...
4 vidéos (Total 20 min), 2 quiz
4 vidéos
Is your error budget realistic?3 min
Modeling risks in our spreadsheet5 min
Analyzing risk9 min
1 heure pour terminer

Consequences of SLO Misses

In this module, we'll cover best practices for documenting your SLOs, the rationale behind a formal error budget policy and how best to create one and finally, we'll look at an example error budget policy in order to understand the trade-offs and incentives that play out during negotiations when trying to write an error budget policy.

...
9 vidéos (Total 21 min), 3 quiz
9 vidéos
No surprises2 min
A dashboard example1 min
Why an error budget policy?2 min
Fundamentals of an error budget policy3 min
How to draft an error budget policy3 min
Example policy thresholds3 min
A hypothetical policy scenario3 min
Course conclusion and video wrap up47s
3 exercices pour s'entraîner
Error budget policies1 min
Error budget policy -- considerations2 min
Consequences of SLO Misses1 min
4.5
18 avisChevron Right

Principaux examens pour Site Reliability Engineering: Measuring and Managing Reliability

par RAMay 4th 2019

This is a excellent course that covers the in depth topics on Site Reliability Engineering

À propos de Google Cloud

We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success....

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous achetez un Certificat, vous bénéficiez d'un accès à tout le contenu du cours, y compris les devoirs notés. Lorsque vous avez terminé et réussi le cours, votre Certificat électronique est ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.