The One with SLOs and Sal Furino

Durée: 43m55s

Date de sortie: 18/06/2025

In this episode, Sal Furino, Customer Reliability Engineer at Bloomberg, discusses all things Service Level Objectives (SLOs) with hosts Steve McGhee and Matt Siegler. Together, they dig into what successful SLOs look like, how it relates to users, and how SLOs provide an effective framework for joint decisions about system reliability across product, engineering, and leadership teams.

Salut tout le monde, bienvenue à la fête de la fête de la podcast.
Google est un podcast sur la compétition de l'engineering et de la production de la

Je suis votre host, Steve McGee.
Cette fête est de nos amis et de nos taux de la France.
C'est tout pour ce qui est venu dans le space de la SRE, de la nouvelle technologie, de
les processus modernisés.
Et bien sûr, la partie la plus importante est la fête que nous avons faite.
Alors, bonsoir à tous et à vous de vous rappeler, j'espère que ce n'est pas une stratégie.
Salut tout le monde, bienvenue à la fête de la podcast.
C'est un podcast sur Google sur la production de l'engineering et de la production de la SRE.
Je suis Steve McGee.
Et qui est-ce qui est ici aujourd'hui?
Je suis Matt Sigler.
Salut Matt, vous êtes là.
Excellent.
Nous avons un guest aujourd'hui, de la grande ville,
la grande Apple, je pense que c'est appelé ces jours.
Bonjour guest, qui êtes-vous exactement et qu'est-ce que vous faites ici?
Salut tout le monde, je suis South Burino, je suis un
employeur de la construction de la construction de la SRE, à Bloomberg.
Et je adore les objectifs de service.
C'est quelque chose que je suis vraiment passionné.
Oui.
Et je suis vraiment heureux d'être ici sur le podcast de Google.
Bienvenue, bienvenue, bienvenue à Bloomberg est une company qui
tente de la monnaie ou quelque chose ou t'aiment les gens de la monnaie, je pense.
Qu'est-ce que vous faites là?
Donc, ce que nous faisons, c'est que nous nous proposons beaucoup de
information financière sur les marchés du monde.
Donc, si vous avez l'air de cette chose ou que vous avez des news
et des médias qui sont relativement liés à ça, qui est
vraiment expansif, si vous pensez à la très grande
communauté et des choses différentes qui sont là-bas, nous
coverons beaucoup.
Vous direz que les computer sont invités?
Oh, oh oui.
Ok, cool.
Beaucoup de computers sont invités.
Ok, cool.
Tout le temps.
Excellent, excellent.
Donc, je pense que nous parlons de les gens de la même manière.
Et donc, vous avez des objectifs de service, on a des
SOOs.
C'est surtout drôle pour moi parce que je vis
dans une ville qui s'appelle SOO aussi, vous savez que c'est le meilleur.
Je souhaite que je fasse de la salle de la salle, juste pour que je
puisse vivre dans la autre ville où il y a un SOO.
Je pense que ça serait super drôle.
Mais si les gens sont en train de voir ce que vous voyez, et
ils ne savent pas ce que c'est, c'est ce que c'est votre
explication initiale pour les gens.
Bienvenue dans le monde des SOOs et vous avez rencontré votre
meilleur ami.
Donc, ça dépend vraiment de qui l'audience est.
Parce que je pense que je explique les SOOs beaucoup
différente de ma famille ou d'autres, on le dit plus
tôt, non techniques, que je suis un personne technique.
Donc, où vous voulez que je commence?
Oui, Matt, c'est notre audience ici.
Vous me dis.
Vous êtes un ingénieur, vous travaillez sur un système de
software, vous avez des clients et vous êtes concerné
que vous êtes heureux et que vous voulez augmenter
la heure de vos clients et que vous voulez faire ça
dans un façon structurelle.
Et vous avez entendu ce truc et vous pensez que ça
pourrait être une façon structurelle pour faire ça.
Go ahead et les faire avancer par ce passage.
Oui, donc si vous êtes un ingénieur et que votre team ou
quelqu'un ou quelqu'un de votre team, qui est en train de
produire un software que les gens utilisent, ce qui
je pense que le système de software est là-bas, vous
serez familiar avec quelque chose de la technologie ou
de l'absorbillité que vous avez en plus dans la
maison de la wheel.
Donc, si vous pensez à ce que l'SLO est, c'est un peu
de la fourre, les deux.
Le premier, il y a un SLI, qui a un petit débat sur
ce que l'SLO est, c'est ou n'est, et ce n'est pas.
C'est un SLI, mais on va juste se démarquer tout ça
en un second.
Et si vous pensez à un SLI, vous pouvez penser à
cela, souvent comme une métro que vous avez créée par
quelque type de courriel.
Vous faites ce type.
C'est un indicateur, le oiseau est un indicateur
pour les stars.
C'est un métro, c'est un indicateur, c'est un
truc qui nous dit quelque chose.
Oui, exactement.
Oui, OK, allez-y.
Donc, après que vous avez ce indicateur, vous
avez un objectif, qui est généralement un
valeur dans mon compte.
C'est un valeur qui s'agit de l'underline
métro en main.
Donc, si nous parlons de la duration ou de
la duration, ces sont des choses comme, je ne sais,
500 ms, 1 seconde, 5 secondes, etc.
ou un certain unité de temps.
Si nous pensons en parlant de peut-être
un type d'availabilité, il peut
rappeler un type de status code, comme
le code HDP status, par exemple,
peut-être 200 ms, c'est un bon, et peut-être
400 ms, 500 ms, c'est un mauvais, ou quelque
chose comme ça.
C'est un indicateur de quelque chose.
Donc, c'est le second point.
Puis, la troisième partie est le target.
Le target est comment souvent l'ESLI
doit être subjetif.
Cela est généralement expéré par un
certain valeur pour le % et, en étant en
reliability, nous aimons des 9s.
Je ne sais pas pourquoi 9s, c'est la
chose pour notre industrie, mais ils
sont vraiment, peut-être, que nous
abîmes les telcoms pour commencer
avec les 5 9s ou quelque chose.
Mais il y a des gens qui généralement
disent que 1, 2, 3, 4, 5 9s
sont en reliability.
Et puis, un exemple de 1 9
peut être 90 % reliable, ou 2 9s,
99, 3 9s, 99.9, etc.
Et puis, la dernière partie, on a
le temps de l'élection, ce qui est
comment l'objectif doit être
le target.
Donc, ce sont des choses qui
peuvent être un peu variables,
elles peuvent être, vous savez, 15
minutes, elles peuvent être une
heure, elles peuvent être un jour,
elles peuvent être 30 jours,
elles peuvent être 90 jours ou
un quartier.
Et il y a des différentes manières
où vous pouvez jouer sur les
temps de l'élection.
Mais ce qui est vraiment
bon, et ce qui est, et je me
rappelle que je dis qu'il y a 4 choses
qui se sont dit, c'est qu'il y a
en fait une chose secrète.
Perfect.
Donc, quand on parle de la
chose secrète, c'est un
outil des autres 4.
Et ce n'est pas quelque chose qu'on
souhaite qu'on appelle un budget
et ce n'est pas quelque chose
que peut généralement être exprès
par un sentiment.
Je peux vous donner un shout out
en fait, pour quelqu'un?
Totalement.
Oui, donc Fred Moye
a popularisé cette idée
d'expression des budgets
en un sentiment où vous mettez
tout ensemble.
Je pense qu'il a donné ce talk,
je pense que c'est monorama
si vous êtes là.
Et ça, et il explique
ça vraiment bien.
Donc, c'est un exemple.
Donc, on va dire qu'on a un
site de commerce,
tout le monde a mis
a bâti quelque chose online
probablement dans le passé
de 10 ans ou so.
S'il y a quelque chose
vraiment important
pour les websites de commerce
c'est combien ça prend
pour procéder à l'ordre
de vérifier votre carte.
Donc, c'est quelque chose
que si vous faites tout ce travail
de construire toute la carte
pour acheter tout ce genre de choses
et que je vais essayer de vous donner
du ménage
et que vous ne pouvez pas
prendre du ménage
et procéder rapidement,
je vais laisser et abandonner
cette carte
et vous perdrez
un ménage de salaire.
C'est important
pour ce business.
C'est un jour
d'adresse de customer.
Et, pour cet exemple,
nous parlons d'une bonne expérience
pour la carte de vérification
de 500 milliseconds.
Et nous voulons que ça soit
99,9% de la time,
3,9%.
Et nous sommes concernés
de ce qu'on peut faire
sur une window de 1 jour.
Quand vous vous mettez tout ça ensemble
vous pouvez expérimenter
l'aéroportie comme disant
que l'aéroportie est 0,1%
de la trafic
sur les 24 heures précédentes
est laissée prendre plus d'un
500 secondes
pour procéder à la requête.
Donc, c'est un autre moyen
de framer
l'amount de la reliantité
ou de l'inréliabilité
dans lequel votre service
peut tolérer.
Il y a un autre moyen de penser
sur ce que nous devons faire
et sur ce que nous devons faire
pour nous tolérer
une réputation avec nos
clients, des utilisateurs
ou des députés
de ce service capital S.
Comment est-ce que c'est trop mal?
Oui.
Quand devons-nous nous en faire?
C'est cool si ça se démarre
un peu?
Ça ne doit pas se démarrer
beaucoup.
Quand on a vraiment besoin?
Parce que l'autre moyen
est de dire
« Sal, pourquoi ne nous
ne voulons pas
prêter tout le temps?
»
On va juste aimer
1 million.
C'est un numéro, c'est-à-dire.
Oui.
Donc, je pense
que vous pouvez
potentiellement
être 100%
reliable,
mais ça va être
extrêmement limité.
C'est extrêmement limité.
Vous allez probablement
avoir un système
où vous ne faites pas
beaucoup de changements.
C'est un truc très statique.
Vous allez probablement
être triple
ou quadruple
rédondant
sur différentes choses
là-bas
et sensé
faire des expenses.
Des expenses.
Et sensé
pour faire des expenses.
C'est vraiment expensif,
vraiment costel.
Et ça ne va pas
pas être votre modèle
opérationnel
si vous êtes
dans un espace compétitif.
Donc,
si vous commencez à
s'accepter
que vous allez
faire des expenses
ou que vous ne seriez pas
accepté
l'idée de
un budget d'air
ou un nombre
de l'inreliabilité
et quand vous commencez
à s'accepter
cette idée
vous pouvez commencer à
penser à ça
comme
Hey,
comment est-ce que l'inreliabilité
peut-on utiliser
et jouer avec
afin d'en faire
expérimences
et d'en savoir
comment les utilisateurs
utilisent notre système
et comment ils l'expérimentent.
Donc, vous avez
mis des SLOs.
On peut dire qu'on a
une ou deux de ces.
Et vous vous vous
vous vous intervient.
Vous êtes comme
je pense que c'est un bon target.
Je ne sais pas.
Vous êtes des business leaders
comme ça.
C'est bon.
99 % de gens
seront heureux
parce que
dans une demi-sécuté
il y a un
bout
qui me fait
me mettre en place.
On peut juste imaginer
que 99 %
de la clé
de la bouteille
est en train de
mettre en place.
Je pense que c'est
un bon
et pas un bon target.
En fait, ça me semble
très terrible.
99 %
c'est probablement pas
assez
mais
je suis en train de
faire un petit shop
et ça me semble bien.
Et j'ai un autre
qui est
je ne sais pas.
Mon site est là
99 % de la clé
et quand ils viennent
ouvrir la bouteille
ça ne se fait pas
juste de rire
immédiatement
sur le load.
Ils sont comme
bonnes points de start.
Qu'est-ce qu'on peut faire
maintenant que nous avons
mis ces là-bas
sur le terrain?
On a un site web
on les a
dans
et vous avez décroché
un budget.
Qu'est-ce que nous pouvons faire
maintenant
que nous avons ces en place?
Qu'est-ce que nous pouvons faire
avant?
Oui, que nous ne pouvons pas
faire avant.
Oui, c'est vrai.
Nous sommes juste
en train de le dire.
Maintenant, nous avons un
truc à mesurer
et il nous dit une histoire.
Qu'est-ce que la histoire a permis
nous de faire avec des contrôles?
Il a mentionné
je pense les deux plus
populaires des SLOs
et c'est probablement
les lignes de l'entrée
qui sont vraiment
bonnes
et qui commencent
à avoir des idées
ou un custom
pour l'idée
des SLOs
et des budgets
et des liabilities
et ceux qui sont
autour de l'availabilité
et de la latinité.
Il peut généralement
être sumé en
comme
en parlant de
le Hidalgo recently
et il a mentionné
que
il n'y a que deux SLOs
que nous nous donnons
les usages
ce qu'ils veulent
et que ça ne se passe
rapidement.
Mais si nous leur donnons
ce qu'ils veulent
c'est que
quand ils commencent à
enverser
ça
va être
un peu
un peu
tout le monde
tous les différents
SLOs
qui sont là-bas.

avec ceux
je pense qu'ils vous donnent
des conseils
de
est-ce que nous
répondons
aux clients
quand ils nous donnent
une réquestion
et est-ce que nous répondons
à ça
rapidement
ou à un réponse
rapidement
on ne parle pas
si c'est correct
encore
on parle de
un réponse
qui est généralement
vraiment important.
Donc
vous pensez à
cette façon
si vous voyez
que
votre réavailabilité
de l'air
de l'épreuve
est commencé à se débrouiller
vous commence à
débrouiller
l'épreuve
de l'épreuve
mais vous voyez
votre latinité
est complètement fine
ce serait peut-être
parce que
c'est plus rapide
de servir un 500
que c'est de servir
un proper
200
responsables
qui est
enversé
correctement.
Donc je pense qu'il y a aussi
une
maturité
qui arrive
à comprendre
comment
vos mémoires
travaillent ensemble
et vous
vous emmenons
à faire des troubles
d'une question
où ça se passe.
Donc,
nous allons
vous aller viral.
Vous savez,
c'est bien pour le business
mais probablement
terrible
pour l'infrastructure
pour
comment
cela se passe
si vous êtes
juste un petit
local
de la t-shop.
Vous devez
pouvoir
contrôler
cette charge
et la scale
en accordant.
Donc,
c'est où
il y a d'autres
autres
salauds
comme ceux
qui sont
sur la saturation
et à comprendre
ce que sont les
bâtons de votre système
et où
ils
ont
l'expérience
pour les pauvres.
Donc,
peut-être
votre bâton
de
je ne sais pas
des connecteurs
ou des connecteurs
ou
d'autres
de l'autre
et à savoir
comment
vous avez
protégé
votre système
et à
prendre
comment vous
vous faites
pour
les
capacités.
Et
je vais dire
que
les salauds
sont
probablement
une déviation
de la
mesurer
l'expérience
et plus
de la
santé
du système technique.
Mais
ils sont
importants
de savoir
quand
et
comment
les salauds

affectifs.
Donc,
c'est
vraiment
bon
un
style.
C'est un
comprendre
ce que ces salauds
sont
pour
et
les gens
parlent
des salauds
ou des salauds
qui
sont

d'autres
salauds

d'autres
salauds
qui

salauds
qui
sont
d'autres
salauds
qui

d'autres
salauds
qui

d'autres
salauds
qui

d'autres
salauds
qui

salauds
qui

d'autres salauds

C'est un
style
qui
est

un
style
qui

style

un

style
qui

un
style
qui

un

style
qui
est
un

qu'ils
qui

pa
ver
la personne et le customer ou l'utilisateur pour les avant et les avant.
C'est la chose qui est la plus importante avec les SLOs.
J'ai donné un talk à SREcon et j'ai dévoilé le premier item
de la mesure de ce qui s'est passé à vos utilisateurs.
Ne pas les mesurer comme les CPUs, comme les DysAO,
ce n'est pas important ou utile de l'SLO,
le Sli pour vos SLOs.
C'est mieux d'essayer de venir avec les proches
de l'utilisateur ou l'expérience de l'usage
et de commencer à mesurer cela.
J'aime jeter avec les gens qui ont des métriques traditionnels
qui ont été incluses à la température de la CPU.
Au bout du jour, je ne m'en souviens pas de la forme de votre computer.
Qu'est-ce que ça doit faire avec la fédération des clients ?
Absolument rien.
C'est un exemple très facile.
Il y a encore des équipes qui sont en mesure de la fédération des disques,
où il y a beaucoup de disques qui sont rédendus.
Qu'est-ce que nous faisons ?
Vous vous inquiétez.
Mais c'est le corps du SLO,
ce qui est le sens de l'usage,
le sens de l'usage,
pas de la fédération,
mais de la whole système.
Est-ce que c'est quelque chose que vous pensez que les gens ont ?
Ou est-ce que c'est un problème de ne pas le faire ?
Mais d'appeler ?
Où est le connecteur ?
Où est le problème quand il s'agit de ça ?
Je vais répondre à ça en un second,
mais je vais nous prendre un tour d'étoiles.
Vous avez mentionné deux Sli,
c'est un des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des des
qu'avec l' глage de något abstait il y a de la j fuckin juste parce que jerios plus de nous

оч
sakeeper
de la
visre

chantiendo
l' Election
ap
s
br
et comment rapidement les outils ou les outils se sont allés pour ça.
Donc, il y a toujours des exceptions à la rule.
Quand on parle des choses, il y a toujours des cabinets ici et là,
mais j'ai essayé de penser à ce que l'expérience de mon core user est.
Maintenant, on va remercier votre question.
C'est-à-dire, que les équipes d'infrastructure, ou les équipes d'engineering
sont desquelles ils ont des problèmes de savoir ce que l'expérience de mon core user est.
Et je dirais absolument que c'est un commun à l'industrie.
Je pense que c'était dans le reportage de DevOp Store en 2023.
Ils avaient un code dans le reportage.
Il y avait quelque chose à l'effect de...
Les ingénieurs généralement détenuent la santé du système technique
et pas la bonhonneur de leurs utilisateurs.
C'est juste un trend pour les industries.
C'est quelque chose que beaucoup de gens ont de l'air de l'envers.
Je pense que beaucoup d'ingénieurs ne sont pas des producteurs.
Ils pensent en général de la machine globale de services et de travail.
Ils sont concernés avec la machine et la santé.
Je vais vous donner un appel à Star Trek.
Un des les plus fameux épisodes est les Trials & Tribbles.
Toutes les Tribbles explodent la population sur la station spatiale.
Scotty est obssetté quand ils sont en train de s'insulter le ship.
Et non le capteur de la ship.
Je me sens comme si les ingénieurs ont pris le temps de les faire.
Ils ne pensent pas de la façon dont ils ont été utilisés.
C'est quelque chose que nous devons avoir à faire.
Si vous êtes ingénieur et vous n'êtes pas en train de mesurer
votre bonheur de vos utilisateurs et de vos systèmes
et vous avez juste à mesurer la santé du système que vous avez construit,
vous devez vous faire.
Vous devez vous faire un tour de votre jeu.
Vous devez penser à quoi ça veut être en train d'être ingénieur.
Si vous êtes ingénieur et que les gens veulent aller au bord de la rive,
vous ne devriez pas vous donner un livre sur comment construire un boat.
Vous devez construire un bruit pour les faire plus facilement.
Je pense que c'est plus comme un ethos de ce que l'ingénieur est.
Nous faisons des choses plus plus simples pour les gens.
Et vous devez garder vos gens en tête de ceux que vous êtes ingénieur.
Ok, avec ça en mind,
vous avez appris à l'équipe, imaginez que vous êtes l'oracle,
vous vous êtes à l'oracle et vous avez donné leur philosophie.
Vous avez dit, je veux que vous soyez en train de prendre cette approche,
je veux que vous parlez pour les utilisateurs,
vous avez mis le jeu au point de faire un bon emploi,
vous avez les gens à construire,
un bon emploi va nous donner la question de
comment est-il le bon emploi.
Les SOOs, les SOIs, ils sont en train de les mesurer,
ils sont actuellement sur eux.
Maintenant les SOIs vont, je me sens comme si ces choses sont là,
et je ne comprends pas vraiment ce qu'ils ont fait.
Ils sont en train de se faire en mon nom,
et il y a maintenant un retour et un fort entre ces deux équipes,
où les SOIs sont comme, je me sens comme si je suis
puissant à ces SOOs, mais ce n'est pas ce que je fais tous les jours.
Et il y a un autre équipe qui est en train de les défendre et de les répondre,
et je me sens comme si ces deux camps existent dans cette organisation.
Comment construire une relation de santé entre ces deux camps,
entre les SOIs qui travaillent avec les SOIs,
et les SOIs qui travaillent sur les features.
Ils travaillent ensemble, ils se sentent confortables,
et ils se sentent comme si ils sont dans la même équipe,
dans la même direction.
Parce que je me sens comme si ça était des choses culturelles,
qui existent, et la friction existe,
ou peut-être existent si vous ne l'avez pas.
Donc parlez un peu de construire des équipes de santé avec ces deux.
À la fin de la journée, les SOIs sont un framework
pour avoir des décisions jointes
sur la réliabilité et la réliabilité de vos systèmes.
Vous devez avoir
des ingénieurs productifs et de la leadership
en créant, en implémentation, en tweaking,
en ajustant, en réveillant ces SOIs.
Ainsi, vous avez vraiment des KPI sparklers.
Ils sont un team qui est un point
où tout le monde doit travailler ensemble
pour implémenter et faire des défis.
Je ne parle pas de les SOIs que nous créons,
mais de les autres que nous utilisons demain.
Pas de tout.
Les SOIs sont des choses qui vivent et qui sont des choses
que si ce n'est pas de la valeur, ce n'est pas utile.
On va pouvoir se faire tirer et se faire bouger.
Et essayer d'en essayer de ne pas.
Si il y a des choses qui sont très importantes
et qu'on peut avoir besoin d'adjustes
des targets ou des objectifs pour avoir
une valeur additionnelle que vous avez besoin
pour avoir des meilleures alertes de burn rate
ou d'autres choses à l'aéroport.
Il y a des triggers que vous avez utilisé
pour aider à faire des décisions plus utiles.
Et je me sens aussi que,
basé sur votre persona de ces différents teams
et des choses qui sont involvedes,
vous allez regarder des SOIs
mais peut-être que vous avez les mêmes SOIs et d'objectifs.
La chose que vous changez de la vie,
c'est les windows de temps.
Je me sens que les windows de temps
pour les gens qui répondent à l'incident,
c'est des ingénieurs de production,
ou des SOEs,
ou des gens qui sont généralement en call,
sont des choses dans les windows de temps plus court.
C'est probablement le 1H à 48H
des windows de range.
Si vous êtes dans l'app
ou la team de la mort,
peut-être que vous êtes plus concerné
pour que vous soyez alignés
avec les séances de week-end
ou que vous soyez alignés
avec les séances de week-end.
Si vous êtes en producte ou en leadership,
peut-être que vous voulez quelque chose
de plus monthly ou de plus court
et peut-être que vous ne soyez pas
même en rollant à ce point.
Peut-être que vous voulez que ça soit calandre aligné.
Parce que c'est ça que vous pensez
et parlez de la reliabilité
et de l'inquiétude de votre service.
Je l'ai entendu, Eslo,
que la façon dont vous parlez entre les pays
est par la people qui pourrait parler
une langue bizarre.
C'est comme commun entre vos pays différents.
Je l'aime bien
mais c'est la langue interface
entre deux mondes.
On parle les numéros
et l'infrastructure et le data
et on parle aussi les usages
et la fédération
dans la même sentence.
Ils tendent à être basés
sur des facts
en un dashboard
ou un graphe
que les deux équipes
peuvent regarder en même temps
et dire que c'est à l'arrivée
de la personne que nous avons dit que c'est pas basé.
Je l'aime bien
de voir différentes timelines
pour différents équipes.
Si je suis sur le téléphone
et que je dois faire un truc,
je tend à savoir
ce qui a juste passé et ce que je peux faire.
Si je suis le CEO,
je regarde
des revenus en courant.
Ce sont différentes scales de temps
et vous pouvez potentially
utiliser un numéro
si même pas le même
pour comparer les choses
sur différentes scales.
C'est un point grand.
Je pense aussi
que les personnes
qui sont en contact
avec les actions différentes
sont aussi des actions différentes
qui font des features
ou pensent des nouvelles manières
pour que les gens puissent utiliser le système.
Ils pensent en général de plus de temps
que les prochains deux jours.
Je ne sais pas si c'est possible.
Si vous pensez plus
que ce troisième service
est une partie de votre vie
et vous êtes contribuant
à la non-réliabilité,
vous avez de changer les vêtements
ou vous faites quelque chose de différent.
Ces deux sont de différents niveaux
et de différentes scales de temps.
Ce sont des problèmes
de style.
Quand vous faites vos rassemblements,
vous devez penser à des personnes
qui vont utiliser les rassemblements
et faire des actions avec eux.
C'est un gros point.
C'est un gros point.
Ça peut être un travail
pour que vous puissiez comprendre
et faire des choses différentes.
Ce qui commence à me faire
comme un client de la réliabilité
est souvent
comme un couple de services
en fait.
Deux personnes de différents équipes
et si nous parlons de
des journeys d'utilisation
entre les équipes,
comment nous contribuons
à notre voyage,
comment nous distribuons
à l'end de l'expérience.
Le but de ce travail
est d'évoquer le point de finger
et de travailler ensemble
pour que ce soit le plus important.
C'est un rôle très important.
C'est un rôle très important.
En général,
dans le financement
et dans le business,
comment vous le voyez
ou comment vous le voyez
dans ce monde,
peut-être différent de l'industrie
ou peut-être plus uniquement
intéressant.
Avant de rejoindre Bloomberg,
j'ai travaillé à un start-up
où j'ai travaillé
avec beaucoup de consommateurs
et des clients de business.
Mais maintenant, Bloomberg est
une entreprise business-to-business.
Les gens doivent payer
un peu de monnaie pour acheter
un license de Bloomberg
et d'utiliser le terminal de Bloomberg
et de la information qu'il y a.
C'est pas juste de
donner mes emails et que je peux
utiliser ce truc.
Il y a différentes préoccupations
et ce qu'il faut performer
et ce qu'il faut faire pour les gens
à différents temps de temps.
Nous sommes en retard pour les préoccupations.
Ça vous aide à décrire
ce que ces salauds vont être.
Si vos préoccupations sont différentes, vous allez faire des salauds différents.
Quand nous parlons des différences entre
des entreprises et des consommateurs,
si vous êtes quelqu'un de Google,
vous avez beaucoup d'activités de consommateur,
vous avez beaucoup de trafic, de points de données
en fin de journée et en fin de journée,
je suis sûr que vous allez suivre un type de forme
basé sur des heures de jour
ou quelque chose comme ça, basé sur
où votre population en général est dans le monde.
Et je pense que dans le financement,
c'est peut-être un peu plus différent.
Il y a beaucoup plus
de concernes à l'internet de
vos utilisateurs business, vos actuales customers
ne sont pas beaucoup à
d'autres temps.
Est-ce que ces autres temps sont encore importants?
Oui, absolument.
Et je vous informe de vos salauds,
mais il y a des différentes séances
dont les gens doivent prendre.
Et je pense que ça nous donne un point de vue
sur les expériences de votre base d'utilisation,
où sont-ils placés,
quand est-ce qu'il s'est passé,
et que vous avez compris.
Si vous avez compris ça,
vous pourrez mieux comprendre
les volumes de vos préjudices,
et des trucs comme ça.
Je voulais aller à deux différents services
en même temps.
Je suis en charge d'un Android mobile,
et d'un YouTube,
et c'était un con que nous pouvions
voir sur un grand,
un ou deux jours long graph,
vous pouvez voir l'Ocean Pacifique.
C'était le con
parce qu'il pouvait toujours voir un dip,
où personne n'est pas arrivé.
Mais le truc est,
que l'Ocean Pacifique était dans ces deux services,
l'Ocean Pacifique était dans un endroit différent,
parce que les gens utilisent leurs phones
pour faire des choses phony,
des choses phony,
dans un certain part du jour,
et puis ils sont regardés en YouTube
dans différents parts du jour.
C'était tout de même
shifté par deux zones de temps,
ou quelque chose comme ça.
C'était très, très drôle.
Même dans la même
entreprise,
dans la même infrastructure,
même dans une application différente,
dans le même produit,
souvent vous avez
juste des trends différents
comme ce que vous devez être aware de,
et donc vous devez être très careful
de ne pas juste couper et couper
les SOOs, les valeurs,
les expectations de temps
et des choses comme ça en temps.
Ça nous permet de...
C'est comme la dernière partie,
et vous avez hanté de cela avant,
c'est quand vous avez dit,
les SOOs aujourd'hui ne peuvent pas être
les SOOs demain.
Il y a un cycle de vie
de ce genre.
Vous devez...
Je pense que vous allez mieux
en temps.
Et peut-être que vous vous devez commencer
par faire trop peu,
trop beaucoup,
trop précis,
trop grand,
ou quelque chose comme ça.
Et vous voyez ce qui se passe.
Est-ce que vous vous êtes en train
d'assumer que c'est la façon
que les choses travaillent dans le monde,
ou est-ce que les gens
justent la première fois?
Oh, très rarement les gens
la première fois.
Je ne les ai pas encore
la première fois.
Et c'est la beauté de ces choses.
Il y a des choses qui sont en train de se faire,
et c'est là que moi et quelques autres
ont collaboré
en créant quelque chose qui s'appelle
Slow DLC,
c'est slo-dlc.com.
Et c'est une toute méthodologie
de comment penser et utiliser
et opérer les SOOs.
Je crois que ça commence
avec l'initiative,
qui est initialement,
je commence un projet,
de l'acheter,
acheter les idées,
acheter ce qu'il освabphabet
qu'une certaine gebeello babeeeeeee,
plus des autre orbitales,
plus des ondes en v!!
Mais oui,

Mais namaste,
haji,
soina,

nadec,
pl shate
d�us
ально pour wars Victory ou VS
Donc quand je pense correspondement,
nous allons penser à l'exemple de l'exemple de l'économie avant.
Si nous allons regarder des données et réaliser toutes les requêtes de cartes
pour mes websites d'économie, nous avons cinq items ou moins.
Et cela représente 40% de notre trafic.
Nous savons que nous pouvons atteindre les items moins bas,
moins de procédés dans cette carte.
Donc cela peut être utile si vous disiez,
Hey, ma tour de l'entente pour toutes les requêtes de cartes,
et je vais juste faire des numéros ici, les gens.
Peut-être que nous disons que dans 750 milliseconds,
99% de la période, toutes les requêtes de cartes sont procédées.
C'est notre salle globale pour tous nos ordres.
Mais si nous avons cinq items ou moins, peut-être que nous pouvons être plus performants.
Peut-être que nous disons que nous pouvons faire des requêtes de cartes
si nous avons cinq items ou moins dans 250 milliseconds,
ou 9 à la fois.
C'est quelque chose que nous espérons beaucoup plus d'exemple.
Je clique, oh, c'est déjà fait.
C'est quelque chose qu'ils espèrent et qui est procédé.
Vers que si vous avez plus de items dans votre carte, ça peut prendre plus longtemps.
Donc la façon dont vous phrasez que je pensais que c'était vraiment bon,
et que ça montre que vous êtes confortable avec ce truc.
Parce que beaucoup de fois, quand je parle aux gens qui n'ont pas fait ça avant,
ils s'estiment sur leur définition de ce qu'ils veulent faire par rapport à la bonne.
Et la façon dont vous avez dit, je veux faire des requêtes de certain temps
pour un certain nombre de temps,
vous pouvez même dire que, comme les mesures que vous avez mises au bout,
des normes de la logonalysis,
ou les méchants, etc.
Ceci est le texte en anglais.
C'est le SLO, c'est la grande chose.
Et ça nous permet de...
C'est comme un poème,
c'est comme une façon de expliquer ce que nous voulons le système acheter.
Le autre chose que je pense que c'est vraiment bien de ces SLOs,
surtout quand ils sont expérimentés comme ça,
si vous vous en prenez la partie de la logonale,
c'est que les méchants sont très imprimés,
donc vous pouvez réimplier le tout le côté du système,
et le décès peut être vrai.
Je vous recommande de faire des SLOs avant d'un migration
du système de la nouvelle.
C'est comme si vous étiez en assertion.
En tant que vous pouvez assertir que les SLOs sont encore valides et gris,
la migration est de la faible,
c'est bien, vous savez, vous pouvez continuer.
Qui sait si les gens le font ?
Le SLO est de la grande qualité.
Est-ce qu'il y a plus de procédés que je vous ai fait ?
Oui, il y a plus de procédés.
Je vais vous en parler un peu plus.
On parle de la sélection,
on a des mesures de certaine utilisation,
mais aussi de la même manière,
il y a des compétences différentes.
Si vous savez que la question est de la mesure,
et que c'est toujours problématique,
on va faire un point de vue de 150 ms.
On va assurer les budgets de 150 ms
pour les compétences,
et donner une partie de la question
pour que ce soit en termes de la performance
et la contribution de la partie de la réliabilité.
Si les gens veulent plus en déterminant la santé
de l'élément,
c'est une opportunité de faire ça.
Mais vous devez encore avoir la même référence
de ce que la question est de la mesure
de nos clients ou des utilisateurs.
Quand on parle d'une métro,
on parle d'une des données,
c'est un peu de la façon de la sélection
et de l'implementation.
Vous avez besoin d'un instrument,
d'une mémoire,
d' الس forter,
d' 건�rer,
d'implemer ?
Pour faire des controversial beschäftions,
en taking out goals de 1270 ms,
une sou awakening d'une непresanne

Mais pour représenter un parentement et ahalten

je n'ai pas tout à l'heure, % de fois.
Le boulot de burn rate est à quel point je n'ai pas de boulot à l'heure,
et puis la dernière, le temps d'exhausser,
cela combine le boulot de % de la boulot à l'heure qui reste et le boulot de % de la boulot à l'heure
pour donner une idée de combien de temps tu as jusqu'à ce que c'est tout à l'heure.
Donc tu sais combien de temps tu as pour prendre certaines quantes de actions avant que c'est tout à l'heure.
Donc peut-être que je vous ai juste dit une théorie.
Donc c'est peut-être un exemple.
Donc on dirait que nous faisons une migration du service,
ou on dirait que nous nous avons de la migration du service A à la boulot de service B.

Si on a un boulot de % de la boulot à l'heure qui reste,
tu es probablement bon.
Tu es probablement bon pour aller pousser ce nouveau boulot,
ou pour changer le switch sur ceci.
Si tu as peut-être 20 ou 30%,
peut-être que tu dois faire un pause.
Peut-être que l'une action que tu prends
est de te délai un couple de jours pour gagner un boulot de plus.
Ou peut-être que tu as doublé ton appel,
ou tu as mis un peu d'admission pour la télumétrie,
ou tu as détaillé ta boulot de plus attention.
Si c'est quelque chose que tu as à faire pour le ship et le boulot de la date,
et c'est ce qui est la suggestion
pour ce que tu dois faire pour faire le switch.
C'est une question de la question de la boulot,
comme une question de la boulot business,
plutôt que de la télumétrie.
Exactement.
En fait, c'est pour la télumétrie de la télumétrie de la télumétrie.
Et quand tu sortes,
tu fais ce nouveau changement,
pour que tu te flippes sur ce nouveau système,
c'est quand tu commences à utiliser les burn rates de l'air.
Hey, comment est-ce que le budget de l'air
est ce nouveau chose que tu utilises ici, maintenant ?
Si tu as le sens...
Oh, hey, 0.5x burn rates ?
Oh, un petit élément, mais probablement,
c'est ok dans le budget.
Si on voit les burn rates de l'air,
comme 2, 3, 4, 5, 10x,
comme, oh, oh, quelque chose va bien,
on doit le flipper.
On doit le faire ou faire quelque chose.
Et, en fait, le temps de l'exhaustation,
si tu as un sens de ce qui se passe,
mais peut-être que tu as des effets de slow burn,
tu vois que tu es...
peut-être que tu es en train de hover
1.5x burn rates et de la suite.
Mais tu as le temps de l'exhaustation de l'air,
et tu as dit, oh, wait,
5 minutes, et le budget de l'air est terminé,
peut-être que c'est quelque chose
qu'il faut proactiver, juste fall back anyway,
parce que tu sais que ça va prendre 2 ou 3 minutes
pour flipper sur le service et que ça va
faire le protocole à l'extérieur,
donc, juste le faire proactiver.
Juste basé sur comment tu sais,
comment tu vas répondre.
Donc, c'est un peu de la procédure
et d'actualiser les décisions
basées sur ces différents triggers
et de prendre différentes actions.
Et je pense que certains entreprises
ou des méthologies sont appelées
à l'allumage ou à l'action.
Je pense que l'allumage est juste
un set de actions
où les gens peuvent prendre.
Il y a plusieurs options automatives
et d'autres choses que tu peux faire.
L'un que j'aime
est de mettre un banner
sur la page, disant, oh, ok,
il y a des gens qui reportent
qu'il y a un problème avec le système,
chaque fois que tu as des liabilities,
donc, au moins, il commence à avoir
des préoccupations, comme, oh,
il y a un problème.
C'est juste
qu'il n'y a pas de problème.
Et puis, le dernier step est la recue
au step de la recue, et c'est juste,
hey, comment on va prendre
tout ce que nous savons et que
on va mettre en place un équipe
tout ensemble, et, en utilisant
la framework qu'ils offerment,
pour aider à faire des meilleures décisions
sur la reliabilité ou la reliabilité
de nos services.
Bien.
Wow, c'était assez d'une journée.
Et de constater
la métaphore, pour toute la raison,
une balle de monnet,
je vais vous mettre un pitch,
une balle de courbe,
c'est tellement évident,
même si tu vas le faire,
tu n'as pas de problème
de voir cela arriver.
Donc, comment a-je
affecté l'aie
de tout ça,
même la création,
la découverte,
la rédiction, la analyse,
tout ce que la création,
tout ça,
c'est tout ce qui s'est passé à la main.
Tout le monde parle
de ça, tout le monde
pense que c'est un truc
qui va nous sauver.
Comment as-tu
vu cet effecteur,
ton travail?
Je vais vous donner
une réponse facile,
parce que je sais
que c'est la plus facile,
et je veux en face de vous,
et puis vous devez
venir avec une réponse difficile.
Donc,
j'ai un couple d'answer.
Ok, ok.
Si vous voulez aller au premier,
allez-y.
Je pense que la plus facile
réponse que vous allez utiliser
est la première chose
que vous avez déjà travaillé
sur, qui était,
je veux juste dire
que vous avez déjà travaillé
sur des mots en anglais,
et puis vous avez
travaillé sur,
vous avez travaillé sur
les codes pour moi,
comme le SLO pour moi.
Et c'est un bon point.
Je ne veux pas dire que c'est mal,
mais ça a déjà été fait.
Je pensais que c'était bien,
que vous vouliez juste
utiliser l'anglais en bas,
et puis vous vous transmettre
dans les paramètres de la SLO.
Je pense que c'est un bon point.
Mais,
vous avez le droit.
Vous pouvez faire mieux que moi,
mais vous avez pas le droit.
Oh, je ne peux pas.
Bon,
premièrement, je veux dire
que tout le contenu
pour cet podcast
a été 100% humain
généré.
Je pense que le seul AI
que j'ai utilisé
pour produire cet podcast,
cet épisode de cet podcast,
c'était en fait
une cheveuille et nos documents
de préparation.
C'est vrai.
Et tout le monde
a été humain généré,
et je voulais juste
qu'il y ait un podcast
tout humain.
Je n'ai même pas
l'exploit de la cheveuille,
donc là,
il y a ça.
Il y a ça.
Donc,
avec ça en mind,
je me sens,
hey,
si vous pouvez
décrire votre tour de chacune
de cette façon,
est-ce que ça va être
absolument aidant?
Mais je pense que
il faut que vous ayez
cette idée
de ce que j'ai à faire
pour mes voyageurs customaires.
Qu'est-ce que je vais
faire pour mes
utilisateurs et des déchoudants?
Et je ne suis pas sûr
que l'LLM
peut vous répondre.
C'est quelque chose
d'inherentement important
pour les utilisateurs
de votre service,
les humains
ou les autres
computers que je vous appelle,
en fait,
vous allez avoir
une expétition
de ce que vous avez à faire.
Hey,
peut-être que ça
sera un doigt
ou quelque chose,
vous avez un train
sur tout ça?
Bien sûr,
vous pouvez aller
en train de le faire
et de l'avoir,
vous pouvez le faire.
Oui, mais
quelqu'un peut faire
ce doigt,
quelqu'un peut comprendre
ce que c'est.
Donc,
quelque chose que je pense
et c'est
une idée
que je veux mettre
dans le monde,
c'est...
une idée
d'analyser
le traitage.
Et,
on va dire
si vous avez
traitage pour un certain
produit,
donc, on va dire
que dans un espace
ou un certain subset
de tous vos traitages,
nous fichons un certain
produit.
Et,
si c'était un moyen
de
aller et consommer
tout ce traitage
et me dire
quel est mon
tourneur,
quelles sont les
expectations,
ou quelles sont
les expériences
de P99
ou P90
pour ces tournes
basées sur
volume,
sur le temps,
sur des autres
choses,
sur les réactions
de tous les gens,
consommer cette information
pour moi
et me dire
ce que c'est.
Je pense que c'est
quelque chose
d'une manière

statistique
et très
structureux
dans ce que c'est.
Ce serait
une idée
très intéressante
pour les gens
d'aller
chercher et
comprendre.
Je me encourage
beaucoup de gens
d'avoir des résultats
ici et là,
mais ça peut être
un moyen
utile
pour le tout.
En termes
de la
autre chose,
et en s'étendant
le SLO,
je pense que c'est
un point
que j'aurais vraiment envie

d'ici
une époque
toi
tente de
essayer que
c'était

que j'エaura à

Je suis appelé Mimic.
Si on pense à ça,
et je l'ai écrit un blog post avec Nile Murphy sur ça,
et quelques autres folk qui s'appellent Digital Twin,
c'est l'idée de
avoir un LLM
prêt à se faire entraîner sur votre data set.
Donc, on va dire que j'ai un service de réponse basique ici.
Je dois avoir un JSON blob, et ensuite je vais donner un JSON.
Et je pense que je vais pouvoir comprendre
ce JSON, ce que l'aimait et les valeurs différentes ici.
Et vous avez l'LLM qui est vraiment entraîné sur,
Hey, si je prends ces résultats, ces choses-là,
ce sont les variabés que j'ai en place.
Peut-être que vous avez le temps de le faire et d'augmenter le système
quand vous avez un problème de disponibilité.
Oui, c'est un peu plus lent,
oui, c'est un peu plus de la latence additionnelle,
mais peut-être que vous pouvez servir un request
qui est peut-être assez utile pour le customer,
qui peut être potentially pas correct,
est-ce que ça peut être plus meilleur pour votre user
et le customer base que de ne pas donner à tout.
Et c'est quelque chose que je pense que c'est une idée très intéressante
et que les gens peuvent essayer de l'impliquer dans le monde.
Encore une fois, c'est à la haute coste,
vous avez à la trainer et vous avez à la mettre en place
pour trouver un cas de utilisation.
Je pense que ça peut être d'autres choses,
en termes de faire des modèles plus rapides
ou plus actuellement et ne pas les halluciner
quand il y a des réponses propres.
Mais je suis content de voir où ça va.
Bien, merci Sal.
C'est éducatif, sans surprise.
Les gens sur Internet veulent entendre plus de vous.
Qu'est-ce qu'ils veulent?
Vous pouvez me voir sur LinkedIn.
S-Ferina, c'est la plus social.
Vous pouvez probablement trouver des places comme ça.
Je vais aussi aimer pluger.
Je suis en New York City,
je suis basé sur un plan de la formation de la machine
et je vais aussi vérifier ça si vous êtes local
et si vous voulez aller voir ça.
Et si vous êtes vraiment intéressés en Bloomberg,
nous allons regarder.
On fait beaucoup de cool trucs de tech
dans le monde de la finance.
On a beaucoup de problèmes très intéressants
que les gens ont vu.
Et nous travaillons ensemble pour aller faire ça.
Et nous avons un peu d'ingénieurs ici.
Nous avons plus de 9000 ingénieurs
et j'ai toujours pensé que Bloomberg
était comme une company de tech hidden
qui ne pourrait pas faire tout le fancy.
Mais nous faisons de cool trucs.
Donc, nous allons regarder.
Merci Sal.
Merci toujours, Matt.
Merci Steve.
Et je pense que c'est ça.
Merci beaucoup, les gars.
À la prochaine fois.
Bye, Salong.
C'est très lent, tout le monde.
Vous avez regardé le podcast.
Google podcast sur l'engineur de site reliability.
Visite nous sur le web
sur sre.google
où vous pouvez trouver des papiers,
des workshops, des vidéos et plus
sur le sre.
Le podcast est hosté par Steve McGee
avec des contributions
de Jordan Greenberg,
Florian Rathgeber et Matt Siegler.
Le podcast est produisant par Paul Guglielmino,
Sunny Schau et Salim Virgi.
Le podcast est télébordé
par Javi Beltran.
Special thanks to MP English
and Jen Petoff.

Episode suivant:

The One with Startups and Adam Fletcher

Les infos glanées

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

GoogleSREProdcast

SRE Prodcast brings Google's experience with Site Reliability Engineering together with special guests and exciting topics to discuss the present and future of reliable production engineering!

Card title

Lien du podcast

[{'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere