Google Public DNS (8.8.8.8) with Wilmer van der Gaast and Andy Sykes

Durée: 32m7s

Date de sortie: 23/10/2024

This episode features Google engineers Wilmer van der Gaast (Production on-tall) and Andy Sykes (Senior Staff Systems Engineer, SRE), joining hosts Steve McGhee and Jordan Greenberg, to discuss the development and maintenance of Google Public DNS (8.8.8.8). They highlight the initial motivations for creating the service, technical challenges like cache poisoning and load balancing, as well as the collaborative effort between SRE and SWE teams to address these issues. They also reflect on the evolving nature of SRE and advice for aspiring SREs.

Welcome to Season 3 of the broadcast. Google's podcast about site reliability engineering and production software. I'm your host, Steve McGee.
This season we're going to focus on designing and building software in SRE. Our guests come from a variety of roles both inside and outside of Google.
Happy listening and remember, hope is not a strategy.
Hey, everyone. Welcome back to the broadcast. This is Google's podcast about SRE and production software.
This week we have two guests, Andy and Wilmer.
And we're going to be talking about a software system that was developed by a bunch of people, including these SREs here today.
And this system is something you've used before, almost assuredly. It's a little thing called public DNS, or as I like to call it, 8.8.8.8.
As always, I'm accompanied by Jordan.
Welcome back, Jordan.
Hey, everybody. Thank you.
And this week we're going to talk with Wilmer and Andy. Why don't you guys introduce yourselves?
Hi, I'm Andy. I'm in SRE Google. I've been here for nearly nine years working on networking systems.
And I was once the TL for Google public DNS.
Cool. Welcome.
And I'm Wilmer. I've been here for 70 years in a bit. And, yeah, like Andy, I like networks.
Don't we all?
That's a good way to say it.
Yeah.
I like when my network works.
We also happen to work together. I'm wearing my Engelon sweatshirt today, just to point that out.
We're all in the same office at the same time.
I think you guys probably have the same sweatshirt. Mine's too small.
I don't know about you guys, but they're a little bit dodgy.
As we would say back then.
OK.
So this week, we're going to talk about, like I said, the official title is public DNS.
We call it a couple other things.
Most people will just know it as these numbers.
8.8.8.8.
Pourquoi ne nous n'avons pas dit qu'est-ce que c'est le cas ?
Pourquoi serait-on quelqu'un d'autre qui utilise ça ?
Je pense qu'il y a une perception que, en général,
les services de la DNS vous ont mis à la place de votre ISP.
Et en fait, quand nous avons construit ce truc,
ils n'étaient généralement pas assez réel et généralement pas assez rapide.
Les gens ont une expérience de l'internet.
Parce que si ça, c'est une expérience de la DNS très très très tôt,
tout le monde est très tôt, je suis sûr que vous l'avez expérimé.
Et nous étions en position unique pour faire quelque chose de ça,
on pouvait construire quelque chose à la scale,
on avait des places pour déployer tout au long de l'Etat.
Nous savions que nous pouvions faire l'internet mieux pour
beaucoup de ces gens qui ont des ISPs avec peut-être pas de bon travail,
des services, sans doute, les ISPs.
Et je pense que vous pouvez voir ça,
parce que pour longtemps, la recommandation pour mon internet
était pas la description de comment ouvrir votre network,
et mettre 8888 dans un des fields.
C'est jamais 8884,
tout le monde n'oublie pas ce que c'est, including you, Steve.
C'est vrai.
Oh non.
Sorry.
Pour moi, je sais que je joue beaucoup de jeux de vidéo,
surtout des jeux de vidéo online.
Donc je suis toujours en train de changer mon DNS sur mon router
pour faire surement que je l'utilise,
parce que c'est plus facile pour moi de pouvoir avoir
la résolution à tout le monde.
Pourquoi les clients utilisent ça aujourd'hui?
Comme vous l'avez dit,
et parmi les autres,
je pense que la chose cool est qu'il y a un très, très, très
immemorable IP address, bien sûr,
qui on va parler de plus tard.
Mais oui, c'est très facile.
Et en fait, la raison que nous avons construit ça,
c'est parce que même les founders
ont eu un très fort belief
que la résolution de la DNS
par la RSPs était pour que l'internet soit sain
et que Google soit sain.
Donc, une raison plus grande
pour construire cette pièce,
c'est pour que Google soit plus facile pour tout le monde.
C'est intéressant.
C'est un effet très bien,
que tout le monde s'affecte.
C'est vrai.
Wilmar, vous êtes là au début de ce projet,
vous pouvez nous dire un peu
comment ça s'est passé,
avez-vous eu l'email d'Eric Schmidt
qui dit, Wilmar, s'il vous plaît,
pour un nouveau DNS pour l'internet,
comme signé Eric.
Comment ça se pourrait être?
Donc, la idée était connu par David Prussata,
je crois,
pour, en fait,
pour qu'on soit résolvers.
Et il a pris ça
à notre équipe,
à la time de la team de la trafication,
parce qu'on était responsables
pour faire des services d'internet
sur Google à la time.
Les services d'offres et tout ça.
Donc, ça a été un bon bon moment.
Et ça a été le moment correct,
parce que je faisais mon deuxième visite
à la Bay Area,
et je faisais les rounds,
juste à vérifier comment tout le monde
était en train de faire,
ce qu'ils étaient en train de faire,
et quelqu'un m'a dit,
Hey,
je voudrais travailler sur ce
chose d'honneuse,
et je n'ai pas de temps.
Donc, il m'a aidé,
et je l'ai pris,
parce que je me sentais
comme si on pouvait parler
avec mes amis,
worked for the internet.
Simm mysteriously,
so for the internet,


Pro만 et机64.
Les forces d'internet,
Pinuc francetitos
C'est difficile de donner des clients d'un certain nombre d'années.
Il faut faire un grand début.
C'est difficile de lancer un petit beta ou quelque chose comme ça.
C'est un des problèmes que vous avez étés à faire à la scale.
C'est difficile d'y faire.
Vous avez des problèmes à la dimension de la période ?
On ne savait pas ce qu'on avait à propos.
On ne pouvait pas lancer un petit beta, on ne pouvait pas faire un scheme d'invite.
On a vraiment dû faire un grand défi sur comment on va faire.
On a fait ça de la même manière que nous.
On a suivi la philosophie d'une preuve d'INS.
On a pu faire une preuve d'invite,
parce que l'INS tend à être plus cher.
On peut faire surement des coûts de la trafic.
On a eu des footprints dans tous les centres de données,
et on a fait ça.
On a fait ça depuis longtemps.
On a eu des machines à l'arrivée,
comme on l'a vu, en demandant.
Je ne me souviens pas d'un grand défi en plus, franchement.
Quels sont les défis que vous avez faits en commençant ?
Il y a deux choses qui sont en train de se faire.
Le premier, un peu d'un peu d'un temps,
le dankaminsky sort de la place.
Il a dit, je pense que j'ai trouvé une façon de poiser
votre cash d'INS plus vite que vous pensez que vous pouvez.
Je peux le faire dans des heures,
en plus de quelques semaines.
En fait, 16 bits n'est pas beaucoup d'entropie.
Si vous ne renommez pas vos portes,
vous ne devriez pas être en service d'INS.
Les types d'initiales d'INS sont basées en bain,
mais le temps de la même chose n'est pas de l'initialité.
Les portes n'étaient pas en résolution.
Si nous étions en sorte de lancer,
ce serait un service très susceptible à poiser.
C'était le premier point où nous devions fixer
et faire sure que le port n'est pas ruiné
ou moins d'entropie par les banquets.
C'était un grand point,
et vraiment parce que le temps était malheureux.
Le autre point était la banquette basée.
Le plus important de la banquette basée
sur les risques de la banquette basée
est la banquette basée sur les banquets
sur lesquels vous vous en rendez.
Je ne sais pas si tous les listeners
ne sont pas assez à savoir ce que l'initialité est,
mais le problème est quand le service Google,
le service Google,
le service Google,
n'est pas un service IP,
mais un service IP de service IP.
Si c'est un service IP
et le service s'appelle Teeves,
c'est cool, et on le sait exactement.
Mais si le service IP est un service IP
et le service IP n'est pas à l'autre,
on va pouvoir initiative de
temps Steve, dans la query 2, et en 1, et on a un bon answer.
Mais c'était interne et ça ne ne ne
n'a pas d'accord si nous étions en train de dire
l'acamai, ou d'autres CDNs.
Donc, l'un des choses qu'on essaie de faire
dès le launch, c'est de mettre un Rc
pour ajouter un petit header sur le CNES,
en utilisant le CNES 0 option
particule, où on encode un petit peu de,
bien, de votre IP adresse, dans la query
de public DNS à l'autorité,
pour qu'on puisse vous donner une réponse
pour que nous savions que c'est proper pour vous
plutôt que de l'envers que vous êtes populaires.
Et c'était difficile, parce que l'idée
d'utiliser le CNES pour le launch comme ça
n'est pas que tout le monde l'a aimé,
et c'est absolument un hack.
Mais en fin de compte, nous avons d'accordé
que c'est en train de parler,
en 2010, le meilleur hack disponible pour nous.
Et cet Rc, nous avons besoin de ça
pour en faire le travail,
même pour les gens qui utilisent les résolvers,
ou les gens avec des ISPs qui n'ont pas des résolvers
à chaque endroit où ils ont des bairros.
Cool, et donc, c'est le Rc7871, je pense ?
Correct, oui, des gens savent que c'est une subnetse de DNS.
Si vous voulez voir ça, vous pouvez voir ça.
Et donc, Andy, vous avez dit que vous avez lu ça
beaucoup de fois.
Comment vous disiez que vous avez lu un article
? Vous vous recommandez de la recueillie de la vente ?
Ou est-ce que vous avez plus de
frillage ?
Est-ce que c'est une recueille toilette ?
Qu'est-ce qui le fait le plus ?
La plupart des vérifications de DNS sont
de suivre les lois de postes,
de s'assurer ce que vous avez mis en place
et de la réciter.
C'est que ça contient des bairros,
Wilma, qui nous avons mis à croire
depuis des temps à temps.
Vous ne vous dites pas, je suis désolé.
Vous savez comment c'est d'être interne.
C'est très difficile.


Donc oui, je pense que le problème que Wilma
avait en fait été un problème
pour les résolvers publics.
Et je pense que c'est encore largement
un problème sur Internet.
Mais nous sommes à l'aise
pour être le founder de la définition.
Nous sommes à l'aise pour être
les bonnes citoyens sur Internet.
Nous voulions être capable de
faire surement que si les gens
ont utilisé la DNS,
que les services qui ont besoin
de faire ce genre de location
basée sur la balancierie,
nous sommes encore contents de faire ça.
Nous n'avons pas été
au bout de la camérasse ou de la break.
Si nous devions être très succèses
comme les résolvers ont besoin,
nous pouvions être très impolites
pour les gens sur Internet.
C'est quelque chose que je vais essayer de faire.
Cool.
En bas, nous avons décrit
le problème,
nous avons décrit des solutions,
des documents que nous avons élus.
Vous pouvez nous dire
comment c'est,
est-ce que les SREs sont
particulièrement involved en
la construction de ce design ?
Est-ce que les SREs
sont les pagers et c'est cool
parce que c'est grand ?
Ou est-ce que c'est une partie
de l'envers plan ?
Wylmer m'a mentionné
que c'est un peu plus tard
que ça.
Comment étaient les SREs
dans ce processus ?
Comment fonctionne le travail ?
En temps,
c'est très difficile
avec des déploiements de bind.
La chose importante
est, c'est un proper SRE.
C'est l'une des premières choses
que j'ai faite
pour avoir un test
installé, c'est à l'eau.
Et quand vous testez la surface,
vous avez besoin de logs
pour le envoyer.
Parce que vous ne pouvez pas
juste envoyer des strings
à l'envers de l'envers,
bien sûr.
Donc, je faisais des logs
de nos propres services,
surtout de la trafic interne.
Et je me dis,
je me dis corp
pour des dénaus,
des logs de là-bas.
Mais la chose que j'ai faite,
c'est que je me suis réveillé
à la team crawl,
parce que je savais que la team crawl
donnait les internet
à peu près tous les jours.
Et donc,
il faut aussi résolver
tous les noms de l'internet
tous les jours.
Donc, je savais que
ils allaient avoir des logs

Et,
pourquoi ils l'ont fait?
Parce que le cache
là-bas est très bas,
parce qu'il y a beaucoup de type
postage en file html
sur les internet.
Donc,
je lui ai demandé
pour leurs logs,
et ils ont envoyé les logs.
Mais aussi,
on avait un truc à l'heure
où on avait un téléphone
qui m'a dit,
on était en train de travailler
sur un nouveau résultat,
parce que nous avons
des tactiques qui ont été
construits dans quelque autre,
et ce n'est pas working great,
et on est en train
de construire quelque chose
d'autre,
et on a entendu
des choses qui ont été
travaillées,
et on a aimé
travailler ensemble.
Donc,
nous avons maintenant
un résultat,
mais comment on peut
mettre un DNS front-end
sur ça,
pour utiliser ça
en avant de l'utiliser,
et bien sûr,
j'étais intéressé,
parce que c'est sympa
d'avoir un stack de Google
Skill
avec des features
où on peut
mettre nos cellules,
et on peut
mettre un cache
dans les différents choses.
Donc,
c'est comme ça,
c'est comme ça,
que le projet de re-project
a finalement été found
sur nous.
Et c'est été un très,
très bon coopération
pendant mon temps,
et je n'ai pas travaillé
sur ça pour les dernières années,
donc Andy sait
mieux comment ça va maintenant,
je pense.
Yeah, Andy,
comment as-tu été involvement?
Qu'est-ce que votre involvement

je pense,
aussi?
Je suis involvement,
je pense que en 2016,
2017,
le service a été
passé par un grand nombre de
grosses grosses grosses.
Et la série
était encore
assez intéressante,
mais il y avait un sentiment
que peut-être,
on a créé un petit complément
avec le management de ça.
Et j'ai vu un peu de la gaffe,
j'ai utilisé ça
depuis le temps
et j'étais vraiment inquiétant.
Et l'une des choses
qui m'a fait
faire,
c'est que j'ai essayé
de regarder le système
de l'hélicité,
c'est-à-dire,
c'est-à-dire,
c'est-à-dire,


c'est-à-dire,
nous avons des déploiements
sur la nette d'envoi,
des déploiements
dans la partie centrale.
Nous n'avons pas vraiment
une grande histoire de capacité,
et ça a été
un certain nombre
de temps,

perdre un peu de capacité
peut causer
un problème de stompe
de la paix,
ouai,
il y a eu un peu de capacité
ici,
ouai,
ok,
ceci est déploiement
et ça,
ouai,
quelqu'un a délevé
ça.
Et maintenant,
vous avez un très mauvais jour
et une des meilleures
réalisations

c'est que
c'est,

c'est,
c'est,
c'est très,

très sensibilité
de deux déploies.
C'est extrêmement sensibilité.
Les gens pensent que les clients
rétruent, etc.
mais
ils ne rétruent pas
3, 4, 5 secondes.
Et donc,
vous êtes vraiment
héritant
assez bien
l'expérience d'un entire user
de mille de personnes
quand vous faites ça.
Donc, j'ai sorti
de commencer
en roulant,
et puis nous avons un nombre
d'attacks très grands.
Le
botnet s'appelle Mirai,
qui a été écrit
en public.
Vous pouvez lire
Creps en sécurité
sur Mirai.
Ils se sont turnés
avec un absolument huge attaque,
je pense qu'ils ont attaqué nous,
ils ont attaqué
de la mort de plusieurs personnes.
Et nous avons de la
certaine
poursuivie de la suite
de la team de SRE
pour être,
ok, c'est bien.
C'était très mal,
nous sommes dans,
je pense, 7 minutes
ou quelque chose
pendant le attaque de Mirai.
Oui, bien.
Comment nous allons
faire de la suite de ce qui s'est passé?
Et
il y a beaucoup de
bouts et de l'autre
à travers cette boundary,
je pense que vous pourriez
dire,
oh, bien,
le SRE
serait de prendre la planche
de la suite,
les BQs
vont voir le code
et voir si ils peuvent le faire
plus vite.
Mais c'est parce que
je pense que la législation
du système de développement
à laquelle j'ai été à Wilma,
c'était pas de la façon
qu'il a joué,
je suis commencé à piquer
autour de la code,
avec quelques de mes collègues,
je pense qu'on a un peu de bottes
ici,
je pense qu'on peut faire
quelque chose.
Nous avons spent
beaucoup de temps
avec le devs,
dire que
ce n'est pas
un problème de capacité,
il y a des patterns
qui sont inévitables
pour le service,
qu'on se voit
exploiter,
on doit ajuster pour ça.
Et en fait,
je ne veux pas
droiter mon collègue,
c'est un des responsables
qu'on ne peut pas avoir
plus de capacité.
Je ne suis pas fiers de reposer
ce qu'il se passe
en tant que
challenge.
Et donc,
la façon dont ça continue
au développement
du service,
nous avons launché
beaucoup de nouvelles features
pour le public de Google,
je pense que le service de la suite,
le service de la suite,
le service de la suite,
le service de la suite,
le service de la suite,
un whole bunch de choses.
Et il y a toujours été
ce qu'il y a de la suite
entre le dev et le service de la suite,
le dev a largement
voulu
pour le développement de la suite,
mais je pense que
la PSQN,
la PSQN,
la PSQN,
c'est vraiment bien
si on a fait ça,
et je pense que les gens de Chrome
et les gens d'Affox
en parlant de ça,
c'est vraiment bien
si on a supporté ça.
Et on a dû
penser qu'on va faire ça,
et si on va faire ça,
et le 1% de Chrome
utilisent un
plan de la suite.
Et on a aussi
fait ça,
et on a aussi
fait ça,
et on a aussi







et on a aussi



et on a aussi

et on a aussi

et on a aussi
fait ça,
et on a aussi

et on a aussi
fait ça,
et on a aussi

fait ça,
et on a aussi
fait ça,
et on a aussi

peutot
N° 1
N° 2
N° 3
d'avoir un peu d'économie, d'avoir une compétition de la structure de la code.
J'ai l'impression que vous savez que cette pièce est connectée à cette pièce,
et c'est comme ça qu'on se modélise conceptuellement.
Pour longtemps je ne savais pas que il y avait trois cashiers à l'intérieur,
et ça signifie que nous avons fait des décisions.
Je pensais que nous avons assez de mémoire.
Pourquoi est-ce que c'est... Pourquoi est-ce que je suis en train de faire des cashmissings?
J'ai toujours voulu impliquer ça, et un moyen de faire ça c'est de faire un contribute,
de faire un bug, de faire un performance, des choses comme ça.
C'est vraiment cool, c'est...
C'est génial.
Vous avez...
ce claim de fan, vous éditez Google Public DNS.
Et...
ceci est maintenant écrit dans votre histoire de la façon dont vous avez fait ça,
plus tard,
comment ça a changé, comment vous supportez-le.
Mais maintenant on veut savoir,
si vous avez besoin de construire ça d'accord,
plus agréablement,
qu'est-ce que vous pourriez faire différemment?
Et vous ne pouvez pas dire que ce soit le cas maintenant.
Vous ne pouvez pas juste, vous savez,
assumer les pressions.
Oui, oui.
Je pensais que je ne savais pas que ce soit le cas avant,
c'est assez difficile de poursuivre ça.
Wilmer, c'est certain que je vais dire que je suis d'accord,
et que je pense que c'est un peu trop.
Wilmer a des idées.
Nous avons fait ça, mais vous avez besoin d'exprimer les gens
avant de apprendre comment faire les choses.
Nous avons pensé absolument à ça,
et aussi à l'impification des taxes et des choses.
Nous avons fait ce que nous pouvons prédiquer
avec le knowledge de 2009,
mais nous avons appris beaucoup d'abusant,
d'actuellement, de la conduite de service,
et vous ne pouvez pas le faire.
Ça a été une question de tric,
juste pour vous dire exactement ce que Wilmer a dit.
C'est l'answer.
Nous ne voulons pas aller en bas et dire,
si nous devions vraiment faire des waterfalls,
c'est correctement, nous devions faire les vols,
mais non, nous avons appris de la façon dont nous avons construit
et de la façon dont nous avons travaillé.
Nous n'avons pas prédiqué les taxes et les émergences
de la vitesse, et tout ça.
Ils ont été élevés et nous avons évolué en temps.
C'est comme si ça devait être agréable.
C'est ce que je dirais, c'est probablement le cas
pour beaucoup de services.
Je pense que je suis fondamentalement
un incrementaleur quand il s'agit de cette chose.
Je pense que beaucoup de designs de papier
que vous pourriez faire sur le papier sera mieux.
Mais je regarde le code, et oui,
c'est un système de 2009.
C'est-il 15 ans ?
C'est un temps long,
un temps long,
de tout ce qui se passe.
La chose que je me souviens est que
presque toutes ces lines sont là pour une bonne raison.
J'ai vraiment expérimé
un peu de...
Je vais le dire, de la construction,
et de la construction de un système différent,
Google, d'autoritatif,
qui était aussi en TLF,
j'ai vraiment ressenti
d'être comme, non, de l'éloir de tout ce
historique detritus.
Et en chaque cas,
Huberest m'a dit,
j'ai eu une terrible décision.
Non, je ne peux pas retirer ces limites simples
ici et là. Ils sont là pour une raison.
Ce sont importants. Je les ai retirés,
et la performance a été substantially worse.
Ok, c'est un lesson important
d'être en SRE,
de apprendre à admettre que vous êtes pas mal.
Et je l'ai fait beaucoup plus tard.
Tu veux dire que tu ne peux pas
comprendre les choses parfaitement et se déterrir
parce que tu n'aimes pas.
On peut barely
describe to each other
how we feel about very simple things like food.
I don't know how we would describe
how code works, right?
This language is used,
I think as Terry Pratchett said,
to tell the other monkeys where the fruit is.
It is very difficult to communicate about complicated topics
using that language.
The good fruit is here.
So one of the kind of important things about like
setting up DNS when you're like an end customer,
there's no, you know, it's not DNS,
it's DNS.google.com.
You literally can't do that.
You have to use this crazy thing called an IP address.
And one of the hard things about this is like,
normally when you get an IP address
from your DNS provider, it's like
some random set of numbers and it's hard to remember.
But Google is this magical beast
that got this awesome thing,
8888, right?
8888, right?
Also 8844, I'm not going to get this time.
What was the story behind that?
Did we just have this sitting around?
Like, how lucky did we get?
So, fun thing is,
initially it wasn't.
So initially IP address was
74.125.125.125,
which is very repetitive,
but also very long.
So...
What did it start with?
Yeah, exactly.
I thought like you, these IP address need be memorable,
but also I was constrained by
no one cares what I'm doing.
So I just went shopping
and I searched
for all the IP space we owned at the time
and I tried to find a slash 16
where I just knew
that the first,
if I just repeat the second exit twice more
then I have a pretty nice IP address.
So that's how I found that IP address
and unfortunately it was reserved
for a new cluster somewhere
and it wasn't back and forth from, can we please get it?
It's nice, believe me, we need it.
And eventually we got it.
And then we had an interview with Larry, one of the founders
et
his verdict, at the end, was basically,
and this was when we were about ready to launch.
His verdict was
really cool, but our peters are terrible.
So please fix that.
So there went our launch plan
and we had to go to another friend
and they got us some IP addresses.
So that was 8888 and
they are just the most memorable IP addresses
I could imagine.
Yes, I would definitely agree with that.
Graphited on walls here and there
et maintenant et après.
C'est très intéressant de voir.
Oui, c'est assez
génial quand vous pouvez voir ça
juste en l'univers.
Ce n'était pas un marché de la vie.
Les gens ont fait ça. C'est assez génial.
J'espère que vous vous êtes prêts
pour avoir été part de ça.
C'est un highlight de ma carrière.
Oui, c'est assez dure et cool.
Je dois une question finale
qui est, bien sûr, si l'invite
et vous pouvez choisir de l'ignorer.
Mais est-ce toujours des DNS ?
Et il n'est pas.
Disappointement,
sur le point d'apprécier
un grand nombre d'années
que ça fait.
Et ce n'est pas
que le record n'existe.
C'est toujours que le service DNS est sain.
Mais le truc est sain
comme résultat.
Tout seul temps.
Dès qu'il y a des infos, il ne devrait pas être sain.
Tout le système s'est passé.
Et si c'est sain,
ça ne se passe pas.
Je dois une question de follow-up.
Si je suis en train de
utiliser un service
qui intervient avec la DNS, c'est un service de service network.
Et je prends un bouton de retrait
et
je presse le bouton de retrait
ou je m'attends pour le retrait
et est-ce que
les choses qui sont construites avec les retrains
sont les boutons qui travaillent ?
Ou je m'en fais tout le monde ?

Je vous recommande de presser le bouton
parce que
d'ailleurs, vous devez attendre pour
ce qui est le timeout de l'OS
qui est généralement beaucoup plus
que vous pourriez attendre 5 ou 10.
Je vous presserai le bouton.
C'est très intéressant de remarquer
que quand on a
un problème avec la DNS
parfois les retrains sont
les plus récits.
Il y a beaucoup de queries qui sont
abandonnées
parce que l'on a dit répétition.
On a un query, on ne répond pas
en temps de fashion et on a un autre
qui est un refresh button.
Donc parfois, le point de repos
est l'indication que quelque chose de mauvais
est en train de se faire, parce que nous nous
regardons les retrains de la DNS.
Ça me rappelle une observation
qu'on a fait longtemps,
c'est que la rate de cash
à 8,844
est noticeably
plus bas que la rate de 8,888.
Parce que
vous avez dit que le query est à 8,888
et vous n'avez pas de réponse
parce que le query est en train
d'exister. Et donc vous essayez
et vous avez senti tous les retrains de 8,444.
Donc si votre query est facile
et que l'on a dit que le cash est de 8,888
et si
votre query est si bizarre, vous vous
disiez deux fois, 1 à 8,8, et 1 à 8,444.
Donc la rate de cash est
à 1,888, je crois.
C'est grave.
Oui, noticeably different.
Et la rate de cash est noticeably
différent. Je pense que c'est un bon exemple
d'une behavior émergent
qui est imprédictable.
Peut-être que quelqu'un très clé
pourrait le prédiquer, mais je ne le ferai pas.
Et c'est seulement observable
après le fait et avec un peu de
la tête. C'est un bon point.
C'est assez cool.
Vous avez appris que 15% de la internet
utilise vous.
Oui, ça me fait plaisir.
Ok, donc
déclare le bouton de retrait
600 fois, refreshez les queries
quand elles ne sont pas passées.
Et faites ça à la scale de 8,5 millions
de gens. Et je pense que tout
sera juste bon.
Si nous n'avons pas répondu à votre query
la première fois, vous devez nous demander de nouveau.
Nous travaillons rapidement pour fixer
le problème.
Je pense que ça a été págin.
Mais oui.
La dernière question
pour vous, comment vous
voyez le changement de SRE
dans les deux dernières années?
Je pense que plus et plus
dans le monde du monde
je vois le changement de SRE
de la plus en plus
qui serait la meilleure
façon pour que le SRE
puisse être imprévue à l'extérieur. Et plus
à l'éthos que je vois sur un basis
de jour au jour, qui sont les SREs
fréquentement, les généralistes misérable.
Nous allons spécialiser quand c'est
nécessaire, quand le temps ne suffit.
Nous sommes généralement
cynique sur les systèmes et les skeptiques
et nous allons faire
chercher des places pour que les choses
soient d'accord, qui est un truc très difficile
pour se faire en leur vie personnelle. Et je vois plus
et plus de ça en le monde du monde
en dehors. Je pense que
probablement, jusqu'à la fin de la fin
de la dernière fois, je vois des amis
qui ont mis sur le SRE, j'ai vu beaucoup
de la formule du Terraform.
Il y a eu un moment où le SRE
était utilisé pour faire le travail de SRE
et c'était presque
une division entre les deux.
Je vois que ces lois sont en train de
se faire. Je pense que
quand vous avez des systèmes de certaine
dimension, il n'est pas possible
de considérer ces deux choses en isolation.
La réhabilité n'est pas un produit
qui est porté par le SRE.
C'est un produit qui est porté par le SRE
et les groupes de suite qui travaillent.
Je vois que la attitude se fait
plus prévalent.
Je pense que, à l'heure de vous,
les gens comme Wilma et moi ont toujours
vécu avec ça.
Je vois que
je vois que, comme exemple,
quand je suis en train de faire un SRE,
Wilma n'a pas vu les boundaries, elle a
vu des problèmes et des solutions.
Je vois que c'est plus prévalent
dans le monde du monde. Le SRE est
bien, mais je pense que c'est un petit
lit dans cette section,
ce genre de généralisme qui est
très malade et qui a tendu
beaucoup de gens avec vous.
Je n'ai pas l'aspect de la rôle.
C'est juste mon spécialisme.
Je suis là pour se trouver des problèmes.
Oui.
Comment vous, Wilma?
C'est difficile d'être un SRE.
Ce que j'ai vu pendant les années, c'est que
tout le monde est plus compliqué
et les gens sont spécialisés.
La chose est plus compliquée et nous
nous enjouons la team en deux.
Tout le monde peut réduire
des choses qu'il faut comprendre.
Je voudrais continuer
d'être un serein de gens
qui comprennent
comment tout le monde fonctionne.
C'est trop difficile,
mais c'est aussi trop difficile.
Juste pour être plus fun,
avec les gens horizontals,
vous pouvez narrow in
solutions plus vite que les problèmes.
Si vous avez des gens qui
connaissent beaucoup de choses,
ils peuvent arrêter de chasser les
blindes à l'alies, pour que vous
puissiez avoir un temps de temps et d'énergie
et un endroit où vous savez
que ce n'est pas possible.
J'ai été un SRE
pendant 9 ans, et je suis assez
senior à ce point.
C'est un très mauvais truc.
C'est à peu près 70% de mon travail
de garder les blindes à l'alies
pour être explorées.
Nous n'avons pas besoin de faire ça.
Nous avons fait ça avant et ça n'a pas travaillé.
Vous pouvez seulement en avoir
l'expérience et vous pouvez en avoir
l'expérience de la chance de
aller dans les blindes à l'alies,
qui signifie que vous avez besoin
d'avoir un knowledge d'approximate.
Si vous avez l'expérience,
ça peut être très difficile de créer
ces gens-là.
Merci à tous.
Est-ce que vous voulez
ajouter à nos listeners
des SREs ou des SREs
ou des SREs adjacent
aux gens sur Internet?
Il y a plusieurs gazillons
de leurs conseils.
Ou des places pour vous
sur Internet et vos insights.
Mon conseil serait de
être curieux.
D'être curieux pour que les choses
soient brouillées.
Vous devez apprendre
quelque chose que vous n'avez pas
parlé de, et après,
vous ne vous espérez pas que
ce piece de knowledge vous aide.
Je pense toujours que le
physiciste étudiant la théorie
d'ré плат се
91 svì æ
smartest
en
plan.

nest Marion
Et regardez les TCP Times maintenant, parce que c'est beaucoup de fun, des trucs comme ça.
Je n'ai pas de rentres ou de ramblings en ligne,
le seul réseau social qui me concerne est Strava, c'est tout.
Excellent.
Je dois vous dire que Strava m'a clairement...
Oui, on va faire ça.
Merci beaucoup, c'était génial.
Merci encore Jordan, comme toujours.
Merci pour venir aujourd'hui et à un bon jour.

Vous avez écouté le podcast.
Google est un podcast sur l'engineur de la reliantité de site.
Visite nous sur le web sur sre.google
où vous pouvez trouver des papiers, des workshops, des vidéos et plus sur le sre.
Ceci est de Steve McGee
avec des contributions de Jordan Greenberg et Florian Rathgever.
Le podcast est produisant par Paul Gullimino, Sonny Chow et Salim Virty.
Le podcast est téléblogué par Javi Belcham.
Special thanks to MP English and Jen Petoff.

Les infos glanées

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

GoogleSREProdcast

SRE Prodcast brings Google's experience with Site Reliability Engineering together with special guests and exciting topics to discuss the present and future of reliable production engineering!
Tags
Card title

Lien du podcast

[{'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere