Production Problems Are For All! with Ben Treynor Sloss

Durée: 31m21s

Date de sortie: 18/09/2024

Ben Treynor Sloss (VP of Engineering, Google) joins hosts Steve McGhee and Dr. Jennifer Petoff (Director of Technical Infrastructure Education, Google) to share the evolution of SRE and its impact on software development, how AI and ML significantly impacts SRE practices, and the future of SRE.

Ben coined the term "Site Reliability Engineering" for his team of (now) 4,000 software engineers, engaged in what were traditionally operations functions. Under Ben's leadership, Google SRE wrote two best-selling books on SRE. Since then, the rest of the SaaS industry has come to adopt the SRE name, mission, and practices. 

Welcome to Season 3 of the podcast. Google's podcast about site reliability engineering and production software. I'm your host, Steve McGee.
This season we're going to focus on designing and building software necessary. Our guests come from a variety of roles both inside and outside of Google.
Happy listening and remember, hope is not a strategy.
Hey, everyone. Welcome to the podcast. Google's podcast about site reliability engineering and production software.
I'm your host, Steve McGee, as always.
This week, we have a special guest and a special co-host.
Jen, can you introduce yourself?
Hello, I'm Jen Padoff and I'm currently director of Google Cloud Platform and Technical Infrastructure Education.
My area of expertise is in SRE education and driving a culture of reliability across Google and beyond.
I've been at Google 17 years. I'm one of the co-editors of the SRE book that we wrote back in 2016.
I'm absolutely delighted to be here today as the special co-host as we talk to Google SRE OG Ben Trainor.
Ben, can you introduce yourself?
You don't need any introduction, but maybe it'll help.
Apparent, je suis le SRE OG.
Formalement, je suis Ben Trainor Sloss.
Je suis le VP de 24-7 ici à Google,
qui signifie « networking, data centers et site reliability engineering » pour tout Google.
Je suis maintenant 21 ans,
qui a vu un certain nombre de changements et de grosses grosses.
Ben, je me souviens d'avoir rencontré un premier moment avec vous,
c'était un moment long, dans une rencontre de Borgman.
Vous étiez ce gars qui a tourné et qui a dit des choses.
Je me suis dit « c'est ce gars, c'est ce qui est-là. »
Et ça a été le boss. Je n'ai pas d'idée.
C'était assez drôle pour moi.
Et ça me fait un peu de temps.
Mais cette année,
nous avons fait une question sur le podcast,
nous nous faisons attention à la software que les SREs ont construite,
ou les software, en particulier,
qui nous faisons attention à la lessie des ops,
les toilettes, les choses de sissage,
et plus sur le building des systèmes,
ou les réimages des systèmes directement.
Borgman est un des uns des uns que je pense,
quand je pense d'un petit peu de software,
que les SREs ont contribué beaucoup à ce que ce soit le jour.
Mais pour vous,
que sont-ils les pièces des plus impactantes que vous avez vu
de l'esprit de Google ?
Bien,
beaucoup des outils que les SREs ont construits
ont été créés par le team
pour remplir les activités qu'ils avaient à faire
par hand avec l'automation
qui pourrait être approvée et qui est plus vigilant
et plus reliable que vous pouvez imaginer
pour un seul humain.
Mais
la plupart des problèmes que nous avons
avec les services de production
ont été changés.
Mon standard de clé
est que si je voulais être super reliable,
je serais juste en train de serrer
le système de management de source
et de prendre une vacance pour quelques mois
parce que rien ne se ferait pas.
Ce sont des choses qui se sont changées
parce que nous avons changé.
Et donc, c'est un des softwares plus utiles
que nous avons construits,
ce sont des softwares
qui permettent de changer
pour être propagés
dans un système de large distribution
en salle et rapidement.
Donc, c'est des systèmes internes
comme Sisyphus ou Neelink
que nous utilisons pour changer
les systèmes de running
sans une faible rate négative
que le système
change et ne les brise
et ne les notices,
mais aussi sans une faible rate positive
qui est un système
qui arrête de se faire changer
parce que c'est peut-être un truc qui peut être changé
quand en fait c'est tout de même bien.
Et les deux, ils permettent
d'en faire un plus haut de la vitesse
avec la même valeur de la sécurité
et avec un niveau très bas
et donc,
il y a beaucoup de systèmes
et ça ne le diminue pas
beaucoup de choses que nous avons construite.
Les uns qui sont focuss sur le management de safe change
sont très à la tête.
Mon public dommage c'est
que aller auxivoqucomment

Et grâce à

c'est en fait la façonVES
on a fait dans les années de temps, etc.
Je pense aussi sur le « what ifs ».
C'est un peu un réveil counterfactuel.
Si on entre dans le monde bizarre,
quelle serait la question Google d'être comme
si les essoriers n'étaient pas comme ça ?
Est-ce que c'était inévitable pour les essoriers
de l'évoluer ou d'être implémenté ?
Et oui, qu'est-ce qu'il serait comme si ça n'était pas ?
Nous avons beaucoup de points de data
sur comment ça se déploie.
Nous avons un nombre de autres firmes
dans l'industrie qui sont successives
mais qui ont fait une autre approche.
C'est-à-dire que l'entreprise de services
a dit que les essoriers sont les mauvaises
et que ce n'est pas un bon moyen
pour qu'ils se débrouillent
par le développement de la service
qui se débrouille.
C'est une perspective totalement raisonnable.
Ils ont acheté l'approche de DevOps.
Nous avons une expérience
régulièrement où les gens
de cette compagnie viennent de Google
et quand ils joignent Google,
ils commencent avec « Essoriers est le dévile ».
C'est le plus mauvais que vous pouvez faire.
C'est un moyen terrible de faire des services
et ça découpe les ingénieurs
et les services et nous ne devons pas faire ça.
Nous ne devons pas avoir des essoriers.
Et en les premiers 18 mois,
ils ont changé leur minds.
Je pense que c'est parce que
vous voyez que, oui,
les services de séparation
et de la service
ont fait un très mauvais outre.
Mais, en tant que skillful,
avec les incentives correctes
et avec la équipe SRE
qui est coopérative
et qui en tant que partage
un partage de développement,
cela produisera un meilleur outre.
Vous n'en avez plus de temps
pour produire un niveau similaire
de l'availabilité.
En partie, parce que vous avez appris
les lessons de chaque service
et vous appris à chaque service.
Si vous regardez à l'organisation,
ils tendent à être organisés
autour du service
ou des produits qu'ils ont construits
et ils tendent à être silo.
Nous voyons les mêmes problèmes
et les mêmes nécessaires
qui sont créés à travers
des services différents.
Et donc, l'availabilité de dire
que nous avons un outre progressive
de l'availabilité dans cet état
et que nous avons appris 3 nouvelles choses
sur ce que nous faisons
sur l'availabilité, nous pouvons maintenant
mettre cela en plateforme de software
et que tous les services de Google
peuvent bénéficier.
C'est en fait assez fort.
Et les données, même les gens
qui viennent des autres entreprises,
sont que, maintenant que je comprends
comment cela fonctionne,
je spending 1,5
à 1,5
à un moment de développement
pour avoir un outre similaire
à Google, maintenant je le comprends.
Ils sont des proponents
les plus fortes.
Ça ressemble à des gens
qui sont en train de le voir
en pratique, quand ils sont en train de rejoindre Google.
C'est dit, je pense que pas de modèle est parfait.
Donc, avec le bénéfice de l'availabilité,
ce qui est 2020,
qu'est-ce que vous pourriez faire
de manière différente?
Est-ce que vous avez fait
des tweaks, maintenant, que vous savez
que, après 20 ans, vous avez été en train de rejoindre Google?
Oh, oui, je pense que
chaque single outage
a un dégrad de regret.
Je pense que
la plus grande changement
est que
nous sommes plus slow
que optimaux, pour noter
que nous étions construitre les mêmes
systèmes de software
dans des groupes différentes
simultanément.
Et, même si ça a été
et encore le fait, un grand détail
de coordination et de
exhoritation pour obtenir ces groupes
d'opportunité sur leur plateforme de software,
ça a élu des résultats
comme la réliabilité a été meilleure,
les niveaux de toilette ont été dépassés.
Et
ça a piqué le moyen
d'avoir encore plus de services
pour avoir plus d'engagement
de la production de la production,
parce que maintenant, chaque nouveau
projet que nous avons construit
peut bénéficier de la plateforme que nous avons déjà
pu faire, de la monitorisation
de votre changement de management, de la planification de capacité, etc.
Et donc, je pense que, en retrospect,
en réalisant
que vous allez
arriver à la fin de plusieurs
formes de production de miniaturale
qui étaient indépendant
et opérées, si vous voulez,
mais ce n'est pas
le même.
Et, pour les gens
de la plateforme commune, où ils allaient
bénéficier de tout ce que nous avons appris
par les autres groupes, nous pouvons faire ça
peut-être 5 ans plus tard que nous l'avons fait.
Cool.
Chiffter dans le présent
un peu.
Le AI est cool.
J'ai entendu que c'est un truc.
Il y a deux termes que je pense que je vais être un peu confusé
dans le monde et peut-être
je peux donner mon exemple, ou mon définition
et voir si vous agrez, mais la question va bientôt se suivre.
L'un est ML Ops
qui, je dirais, est
construitre l'ML
en managant les données
dans la pipeline, donc
il y a un model ML
qui vous peut demander des questions
ou tout ce que vous faites.
Il y a l'Ops AI,
qui est donné un système de AI
déjà étranger, comment vous pouvez utiliser
ceci pour faire
d'autres opérations, vous pouvez même
faire ça sur un stack de PHP
ou quelque chose, je ne sais pas, mais
on peut aussi utiliser l'AI pour faire l'Ops.
Je pense que ces définitions
sont vraies, mais la question est
comment
d'autres, comme ML, AI
ou plus récemment, Gen AI
affectent la Google SRE ?
L'une des choses
qu'on peut comprendre
c'est que les deux types
d'opérations que vous avez décrivées,
l'une des les...
on appelle ça le train, en général,
la création d'un model
d'un model de weight.
Et l'autre est la servie,
l'utilisation d'un model
avec des weight populaires.
On a des analyses très directes
pour les choses que Google a déjà fait.
Le model de la construction est beaucoup
comme l'index de l'Ops.
Vous vous portez un peu d'informations,
vous faites un peu de processage
qui doit s'occuper
en un endroit central
et vous générez
ce model bas.
Et
la servie pour l'application machine
est, de la manière similaire,
une index de websearch
où vous vous portez et vous avez besoin
de l'écrire. Vous avez besoin de
de l'information de l'internet,
vous avez besoin de l'application de la langue,
vous avez besoin de l'histoire et de l'histoire
pour les questions les plus utilisables
pour eux,
pour les gens qui ont des informations
d'une restaurant à la fin de la nuit
de 6 000 miles de l'Etat,
et que les gens sont plus oublie que les gens
qui sont 5 miles de l'Etat,

Ces ont des analyses très directes
pour ce que nous voyons en machine-learning.
Et beaucoup de
les idées et les principes
qui sont en train de faire,
comment vous vous dealz avec la pipeline batch
quand il s'agit de la training,
comment vous vous portez,
et comment vous dealz avec les failures partiaux,
etc.
Translée directement dans les challenges
que nous nous avons maintenant
de construire et de servir
de la population machine-learning.
Bien sûr, en suivant,
comment nous pouvons utiliser ces systèmes
pour
improving notre propre craft,
donc la pratique de la SRE
et d'utiliser des tools AI,
et de voir les opportunités
dans ce pays,
comment vous vous ressentez de cela ?
Oh, extrêmement.
Donc, en tant que
de la machine-learning,
c'est particulièrement
bon à la spotter des correlations
sottiles,
et à la production des predictions
basées sur les correlations sottiles.
OK, comment est-il
de la production des failures,
si pas exactement ça ?
J'ai remarqué que les six signes
qui se montrent,
quand ils sont combinés,
ont signé qu'on a un problème.
Vous utilisez des mesures relativement
avec le monitoring traditionnel,
un système machine-learning
peut être beaucoup plus suffisamment
suffisant et suffisant.
Et il y a une advantage de
ne pas dormir, ne pas être distracté,
il peut être vigilant
pour ne pas être vigilant.
Donc, il y a une énorme opportunité,
qui nous en a déjà pris,
dans un nombre de places,
d'utiliser les models machine-learning
pour improving
notre détection des problèmes
et notre diagnosis différente de problèmes.
Et, en quelque place,
ce n'est pas où vous ne vous
dîtes que d'expect,
comme nous
détectons
l'électro-systeme
d'impendie des failures
dans les centres de données,
et c'est très cool,
car ils ont une pattern de caractéristique
qui commence à se dégager,
et leur changement d'impedance,
et vous pouvez dire la différence entre
les normales opérations
mais toutes les applications
sur le processus signal,
par exemple, en regardant la
latence, la dégagement et la distribution
et les séances, sont toutes les territoires de la paix.
Un autre tout différent,
mais très rélevé,
c'est que, dans un incident,
l'un des grands défis, c'est que
quelqu'un de nouveau joins le management incident
et qu'ils doivent s'en aller à la vitesse, et ce qui se passe.
Le incident a été dans 20 minutes,
et vous avez une très longue
histoire de chat, et un whole bunch de
signales de monitoring,
et l'idée générique de
s'assumeriser pour moi, s'il vous plaît,
et vous vous rendez en 5 secondes
ou 2 secondes, un paragraphe
qui décrive les points salaires
que vous avez besoin de savoir, est
très aidant pour quelqu'un,
et le temps que ils gagnent
par ne pas avoir besoin de 6 minutes
pour lire tout le background,
est 6 minutes moins qu'il peut
être productive et efficace
pour les problèmes mitigés.
Donc, tous ces sont en use maintenant.
C'est cool. Et je pense que le commandant incident
préfère pas
de prendre le temps de l'assumerisation
chaque fois que quelqu'un s'en demande
ou qu'il faut envoyer un post
pour des comms externes, ou quelque chose comme ça,
pour sûr. Je me regarde
pour la première fois que des
unsuspecteurs de l'exécutif s'en font
sur une chute pour demander ce qui est
dans leur service, et ils reposent
une réponse générée de Jim et moi.
C'est peut-être un moment de
nous parler d'OMG bot, ou quelque chose cool
comme ça. Je pense que ça serait cool.
Il y a probablement
d'autres termes que nous pouvons utiliser.
Le bât de dispensation

C'est un bon point.
Exécuteroide, oui.
Le point de la position est
que la capacité de les gens
d'appuyer avec l'information
qui est relativement à eux, en s'en disant
dans l'exécutif, si vous êtes un enjeu
d'engagement, vous avez besoin d'un different set
d'information, alors si vous êtes en
seree en travaillant sur un subcomponent de
le service, tout ce qui est dans
l'information que nous avons, mais vous
devez en summariser ça dans un de très différents
de l'autre. Maintenant, vous avez
deux choix. L'une, vous vous demandez
quelqu'un qui sait tout ce qui est en
l'exécutif, et l'autre, vous le
vous le réveillez.
Cette opportunité, c'est un
service, qui en fait
qui réserve ce problème très bien.
Et, d'ailleurs, la vitesse
d'engagement, qui est très
rapide, qui est beaucoup plus rapide
que le humain, si vous avez besoin
d'un enjeu d'engagement pour en faire
un démonstration de la face du customer
de ce qui se passe,
avoir un système AI
générer le premier trafic
dans des secondes,
il y a cinq minutes plus
avant que tous vos customers
soient informés de ce qui s'occupe.
Similary, pour les fixations,
j'ai bien aimé le truc.
Je ne me souviens pas de le faire
directement, moi-même,
mais au moins, ça me donne
un coup de poids.
Oui, il y a trois fois que vous êtes
très rapide.
Je parle avec des customers de la
cloud tout le temps, sur les
practices de SRE.
Et, qu'est-ce qui est le différence
entre DevOps et SRE, et toutes ces
phrases et choses.
Mais, l'une des choses qui s'occupe
beaucoup, c'est qu'on veut construire
une function de SRE,
on a besoin de la sere,
on a besoin d'un
chef de SRE,
on a dit que c'est
un officer de la SRE,
je pense que c'est un peu
plus, mais je ne sais pas.
Mais vraiment, est-ce que ça
aide à avoir un sere
représentant la sere?
Je pense que ça
fait de la même manière que
on voit beaucoup d'organisations
gravatisant pour avoir un
chef de la SRE.
Il y a beaucoup de raisons, mais
l'une des les domaines est assez
dîtes, donc avoir des
expertises en elles, c'est important.
Et l'autre est
que c'est important, mais
seulement occasionally urgent.
Et c'est très
facile pour une organisation
d'être distractée
par toutes les choses urgentes.
On a un nouveau customer de la
sere, il y a ce feature,
on a ce deal,

Et, graduellement,
parce que vous n'avez pas d'outages
très souvent, vous
spendingz moins et moins de temps
sur le très important
topic de faire votre service
reliable, jusqu'à
avoir une sere de dîtes,
et ensuite, c'est 18 mois
pour rébuilder, si vous êtes
heureux.
La segmentation
d'attention,
d'attention et d'expertise
a, en practice,
travaillé très bien pour nous, et
j'ai vu ça travailler très bien pour
beaucoup d'autres entreprises.
Ce n'est pas la seule façon de faire les choses,
mais si vous voulez
construire une sere de dîtes,
qui s'adresse à, pour exemple,
les services de service,
les habilisées de la sere,
d'incorporation, les mesures de risques,
je pense que c'est très utile
d'avoir un lead pour ça.
Cool.
Je pense que maintenant on peut peut-être
changer les armes un peu,
et on a parlé
dans l'intro un peu de la sere
qui, comme d'une part,
est le plus cool
de notre projet, comme de la main,
sans doute, que j'ai travaillé dans mes 17 ans
sur Google. Merci Ben
d'avoir donné nous l'opportunité
de faire le livre et de
donner la possibilité de, en fait,
l'apprécier de la sere,

que le livre soit écrit,
de porter les voix de 70 contributaires
représentant plus de 500 ans
de l'expérience de production google,
de distiller la sere.
Donc,
vous avez argumenté l'adoption de sere
d'autres entreprises
qui sont au-delà de Google,
et vous parlez beaucoup de customers
Google, etc.
Des idées de d'autres implementations
de SRE, comme vous l'avez vu à l'étude du monde, vous avez vu des idées de ces implementations
que Google a adoptées ou peut-être que ça devrait être adoptée ? Qu'est-ce que nous pouvons apprendre
d'autres ? Oui, nous avons peut-être trois ans après la publication des livres,
fait un petit peu de groupes de gens qui étaient leur SRE-lead dans leur compagnie et parlaient à eux
de comment ils ont utilisé ce que nous avons publié et ce qu'ils ont appris à la construction de SRE
dans leur organisation, pour avoir un effect bien. En plus de quelques cas, ils ont été
utilisés avec des adaptations intéressantes. Un peu de ces livres ont été réalisés dans les
catégories de la façon dont nous avons fait SRE. Google a une réflexion de les principes
d'organiser et d'organiser, mais aussi de la façon dont Google a organisé et élevé.
D'autres entreprises ont des organisations différentes, des managements différents,
des priorités différentes, en quelque cas. Vous voyez l'obligation d'adopter cette idée,
comme je veux que le team de développement ait un réel incentive personnel pour faire
un service qui ne requiert pas beaucoup d'humains. À Google, vous faites ça par le dire,
et vous anest hanno moins de publiclymission dit des paycheckels.
Maintenant, nousありenons کر tech en tuto plan sur le socio-uncked Off Bor głos et ilsairesodles.
Alors nous avons Multiple��, une main visual, des
Bay чik et revenue, Eden,
un mécanisme différent pour guider les équipes de développement
pour construire une service qui ne faut pas beaucoup de humain
et ne faut pas beaucoup d'huile.
Mais les idées sont...
Je vous donne une perspective de management.
Il y a aussi des perspectives techniques,
mais vous vous demandez une VP, vous vous demandez des answers.
Mais ces techniques de management,
de faire des groupes différents,
qui sont importants et utiles pour la société,
et appeler les principes de SRE
pour la distanciation de ce qu'elle a besoin.
Ce sont tous utiles et gratifiés pour vous.
C'est très cool.
Nous allons suivre ceci.
On a parlé de la première.
Donc, l'éducation de la société et de l'éducation de SRE,
doit-on nous appeler SRE en collège, à l'université ?
Ça doit.
Je vais admettre, je suis surpris
de la grande intérêt qu'il y a dans le SRE
quand vous et les autres m'ont appris à écrire le livre.
Je pensais que ce serait bien et qu'il serait possible
de nous parler un peu.
Je pensais que nous devraient voir 3 000 copies.
Donc, j'étais en train de faire deux ordres de magnitudes
dans mon estimation de la grande intérêt.
Je pense que la collège est bien,
mais vous avez juste de la science de computer,
les principes de la science de computer et de la collège
sont l'idée de systèmes de géant et de rollout progressive
et d'éros et de budgets d'air.
Est-ce que ça va résonner ?
Ou est-ce que c'est trop tard dans votre carrière
pour vraiment se démarrer pourquoi ces choses sont intéressantes ?
Je ne sais pas.
J'ai été super pessimiste
sur l'intérêt et l'intérêt de la SRE
avant que je ne pourrais pas faire ça de même.
Peut-être qu'il y a un moyen de plaisir.
Je pense que l'université aujourd'hui,
les gens pensent sur des choses à une scale très petite,
une scale très locale,
même en justifiant un peu de dose,
comment on scale les choses ?
Qu'est-ce qui va être différent si vous choisissez
la carrière et l'industrie ?
Et l'autre chose qui est intéressant,
il y a eu un couple de forêts dans cet espace.
Mikey Dickerson a récentement essayé un cours
à Pomona, il a parlé de ça à Saree Khan.
Il était fasciné.
Il a basically eu à ses étudiants
un bâtiment pour faire des services
au cours de la semaine.
Ils étaient grés à l'endroit de l'école
en face du temps que ils pouvaient atteindre.
Ils ont rencontré leur SLO ?
Ils n'ont pas rencontré leur SLO ?
Je pensais que c'était un approche fascinant.
On a essayé un couple d'approches différentes,
même avec Google SREs,
un de nos collègues Christophe Lang
a pris un cours de master niveau
en Germany.
On a pris un peu de temps dans le water
avec des courses online.
L'intérêt est là, mais c'est-à-dire
qu'il y a des programmes de base
qui sont en train de se réveiller.
Et il peut être
que le moyen correct
est d'avoir des lectures
sur les bases
de la gestion de un système de distribution
et de comment
les pratiques de production
sont faites,
parce que certainement les choses
comme le rôle progressive,
et la diagnosis rapide,
ce sont les concepts
que chaque ingénieur
doit avoir.
Notre idée est que
chaque SOUI
s'étend 6 mois dans un SRE
avant d'y travailler
sur d'autres services,
parce que c'est un peu de background.
Il y a peut-être une opportunité
de apprendre ces concepts
et un peu d'application
pour tout le monde
dans le curriculum de sciences.
Merci.
Steve,
nous sommes en train de faire un grand
défi.
Steve,
d'autres questions
de la pression ?
Non,
nous allons le faire.
Vous ne verrez pas ceci
mais,
ce sera dans le futur.
Pouvez-vous prétendre le futur pour nous,
ce qui nous connait.
Qu'est-ce que vous allez faire dans les 2 ans ?
Ou,
comment va-t-on jouer
sur votre pression ?
Je peux vous dire que vous ne pourrez pas être parfait.
D'accord.
Il y a une industrie compétitive
qui va toujours se battre
les boundaries.
Vous allez toujours être en train de
traduire des choses comme
la reliantité, la risque,
l'efficience, la vitesse de la feature,
la scale.
Le but pour le SRE
est d'utiliser la technologie,
l'engineering,
pour imposer
l'éfficience de ce qu'il est possible.
Pour que l'un des groupes
de la population
puisse avoir
plus de la vitesse de la feature,
plus de la scale, plus de la haute haute.
Avec le même nombre de heures
investies pour leur services
en temps, parce qu'ils ont fait
des choses qui ont été faites par la main,
ou qui ont été introduits et qui sont répliqués
par la technologie qui fait
ce qu'il faut.
Donc, je pense
que l'un des plus intéressants
et pour moi, excitant
les frontières que nous nous mettons
maintenant est le mouvement
de risque.
Il y a un framework STPA
que nous avons travaillé
pour plusieurs années et la team,
et le groupe de MIT, a fait
beaucoup de progressif en faisant
un STPA plus facile
pour assurer.
Et pour ceux qui ne sont pas connus,
sur le STPA, vous vous
faites un processus,
avec les gens, et ça
sprit un set de vulnerabilities
et de risques que votre système a
et vous pouvez choisir de fixer ces choses.
C'est très bien et très fort.
Mais c'est aussi un plan de plan.
C'est Nancy Levenson qui travaille au MIT, je pense.
Oui, mais nous nous sommes
en train de faire
plus facilement, plus de temps
investi, plus de tools qui
font de l'aide. C'est en un sens de
suivre le path normal de la
sérilité, qui commence à être manuel, et on
figure de la manière de la faire
plus facilement et de la faire
de la technologie pour faire des pièces.
Et l'idée est, je peux vous dire
toutes les outages que vous allez avoir
avant qu'elles soient faites.
Et puis vous pouvez décider
combien de choses vous voulez fixer
et combien de choses vous voulez vivre
avec, comme une choisie d'ingénierie.
C'est incroyablement intéressant.
Parce que maintenant,
il y a des heuristiques pour faire ça, mais on peut
utiliser l'assessment actuelle pour le faire.
C'est deux ans de temps.
Je pense que
20 ans, je ne vais pas
faire le mistake de plusieurs
figures de la industrie notable
qui ont été faites en essayant d'offrir
une prediction sur le record
pour ce que 20 ans de maintenant ressemble.
C'est...
La révolution de la machine
est juste
comment vous pouvez être avec ça.
Je vais mettre un steak
sur le terrain et dire que je pense que
la pétition d'innovation que nous
voyons est probablement continue.
On ne voit pas
que le final de la loi, pour exemple,
on ne voit pas que la pétition d'innovation
dans les services ou technologie
ou même les idées
est en train de s'entraîner.
Si vous inquiétez ce que je veux dire,
regardez ce que le monde a regardé
comme en 2004,
les smartphones,
je veux dire,
le monde maintenant
en technologie est
différemment inoculant
que 20 ans plus tard.
Je ne dira pas que ça soit différemment inoculant
20 ans de maintenant aussi.
C'est une partie de ce que je veux faire
pour moi, faire ça comme une industrie de fun.
C'est bien.
Merci beaucoup Ben. C'était un grand conversation,
bien sûr. Merci aussi
de la Gene pour m'aider
aujourd'hui avec les Doudies Co-hosts.
C'est un honneur de être ici.
Avant de nous aller, est-ce qu'il y a d'autre
que vous voulez faire dans la salle
comme une pétition
ou une page de délicat
ou juste votre préféré,
GIF, peut-être.
Oui, c'est
le débat éternel.
Je pense
que ce que je disais, en passant
plus tard, je me dis que
je pense que si vous êtes
en train de travailler en software
ou vous êtes intéressés
en travailler en software,
c'est super utile de faire
un point de spending
un peu de mois en travaillant directement
sur les problèmes de production.
Et si vous êtes heureux
d'avoir une fonction de SRE
dans votre company, en travaillant
là-bas, mais si vous n'êtes pas
en train de travailler en production
et de travailler sur le système
et de travailler sur le problème de production
en regardant comment les choses
travaillent et comment elles ne travaillent,
je n'ai jamais vu que cet background
serait utile pour les gens qui
se sont succédents pour essayer de
construire les choses.
Et je le souhaite un peu
pour que vous soyez en train de travailler
sur les voitures,
pour savoir comment se conduire.
Et si vous êtes en train de travailler
sur les systèmes de software,
vous pourrez comprendre comment elles fonctionnent
et vous avoient
des hazards et des pittes
qui viennent de construire
des services sucessibles.
Si vous vous faites le service, vous voulez
être successeux. Si c'est successe, vous avez
les problèmes de scale.
SRE est très bien
de résolver les problèmes de scale
sans
l'investissement de scale, si vous voulez.
C'est un background utile.
Merci à vous.
J'espère que vous avez un bon restreint
pour votre jour.
Et peut-être que vous allez voir vous
en saison 4.
Merci beaucoup.
Merci à vous.

Les infos glanées

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

GoogleSREProdcast

SRE Prodcast brings Google's experience with Site Reliability Engineering together with special guests and exciting topics to discuss the present and future of reliable production engineering!
Tags
Card title

Lien du podcast

[{'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere