S5E2 - On a reçu un développeur de cheat de jeu vidéo !

Durée: 171m37s

Date de sortie: 06/11/2024

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Pourquoi Banque Populaire est la première banque des entreprises ?
Je me posais des questions sur le partage de la valeur pour mes salariés.
Elodie, ma conseillère Banque Populaire, m'a proposé une solution d'épargne salariale sur mesure,
rapide à mettre en place et que je peux piloter en ligne.
C'était simple et surtout ça a fait des heureux.
Accompagner nos clients sur tous les territoires avec des solutions adaptées à leurs besoins,
c'est ça, être la première banque des entreprises, Banque Populaire, la réussite est en voulue.
Étude Quantar PMEP, mid-2023, Quatorze Banques Populaires, première banque des PM.
Bienvenue dans Underscore, installez-vous bien.
Je suis aujourd'hui en compagnie de mes amis de l'entreprise, ça fait longtemps.
Le retour, oui, exactement.
C'est une rentrée, ça fait plaisir.
Petite émission, petit début d'émission hors famille.
Ça va ?
Ça va, ça faisait quoi, trois mois qu'on s'était arrêté ?
Eh ben oui, enfin j'ai fait une émission tout seule et tout triste.
Non, avec plein d'habités il y a deux semaines.
Il y avait Tiffanie aussi.
Oui, il y avait Tiffanie.
J'avoue.
Tu es la pauvre.
Elle est très vite oubliée.
Et vous l'avez vu, c'est le retour de Mathieu.
Bonsoir.
Mathieu, tu vas bien ?
Oui, ça va bien.
Nous, ça fait longtemps qu'on s'est pas vu aussi.
C'est vrai que ça fait longtemps qu'on s'est pas vu.
Mais oui ça.
C'est une rentrée pour de Mathieu un peu.
C'est un peu tarot pour toi.
J'étais à distance.
Mais oui, ça va plutôt bien.
Et puis on a un beau programme.
On a deux gros craques dans l'émission.
Ouais.
Et une chronique.
Moi je vous le dis, le troisième craque.
D'ici présent, on va parler, en commençant par la fin,
de développement de cheats avec quelqu'un qui vient d'une boîte
qu'on avait déjà eu ici qui s'appelle SINACTIVE.
Ça par exemple, ce sont des gros craques.
Voilà, là on peut le dire sans trop s'avancer à plurie
qu'on est sur des gros malades.
C'est marrant parce que depuis, au moment où on les a reçus dans l'émission,
je ne les connaissais pas si bien.
Enfin, l'entreprise je veux dire.
Et après tous les échos que j'ai eu.
Franchement, dans la sécu offensive-défensive en France.
C'est genre, il y a deux boîtes peut-être dans cette catégorie.
Donc c'est SINACTIVE.
Et là pour le coup, on ne va pas parler de leurs proets à la DEF CON,
je ne sais pas où.
Mais on va parler du passé sombre.
Du passé sombre d'un de leurs employés qui est hyper cool.
Et avec qui on va parler de développement de cheats de jeux vidéo.
On aura aussi Jean-Louis que vous connaissez déjà.
Jean-Louis Kéhine qui vient de nous parler de sa boîte GLADIA.
Et plus généralement de la voie dans le monde de l'IA et des modèles de langage.
Et vous allez voir, c'est une sorte de guerre entre différentes stratégies,
entre OpenAI et les autres.
Et ça va être très intéressant.
Si vous ne vous rappelez pas, c'est Jean-Louis.
Il a parlé de NVIDIA notamment.
Il a fait un sujet sur les quatre graphiques NVIDIA.
Il y a un autre sujet sur comment il a bossé pour une entreprise sombre
sans le savoir au début.
Voilà, ça c'est Jean-Louis.
Il a déjà fait deux sujets.
Vous allez le reconnaître quand il y va.
Deux sujets très très appréciés d'ailleurs.
Et c'est inactive, on avait abordé le hack des Tesla.
Ils étaient venus nous pas de vue d'une Tesla.
Il y avait une Tesla et une vue d'une Tesla sur Windows également.
C'était sur du Bluetooth, non ?
Alors oui, il y avait du Bluetooth en jeu, t'as raison.
Mais c'était un peu une chaîne de vue de sensibilité finalement.
Avec le CANBUS, non ?
Non, ça c'est une autre chronique.
Mais en gros ils avaient réussi à prendre le contrôle d'une Tesla.
Ils étaient repartis avec une Tesla de mon temps.
Et en fait c'était en cas d'un concours.
Et du coup ils avaient gagné une Tesla tout à fait.
C'est incroyable.
Et avant, on aurait une chronique de Mathieu.
Tu vas nous parler d'un sujet absolument pas sensible.
Pas du tout.
Je ne marche pas sur des jeux.
Je sens que tu es à l'aise.
Oui, ça va.
Il y a des choses passionnantes à raconter.
C'est ça.
Le sujet, moi je ne le connaissais pas le sujet.
Le sujet c'est l'attaque des beepers du S-Bola.
Et dans le titre Twitch.
Ils le donnent le titre Twitch.
En vrai, ça m'intriguait.
Je me suis renseigné.
C'est un peu ce qu'on veut avoir à raconter.
On pouvait pas ralimparcer.
Il y a des gens très doués qui ont fait des enquêtes aux IN.
C'est ce que j'allais dire, on a déjà des infos.
C'est des petites infos.
En fait, ça dépend des infos.
Mais par exemple, Belingcat a commencé
le site d'investigation d'Ozint très connu.
A publié des premiers papiers sur cette affaire.
Il y a des choses qui sont déjà sorties.
On en parle à tout à l'heure.
Je m'avance.
Mais on entend ça.
On n'a pas prévu de petites news.
Mais moi, je suis chaud.
Je préfère expliquer.
Je ne sais pas les trucs qu'on fait en ce moment.
C'est ici Rémi, il a une news.
Ah oui, vite fait.
Je le jette sous le bus.
Je dis que c'était pas obligé moi.
C'est une micro-news.
C'était juste une réaction.
On avait fait une vidéo.
Vous souvenez qu'il parlait de deals dans le Pacifique.
Pourquoi on en avait parlé ?
Pour les noms de domaines et que c'était une rente.
Tout va loup.
Exactement.
Elle est sauvetable.
Si longtemps qu'on a travaillé sur cette vidéo.
En deux lignes, il y a l'archipel des chagos,
que l'on se prononce comme ça.
Qui a côté de Lille Maurice.
Qui est un partenaire, c'est une archipel britannique.
Lille Maurice va récupérer l'archipel.
Une question qu'il se pose.
Il posséde le point IO.
L'archipel va disparaître.
Il va devenir Maurice.
Le pays, le code est censé disparaître.
On a le code FR pour France.
L'Io n'existera plus.
Il sera Maurice.
On sait pas ce qu'on veut.
Mais il y a tellement un business qui va devenir le point aillot que Stark-Ked qui va rester.
Genre, GitHub.io par exemple.
Mais exactement.
T'as des mastodontes comme ça, c'est impossible.
Et ça faisait partie de la fête.
Tous les trucs de Dev sont points aillots.
Il faut les petits jeux aussi, tous les startups.
Oui, les Agar-io.
Oh ouais, Agar-io et tout.
J'ai bien connu et je trouve ça incroyable comme conséquence géopolitique.
C'est clair, disparition d'un nombre de domaines.
Moi, ça me soule parce que je n'arrive pas à charger mon chat Twitch.
Il y a plein de soucis en ce moment donc...
Ah oui, c'est vrai ?
Ouais, je ne sais pas.
Je ne suis pas le seul.
Et pourtant, nous sommes bien en live.
Oui, on est bien d'accord.
Bah non, sinon je n'aurais pas de chat, mais c'est dommage.
Je peux te le dire en direct si tu veux.
Ah, c'est cool.
Chaque message, s'il te plaît-il.
Vraiment, tu...
Attends.
Bah écoute, j'en profite parce qu'il y en a qui ont remarqué que tu t'étais laissé poser les cheveux et qui ont dit que c'était super beau.
Ah.
Gère ton malaise en live.
Ah, je sais pas.
Vous aussi, vous ne savez pas acquérir les compilants.
Bonjour, je m'appelle Mathieu.
Et c'est très compliqué ce jour-là.
Merci, Tille.
Et merci, l'autre chat.
Ça me fait plaisir.
Mais moi, j'ai une question au premier degré,
mais si tu galères avec l'autre chat, j'ai un peu d'escrocule à te la poser.
Mais on peut l'hèche pour la poser un remis.
Parce que vu que ça fait un petit moment que vous ne les avez pas vus dans la vie.
Qu'est-ce que vous faites ?
Un travail ?
Je pense que ça me rend plus.
Bah vas-y.
En vrai, c'est une bonne occasion.
C'est même pas facile à décrocher.
Des rayures en live.
On fait tellement des trucs obscures d'un point de vue technique que c'est compliqué à décrocher.
En gros, là...
Mais tout simplement, qu'est-ce qu'on fait d'un produit très macro
avant de rentrer dans la technique ?
Vous avez peut-être entendu parler de One Click Studio,
qui sont nos studios automatisés,
avec tout ce qu'on a appris à faire dans nos propres émissions.
Et pour d'autres personnes, on est parti...
créer tout un système de studio automatisé.
Donc il y a énormément de techniques derrière.
La vidéo, c'est très fun.
Ça sera très actif.
Et ça soit aussi très stable.
C'est un peu tout le challenge.
Et donc moi, ma partie actuellement, c'est l'OS.
Ok, on a un Linux.
On veut pouvoir débrancher.
C'est un PC qui fait fonctionner des studios de tournage.
On va pouvoir le débrancher n'importe quand.
On veut qu'on puisse faire des mises à jour.
Mais que ça lui rend le démon possible.
En fait, c'est de l'enmarquer.
Tu fais un OS custom basé sur Linux,
tu imagines, pour le One Click Studio.
Tu veux pouvoir brancher...
Tu ramènes un PC, tu le branches, tu le débranches,
tu rajoutes des écrans, n'importe quoi.
Il faut que ça soit super stable, que ça fonctionne.
J'utilise du Fedora un peu.
Il y a du Fedora Embarqué, qui s'appelle Fedora Yoti.
Et derrière, pour faire de l'interface...
Mais tu n'étais pas beaucoup égré.
Il y a eu un...
Il y a eu un état de l'arc qui était égré.
On n'a pas de tout, si.
Mais vraiment, on n'est passé pas beaucoup de choses.
On n'a qu'à des yokutos, on a gardé...
Ok.
Un peu tout, oui.
Au buntu core.
La moitié de mes journées, dernièrement,
c'était discuter avec ChaljpT,
étreiner sur des forums pour savoir ce qui se fait,
ce qui s'utilise,
et fouiller vraiment le fin fond d'Internet
pour trouver le truc qui correspond bien à ce qu'on fait.
Ok, trop cool.
En vrai, ça, c'est des sujets qui me posent.
Je pourrais t'épouser en parler.
C'est trop intéressant.
C'est longtemps.
C'est un Ouest où il n'y a rien.
C'est à entendre parler de Wayland,
de tout ce qui permet de gérer les interfaces graphiques.
Il y a une fenêtre à l'afficher.
On veut enlever le maximum de couches
pour que ce soit le plus efficace possible.
Si tu branches...
Oui, donc c'est vraiment sur la philosophie d'Enmarquer un.
Et c'est vraiment du très bas niveau.
Bonne prise de tête.
Beaucoup de choses à explorer.
Mais hyper faible.
C'est un conner.
Et du coup, c'est très marrant.
Et pendant que moi, je bosse sur, en gros,
ce qui s'appelle le compositor.
Et donc concrètement, c'est la brique
qui vient à récupérer tous les inputs,
vidéo,
et les mélanger.
Un peu comme LibOBS, en fait.
Comme la brique de mélange,
software de BES.
Tout le monde n'utilise pas ça.
On utilise un truc de truc maison.
Et du coup, j'ai pas mal de temps
à trouver un fonctionnement
qui marchait bien.
Et j'ai fait tout un détour
passionnant dans le monde du jeu vidéo.
Parce qu'en réalité,
j'ai fini par me rendre compte que
ce dont on avait le besoin,
c'était une architecture qui s'appelle le CS.
C'est assez spécifique.
Les gens qui font le jeu vidéo
sauront exactement ce que c'est.
Mais c'est une façon de faire une appli
qui est assez originale,
qui a été inventée pour le jeu vidéo à l'origine.
Et qui nous simplifie la vie à mort.
Et c'est pareil.
Je l'ai passé un mois
dans un monde inconnu
à découvrir complètement plein de trucs.
Mais pareil, trop intéressant.
Et donc voilà.
Et c'est marrant,
parce qu'il y a des problématiques
de latence, de fou,
enfin de perte, de latence.
C'est de la vidéo,
où on gère plein de flux,
où on veut pouvoir faire de l'inférence
sur les frames,
pour savoir où sont les visages,
dans quelle direction tu es en train de regarder,
potentiellement plus tard,
quelles sont les émotions que tu as ?
Est-ce que tu es en train de parler,
mais pas à la voix, à l'image ?
Pas en bref.
On comprend tout ce qui se passe.
En gros, on a d'un point de vue de...
La partie UX est complètement
quasiment terminée
du produit.
Et là, on est vraiment dans le dur
de l'implemme,
mais qui est très intéressant.
Et pour ceux qui connaissent, c'est en reste.
Oui, c'est en tout cas en reste.
Exactement.
En vrai, c'est cool, parce que je sens
qu'on monte tout son niveau sur plein de sujets.
Et quand on arrive à avoir un truc,
ça se refrustera parce que ça produit ton.
Pour tous ceux qui attendent
que le truc sort.
Il y a des impatients dans l'autre jeu.
Je suis premier à être impatient,
mais du coup, c'est comme ça.
On trouve la bonne façon de faire,
ça a bien presque élégant,
et c'est là où c'est satisfaisant le résultat qu'on a.
On a quand même l'impression d'avancer.
Sans plus attendre.
Il y a des gens qui vont te réclamer
des vlogs updates du projet, je pense.
En vrai,
on va bientôt arriver
à un moment où ça peut être intéressant.
Parce qu'en vrai, le faire quand t'es en plein de sujets,
je dis que les gens vont le réclamer,
c'est ce que tu vas faire.
Il y a un moment où tu fais une annonce,
souvent tu fais ton annonce avant que le truc soit
prêt à chipper,
à te renvoyer.
Et donc, à partir du moment où on fait ça,
c'est sûr que ce sera dans notre intérêt
de le faire, entre guillemets.
Faire du contenu autorisé.
Et donc là, vous en entendrez un peu plus paris.
Je vous propose de passer à la première partie.
Jingle !
On vous l'a dit aujourd'hui.
On va parler.
Je ne sais pas si c'est dans nos sujets habituels,
pas exactement, on reste dans la cybère, dans la king, etc.
On va dire que c'est dans les sujets.
Mais on s'aventure un peu aussi dans la chute.
Dans la sécurité renseignement.
Vous l'avez sans doute vu passer aux infos le 17 septembre dernier,
une attaque simultanée, savamment orchestrée et inédite
par son ampleur, a touché les beepers du
Esbola au Liban, beepers qu'ils utilisaient pour communiquer
en interne.
Ce mode opératoire pose instantanément
tout un tas de questions.
Comment une pareille attaque peut-elle avoir lieu
simultanément ?
Quelles failles ont été mises au jour
dans la sécurité du Esbola ?
Et quel moyen sont nécessaires pour mener
une attaque d'une telle ampleur ?
Est-ce qu'il y a un but informationnel
de renseignement pour les attaquants, etc.
On s'est renseigné, nous, sur le volet technologique.
Et on va vous parler de tout ce qui a été trouvé
et les enquêtes aux intes qui ont été faits
par plein de gens.
Mathieu, tu t'es renseigné là-dessus.
Oui.
Et je vous propose de commencer par un résumé
d'effets. Le 17 septembre dernier, à 15h30,
l'on se rend compte, les bipers que portent
les membres du Esbola reçoivent un message
de leurs leaders.
Quelques secondes plus tard, ils explosent
simultanément et partout au Liban.
Et également, même quelques bipers
en Syrie, le pays voisin.
Il y aura plusieurs vagues d'explosion
dans l'heure qui suit. Et on recense
au total une douzaine de morts et plus
de 2700 blessés.
Tu l'as dit, c'est une attaque sans précédent
d'une ampleur inédite qui a visé le Esbola.
Même de l'aveu lui-même du Esbola,
la plus grande faille de sécurité
qu'ils aient connue
depuis qu'ils sont en conflit avec Israël.
Tous les soupçons se tournent
vers le Mossad, les services secrets israéliens
réputés pour être l'un des plus redoutables
services de renseignement au monde.
Et je vous remets un tout petit peu
dans le contexte. Le Esbola, c'est un parti
politique religieux au Liban, qui est doté
d'une branche armée. Il est classé comme groupe
terroriste par de nombreux pays, mais pas
par tous. C'est un problème géopolitique.
Et il est en conflit notable avec Israël.
Évidemment, nous ne ferons pas
d'analyse géopolitique ici. Nous en sommes
bien incapables. Ce qui nous intéresse
c'est ce que ça dit
d'un point de vue technique
et d'un point de vue de la sécurité.
En gros, comment c'est possible
que des milliers de beepers explosent
d'un coup en même temps ?
Et déjà, on va commencer par la première question.
C'est quoi un beeper ? Et pourquoi le
Esbola en utilise ?
Moi, j'ai dû aller vérifier quand j'ai vu la news
parce que je n'ai jamais utilisé de beeper
de ma vie. Pour moi, c'est un truc d'hôpitaux.
Exactement. C'est un moyen
de communication qui permet de s'échanger
principalement des messages. J'ai découvert qu'il y a aussi
des vocaux qui peuvent se passer par beeper.
Et en fait, ça marche sur son propre
réseau radio
fermé. En tout cas, celui du Esbola, il était fermé.
C'est une ancienne technologie et tu l'as dit, on la retrouve
dans les années 80, 90,
début 2000. Principalement
dans les hôpitaux. Les médecins, ils avaient ça.
Ils avaient un beeper pour qu'on puisse les beeper
s'il y a eu une urgence à l'hôpital.
Moi, je l'ai principalement vu dans la série
urgence. Je ne sais pas si y en a qui.
On a vu cette série, une vieille série.
Les médecins étaient équipés de beeper.
Et ça marchait
depuis une longue distance
ou fallait être à côté de l'hôpital ?
Oui, plutôt pleureux, ça marche dans une longue distance.
Ça, je pense que ça dépend de l'infra
qui est derrière le réseau
radio-féquence qui gère les beepers.
Mais ça marche, c'est plutôt une
longue distance. Carrément.
Après, bien sûr, il a été remplacé
dans nos usages quotidiens par le téléphone
quelques années après. Mais du coup,
pourquoi le S-Bola utilise
toujours des beepers en 2024 ?
Parce qu'ils n'ont plus
du tout confiance dans leur
smartphone. En février
2024, Hassan Nasrallah
qui est le secrétaire général du S-Bola,
donc le patron du S-Bola, a ordonné
aux combattants du S-Bola dans un discours
télévisé, donc vraiment à l'ensemble du pays,
de se débarrasser de leur téléphone.
Je vais le citer. Le smartphone
est un appareil d'espionnage. Il entend
tout ce que vous faites, dit envoyer
et prenez en photo, jetez
vos smartphones, enterrez-les, mettez-les
dans une boîte de métal et éloignez-les.
C'est l'ordre du chef
du S-Bola. Et en fait,
leur crainte, qui est
tout à fait justifiée, c'est que Israel
soit en capacité, soit
d'espionné leur smartphone, un peu
à l'image de ce qu'on a vu avec le logiciel Pegasus
dans une mesure plus restreinte
au service de renseignement israélien,
soit de se servir de leur téléphone
comme une arme. Et on a déjà
vu des assassinats, où le téléphone
du cible explose dans cette région
du monde. On en a déjà vu.
J'ai un exemple, mais qui date, c'est
en 1996,
c'est l'artificier du Hamas.
Son téléphone lui explose dans les mains,
il va mourir de ça. Alors c'est un téléphone
piégé, ils ont réussi
à fournir à la cible, exactement.
C'est ça ?
Parce que je ne sais pas arrêter
aussi une rumeur possible
que certains gens peuvent avoir.
À savoir, la batterie par exemple,
telle quelle,
ne peut pas être actionnée à distance
pour exploser sur un smartphone non
trafiqué. Il faut rassurer.
Exactement. Et justement on va décortiquer
pourquoi dans ce cas là les bupers ont
explosé. Et on va faire un parallèle
avec le smartphone. Il n'empêche que dans la population
au Liban, beaucoup ont pris peur
de leur smartphone au moment des expositions
des bupers, parce qu'ils voient tous les moyens
de communication comme une faille potentielle.
Et je pense que
se rendent compte
qu'un objet que tu as en permanence
sur toi peut être
un instant et une arme.
Même si c'est pas
logique, même s'il n'y a pas
de vraies failles, ça doit
être assez perturbant. C'est une association psychologique
très forte. Exactement.
C'est une association psychologique absolument très forte.
Et donc du coup,
c'est menace,
on a été pris très très au sérieux par le
Hezbollah qui se sait évidemment épiés
par le Mossad.
Et donc ils ont abandonné
les smartphones et ils sont passés
à des technologies
qui disent l'OTEC. Donc c'est-à-dire des bupers
et aussi
des Tokiwaki. Et en fait
pourquoi ils sont passés à des vieux systèmes
de communication ? Tout simplement parce qu'ils sont
moins sensibles aux outils de surveillance
moderne. Par exemple
ils sont pas sensibles à la géolocalisation
à l'interception des signaux, on verra
ou pas si ça a été le cas.
Et globalement il y a une surface
d'attaque qui est moindre que celui
d'un smartphone. C'est une idée
de t'allier dire quelque chose ? Jusque je suis
parlé extrêmement nul mais
je suis en train de voir en ce moment la série Le bureau
des légendes. Ah oui, excellent série. Qui d'un point
du technique et
à ces zones de raccourcis mais qui globalement
est plutôt très bien fait. Et effectivement
je te rends compte que dans
90% des scénarios
de contre-terrorisme
le renseignement
du téléphone
et du GPS juste par triangulation
voire par juste accès au GPS
est constant. Donc c'est
vraiment des ballises
c'est les ballises GPS ambulantes
en fait les smartphones. Poulettement. Et on pourra d'ailleurs
outre le GPS faire un sujet sur
comment on...
je travaille dessus. C'est comment les forces de l'homme
arrivent à identifier, à trianguliser
via juste le réseau téléphone.
Donc clairement ce sont des...
je vais dire des failles mais des moyens d'espionnage
qui sont clairement en vigueur et quand
on connaît la force du Mossad évidemment
que c'est dans leur capacité.
C'est une idée tout à fait astuciode
astuciose du S-Bola
de s'équiper de technologies
qui sont a priori moins espionnables mais on va
voir que ça va complètement se retourner contre
ce 17 décembre avec les explosions
de tous les bipers. Alors
comment cette explosion a pu se mettre en place
tout simplement ? Comment c'est possible ?
Il y a 3 raisons.
Il y a en fait il y a 3 problèmes
3 raisés qui vont faire que ces bipers ont pu exploser.
Évidemment ce que je vais vous dire
la majorité des infos est à prendre
au conditionnel parce qu'on a pas
de rapport officiel mais
ce sont des informations de l'année à droite
à gauche par des experts de leur sujet.
Certes les bipers utilisent
un réseau radio de fréquence
fermé, distancié et différent
du réseau mobile des smartphones
mais c'est du vieux maternel
et celui-ci n'était pas chiffré
comme on le ferait aujourd'hui. Aujourd'hui
si on devait mettre en place un système de radio
fréquence, évidemment on le chiffrerait
potentiellement avec de la US. Là
c'est un vieux réseau
et il n'est pas chiffré. Et ça va poser
un premier problème c'est que
ça fait que le réseau de bipers est vulnérable
à une injection RF, une injection
radio fréquence qui aurait pu être
utilisé dans ce cas. C'est un peu
à l'image d'un flipper zéro
sur lequel t'arrives à ouvrir ta porte
de garage parce que ta porte de garage
est vulnérable sauf que c'est
forcément beaucoup plus puissant, c'est à l'échelle
d'un pays donc il n'y a pas du tout les mêmes
émetteurs qui envoient les radio fréquences
mais c'est pour vous expliquer que c'est
sensible à une injection RF et vu que
le réseau est pas chiffré on peut faire ça.
Parce que quand tu dis pas chiffré c'est
en lecture et en écriture
c'est à dire que nous ce que tu veux
protéger c'est le contenu de la communication
mais d'ailleurs je suis inquiet de savoir
si c'était vraiment
un onglement entre guillemets
ils étaient parfaitement au courant
dans l'ESBOLA. On sait pas
parce que je vous en parlerai après mais ils ont eu
des problèmes sur la logistique de ces
biber et on sait pas à quel point ils ont
checké mais peut-être qu'ils sont complètement au courant.
On n'a pas d'infos par exemple sur est-ce que le
MOSSAN parvenait à lire les messages
via les bipers. Par contre ce qu'on sait
c'est qu'ils avaient des bipers qu'on communiquait
mais c'était pas du tout leur seul moyen de communication
et que ça dans l'ESBOLA et notamment
au sein des dirigeants du ESBOLA
la communication orale est totalement privilégiée
pour toutes les questions
très stratégiques, parfois avec des messagers
parfois ça passe par des civils
justement pour éviter
qu'une info soit intersceptée
par un système de télécommunications
et après on ne sait pas si
typiquement s'ils utilisait un système de communication
non chiffré
ils pouvaient dialoguer en code entre eux par exemple
complètement et c'est des choses qui
pareil se sachent.
Oui c'est un truc qui me lance
mais Thorabo
récupérer le message
en cours d'oraux tu ne comprendras pas
par contre ce qui est intéressant c'est que
ce que tu expliques c'est pas juste le problème
de la lecture des messages mais aussi
de l'écriture c'est-à-dire que
quelqu'un avec une antenne pouvait en capacité
d'envoyer un message simultanément à peut-être
tous les bipers de la zone
Deux choses pour te répondre
il y a une enquête qui a été faite notamment sur
les méthodes de communication du AMAS
c'est pas le S-Bola mais c'est des organisations assez proches
qui documentent
un petit peu la façon
de communiquer les messages codés qu'ils ont mis en place
pour pas se faire intercepter les communications
et comme tu l'as dit
en fait ce qu'on pense c'est que le Mossad
a pu diffuser en broadcast
c'est-à-dire sur toutes les fréquences
de tous les bipers un message
et c'est ce message en fait qui aurait
déclenché l'explosion
ça je vous parle de la première étape
mais c'est une étape nécessaire au fait
de parvenir à faire exploser ces bipers
c'est que via ce réseau qui n'est fermé
qui n'était pas chiffré potentiellement on a pu
broadcast un message, diffuser un message
à tous les bipers et ça a déclencé
l'explosion mais
ça ne lui dit pas pourquoi
ils ont explosé
en fait tous les bipers
auraient été ouvert et une petite
quantité d'explosif
quelques dizaines de grammes attachés
au bas prix
au batterie des bipers
alors on va revenir sur ce point
comment c'est possible
comment c'est possible qu'à un moment
de l'explosif se retrouve sur
tous les bipers des membres du s-ball
des enquêteurs au Zint ont tenté de remonter la piste
et je vous fais
un rapide ou pas rapide résumé
de ce qu'ils ont trouvé
globalement ces bipers ils viennent d'une marque
c'est la marque gold apollo
elle est basée à taiwan
évidemment suite à cet attaque
ils ont été contactés, il y a même une enquête
qui a été ouverte, des perquisitions
qui ont été faites, bref
ils sont surveillés, eux
ils affirment que ça fait 10 ans
qu'ils ne fabriquent pas ce
bipers depuis
2014
mais il y a une faille
en fait ils auraient vendu une licence
à une entreprise qui s'appelle BAC
B-A-C Consulting
une entreprise ongroise pour fabriquer
et vendre leurs matériels
sur d'autres marchés auxquels ils n'ont pas
accès et donc ils disent, nous ça fait 10 ans
qu'on ne fabrique pas ces bipers, on n'a jamais vu
passer ces bipers dans nos chaînes
de production par contre sachez que
cette entreprise BAC Consulting
en Hongrie a une licence pour vendre des bipers
du coup
on a essayé de remonter la piste de BAC Consulting
quelques infos sur BAC Consulting
qu'ils ont un chiffre d'affaires de 600 000 dollars
l'année passée
donc c'est pas beaucoup
une seule personne est enregistrée
c'est une femme au nom de cette société
elle parle assez mal ongroie
le site a été mis en ligne depuis
de cette compagnie
d'ailleurs vous avez peut-être pu voir
l'adresse de BAC Consulting
de tous les médias qui sont rendus là
avec leur micro et tout
avec rien quoi
évidemment rien, en fait selon les autorités
ongroises qui ont regardé
ça serait juste un intermédiaire commercial
cette société et aucun bipers
aurait été fabriqué en Hongrie
en fait il y a de gros soupçons que BAC Consulting
serait une société écran
une façade israélienne du Mossad
qui est servie à vendre ces bipers
et en fait c'est une pratique
assez courante au Moyen-Orient
d'utiliser des sociétés écran alors que ça soit pour
d'espionnage mais aussi pour des pays
qui sont sous sanction de certains pays
ça leur permet d'acheter du matériel
via des sociétés écran dans d'autres pays
c'est une façon de contourner les restrictions
ça voudrait dire que la fameuse licence
a depuis
10 ans
été donnée à une entreprise
contrôlée par le Mossad ?
Non je pense que la licence a été achetée bien plus tard
parce que cette société BAC Consulting
a été créée en 2022
et donc j'ai pas la date
de quand la licence a été vendue
mais je pense que c'est juste une licence de
oui vous avez le droit de vendre nos produits
en fait j'ai pas de détails sur la licence
qui a été accordée à BAC Consulting
C'est fou comme dit le service quand même dire
que pour se protéger d'attaques super complexes
sur les smartphones ils ont acheté
potentiellement des centaines ou des milliers de BIPOR
à une entreprise
un peu inconnue
C'est fou le montage qu'ils ont mis en place
et il est pas fini parce qu'il y a une deuxième société
qui est dans le viseur d'un média ongroit
qui s'appelle Télex.hu
c'est la société Norta Global
elle elle est immatriculée à Sofia
donc c'est en Bulgarie
elle a aussi été immatriculée en 2022
un mois avant BAC Consulting
et elle est gérée par un norvégien
et pourquoi on s'intéresse à cette entreprise
parce que c'est elle qui aurait vendu
contractuellement les BIPOR OSB
donc elle ferait partie du système
de vente des BIPOR
et d'ailleurs on constate un transfert
de 1,6 million d'euros entre
Norta Global
et BAC Consulting
donc il y a un lien entre les deux sociétés
via ce transfert d'argent
de 1,6 million d'euros
en bref pour résumer
cette histoire
il est fort possible que soit les BIPOR
ils aient été fabriqués directement
par le Mossad
pas forcément ni en Gris ni en Bulgarie
parce que c'est un système de société
et de sociétés grands et de façades
de l'état d'Israël
mais soit le Mossad les a fabriqués directement
ou alors les a commandés
soit ils les a fabriqués
soit ils étaient dans la chaîne d'approvisionnement
ils ont réussi à
avoir l'info
à avoir à un moment la main
sur tous ces BIPOR
et ils ont un par un
injecté quelques
dizaines de grammes d'explosif
dans chacun des BIPOR
il faut savoir que ces BIPOR ont été livrés
au S.B. là 5 mois avant l'attaque
en fait c'est 5 mois avant l'attaque
ils ont refait donc c'est
quelques mois après l'annonce
de leur leader de... on utilise plus de Spartphone
ils ont dû passer une commande
de BIPOR et ils avaient été livrés au S.B.
5 mois avant le...
l'attaque des BIPOR
surtout cette partie qui est la plus impressionnante
toute l'histoire
la partie technique elle est intéressante quand même
surtout il y a un truc qu'on n'a pas dit
c'est aussi que...
ce côté simultané c'est le plus intéressant
c'est le côté simultané c'est à dire que
si jamais
ça n'avait pas été le cas
et que par exemple c'était un timer
et qu'il y en avait qui explosait avant d'autres etc
ça aurait pu complètement
minimiser le l'effet
en fait parce qu'instantanément
il y aurait eu le message qui serait passé
tout le monde aurait... là il y a un côté
très très malin d'avoir utilisé
le potentiel
de sans-filts quoi
il y a une sidération qui serait alors
j'ai aussi vu des sources qui disent que
ça a duré une heure en fait les explosions
il y en a énormément à 15h30 avec le message
mais peut-être qu'il y a eu d'autres messages
qui sont partis après des explosions
4 ou peu de temps pour qu'il y ait une grosse réaction
ça qui est le plus fascinant c'est
ce moment où il s'infiltre dans la chaîne de prod
c'est ce qu'on appelle
une attaque par chaîne
d'approvisionnement et c'est d'ailleurs
quelque chose qu'on retrouve dans la logistique mais aussi dans le code
on l'a vu avec l'attaque ISZ
donc si un scénario par exemple
ils ont eu le renseignement
de la vente
ils étaient sur le bon port, bon mot avec les bons containers
et ils ont fait le swap
ou alors c'est au directement
soit ils ont eu l'information sur la vente
soit c'est eux qui ont mis en place la vente
ce qui serait encore plus fou
en fait
c'était quand l'annonce utilisait
de la fin des smartphones ?
le février 2024 donc c'était il y a
9 mois
c'est quand même extrêmement rapide pour mettre une pareille opération
c'est fou
mais tu vois les sociétés ont été créées en 2022
je pense que l'annonce
télévisait date de février 2022
mais la doctrine qui dit qu'on n'utilise plus de smartphones
date d'avant
c'est juste là il y a eu un effet d'annonce
qui est forcément
qui retourne
à la tronche du sboila
parce qu'on se souvient de ce discours
qui était télévisé donc public
tout le monde avait accès à ce discours
mais je pense que c'est une down-tring
où on évite d'utiliser les smartphones depuis bien longtemps
c'était plus pour massifier le message au libre
sur les combattants du sboila
et c'était deux problèmes
donc le problème du manque de chiffrement
qui a permis d'injection
de radiofréquence
le deuxième problème c'était les explosifs dans les beepers
du à une infiltration dans la chaîne de logistique
mais c'est pas tout
c'est pas suffisant parce qu'une injection
radiofréquence et de l'explosif
a priori c'est pas suffisant il faut un troisième
élément pour
d'exclencher l'explosion parce qu'en fait
l'explosif qui est à l'intérieur il faut un choc
pour qu'il explose
et juste un message
ça ne peut pas faire exploser
un beeper et donc
il y a un troisième
une troisième raison
c'est qu'ils auraient réussi
à hacker le firmware
le firmware, le micro logiciel
du beeper
c'est compliqué de savoir
exactement ce qu'ils ont fait parce qu'on n'a pas
eu accès à ce firmware
mais pour mieux comprendre je vais vous parler
de Charles Miller
Charles Miller c'est un chercheur en sécurité
qui n'a rien à voir avec cette histoire mais vous allez comprendre très vite
il a hacker le firmware
des Macbook d'Apple
en 2011
et qu'est-ce qu'il a hacker ?
il a hacker précisément le micro logiciel
qui contrôle la batterie
en gros
il a pu manipuler le système de charge
de sorte de contourner les systèmes de sécurité
qui font que normalement ta batterie elle peut pas
surchauffer et donc provoquer
une surchauffe et donc ça peut provoquer
un incendie de la batterie soit une surchauffe
de la batterie c'est ce qu'on a vu notamment avec
le problème des galaxy note où il y a des téléphones
qui chauffaient parfois qui prenaient feu etc
alors
t'as bien raison ils n'explosent pas
parce qu'il n'a pas d'explosif dedans
sauf que si on revient
aux histoires des beepers
le Mossad aurait pu donc rétro-engénérer
le firmware des beepers parce qu'il a eu
les beepers en sa possession
le flasher avec leurs propres
micro logiciels, leurs propres firmware
pour provoquer une surchauffe de la batterie
à la réception d'un message précis
et là on commence
à refaire toute la chaîne c'est-à-dire que
potentiellement
évidemment ce ne sont pas des informations
vérifiées mais potentiellement
ils ont diffusé un modecast
à l'ensemble des beepers
qui étaient forcément
dans les poches et dans les mains
du sbollai d'ailleurs toutes les blessures
sont globalement soit au main soit au visage
ils ont diffusé un message
ce message a provoqué
sur le firmware modifié
par les équipes
de renseignement
une surchauffe
de la batterie
et forcément si la batterie commence à
surchauffer ou à prendre feu
ça provoque le choc nécessaire
au fait que l'explosif
démarre
et ce qui est encore plus fourp
c'est que ça crée une notification
et c'est ce que
dans les vidéos on constate
qu'il reçoit une notification
parfois ils ont le temps de le prendre
même parfois pour le lire il faut presser
un bouton ou des choses comme ça j'avais les enfants
et en fait ce qu'on a vu
c'est qu'ils ont tous reçu un message
et c'est quelques secondes après
que ça corrobore
complètement ce schéma
et donc voilà c'est vraiment ces 3 principes
comment ils ont réussi à mettre l'explosif
comment ils ont réussi à diffuser un message
à l'ensemble des membres du sbollai et comment ils auraient réussi
à modifier le firmware
pour provoquer une surchauffe du système
de charge de la batterie
un firmware qui du coup avait une faille
c'est une faille de pouvoir le modifier mais c'est des appareils
assez vieux et donc même si
il y a ce côté on utilise des appareils vieux
avec moins d'une surface d'attaque
en fait ça prouve que
un service de renseignement comme le Mossad
a tout à fait
les capacités de mettre en place
tout ce que j'ai dit là
on sait que le Mossad a tout à fait les capacités
de mettre en place ce genre d'attaque
et donc même si ils sont au conditionnel
les soupçons se tournent vers le Mossad
le firmware c'est plus classique parce que tu peux
si tu veux les empêcher de pouvoir communiquer
ils ont pu les smartphones, t'aurais pu bloquer les téléphones
parfois c'est des impacts de fonctionnement
financier ou quoi mais ce qui est impressionnant
c'est d'avoir réussi à faire de
renseignement en plus
c'est un impact physique
c'est un peu la première fois qu'on a une pari affaire
d'habitude c'est un rôle logiciel, c'est financier
c'est un peu virtuel
ce qui est impressionnant c'est que c'est la première fois qu'on a une preuve
que
un scénario comme ça a été fait
à une échelle, à une grande échelle
parce qu'évidemment que ça a déjà été fait mais peut-être
sur un cas isolé dans le monde
où toi en tant que pécain moyen
tu n'entendras jamais parler sauf si tu travailles
peut-être dans un... c'est impossible à démontrer
et c'est impossible à démontrer
là on reste... c'est peut-être possible que
des nouveaux éléments arrivent par exemple
si jamais il y a un des beepers ou certains de ces beepers
dont la batterie n'a pas assez chauffé par exemple
et ben
il y a un scénario où on pourrait avoir
une rétro à générer
de la rétro à générer
une affirmation sur le scénario
comment est-ce que... oui c'est ça, comment le fièrement a été modifié
s'il a été modifié etc.
pour que les gens se...
réalisent un peu ce que ça veut dire c'est que
typiquement l'exemple avec le Mac, ce qui se passe
c'est... on peut imaginer ton système
d'exploitation qui est...
où tu peux avoir du code
qui tourne etc. dans cet environnement
complètement clos et tous les petits
composants de ton ordinateur
ils ont aussi entre guillemets leur mini OS à eux
ce qu'on appelle le micro de logiciel
qui va discuter avec des messages
avec cet OS et cet
environnement sécurisé et là
ce que ça veut dire c'est que les vulnérabilités
qu'il faut trouver dans ce genre de cas c'est
comment arriver à justement exploiter
un problème
dans le micro logiciel
et aller le modifier c'est absolument pas
très bien pas du tout à faire
et donc là c'est le genre de cas
où justement si c'est eux
qui sont les prestataires
directement et qui ce sont pas juste
les milieux de la chaîne de production
ça rend les choses plus faciles parce que
pour le coup
ils contrôlent aussi
exactement quelle batterie utiliser et donc quelle
micro logiciel et donc on en prend un vulnérable
exprès etc. et peut-être même si c'était nécessaire
ils ont pu changer
même la carte électronique
ou un des composants de la carte électronique
pour pouvoir mettre leur fil en moire beaucoup plus
facilement que l'ancien alors
ça paraît un peu moins probable parce que on faut du coup
refaire tout un système de beeper mais
en vrai ça serait possible pour une attaque
d'envergure comme ça ils auraient les moyens de le faire
moi je sais pas je trouve que c'est plus crédible le scénario
où ils mettent le truc en place de azade
c'est clairement plus
plutôt que le côté un peu manide
de middle où ils se mettent au milieu et
il est prestataires ni lesseboulane se rencontre de rien
ce scénario là il est quand même moins crédible
en fait le fait que toute une commande
soit piégée et bon
si ça avait été quelques unités
je pense que les conclusions serait
différentes alors cette histoire
est fascinante mais moi je trouve
qu'il y a pire dans cette histoire
c'est que ce scénario avait été
prédit il y a 10 ans en 2014
lors de la DEF CON 2022
je m'explique
ces deux chercheurs en sécurité
qui ont réussi à trafiquer une caméra
de surveillance wifi
ça s'appelle la drop cam
qui depuis a d'ailleurs été racheté par google
donc on va dire que c'est comme des
caméras nestes des caméras de surveillance
dans sa maison et on retrouve
énormément de similitudes dans leur présentation
et dans leur trouvail
déjà il n'y avait pas de chiffrement
dans cette caméra
et donc du coup ils ont pu faire
une rétro ingénierie du firmware
ils ont réussi à mettre leur propre firmware
par exemple
un truc qu'ils ont réussi à faire c'est qu'ils ont réussi
à remplacer le flux de la caméra pour mettre
une vidéo qui n'a rien à voir et donc changer
complètement l'intérêt de la caméra
parce que du coup ça ne surveille pas du tout chez toi
ça met une vidéo de chat par exemple
et ce qui est absolument impressionnant
dans cette démo et forcément
lors de l'attaque des bupers ça a fait écho
à cette présentation c'est qu'à la fin
de leur démo ils font une expérience un peu
de pensée pour montrer
ce qui pourrait arriver de pire
quand on accue un objet connecté
comme une caméra qui est un peu un gruyère
de sécurité à l'époque et ils envoient
à un complice une caméra piégée
justement avec de l'explosif
à intérieur et ils ont programmé
un firmware de sorte que quand la caméra
voit le visage d'Edward Snowden
elle l'explose
et donc vraiment
c'est la fin de... en gros c'est un peu leur bouquet final
pour
montrer leur exploit
voilà donc ça c'est la caméra qui pète
et donc c'était une image
d'Edward Snowden
ils n'ont pas fait un feat avec l'Edward Snowden
évidemment et ils finissent leur
présentation avec cette phrase
que je reformule un tout petit peu
si vous voyez des objets connectés explosés
rappelez-vous que vous l'aurez vu pour la première
fois ici à la DEF CON 2022
et d'ailleurs l'un des chercheurs
qui est arrêtement prémonitoire
non mais vraiment ça a fait exploser mon cerveau
quand je suis tombé sur cette info
et l'un des chercheurs a du coup réagi sur twitter
d'ailleurs à l'attaque des beepers et a donné
un peu son avis
c'était pour conclure
enfin je vais pas dire cette phrase c'est un trigger word
on peut retirer plusieurs leçons
de cette histoire et c'est ce que je trouve aussi
très intéressant outre le côté technique et comment ils ont réussi
à mettre en place cet attaque
absolument
sans commune mesure
il y a quelques leçons qui sont assez intéressantes
déjà c'est l'importance de la chaîne d'approvisionnement
et clairement pour une organisation
comme le ESBOLA a priori y a eu des trous
dans la raquette de ce pense-vu là parce que
commander autant de beepers sans s'assurer
qu'ils ne sont pas piégés a priori
il y a eu un problème de sécurité
tout simplement
autre chose c'est qu'à la base c'était une très bonne idée
de prendre une vieille techno avec une surface d'attaque
beaucoup plus faible sauf qu'on se rend compte
qu'évidemment aucune technologie n'est sûre
mais ce qui est assez mindfuck
je trouve c'est que aucune technologie n'est sûre
même quand elle est hors ligne
parce que ce sont pas vraiment des objets connectés
alors c'est des objets de communication
mais ils ne sont pas du tout connectés internet
alors on peut se dire c'est bien plus sûr
et en fait quand un service de renseignement
comme le moça d'en face
et bien évidemment ça pose des soucis
et c'est sans doute la principale erreur
d'ailleurs du ESBOLA
c'est que c'est l'acquisition
c'est que l'acquisition de ces beepers
a créé une sensation de sécurité
au sein du ESBOLA
et
en termes d'obsèque c'est la pire chose
c'est à dire que tu te sens plus en sécurité
tu baisses l'attaque
tu baisses la garde pardon
et derrière en fait t'as une attaque qui te surprend complètement
d'où d'ailleurs les déclarations des leaders
du ESBOLA suite à l'attaque
ou c'est la pire attaque qu'ils ont connu
le pire trou dans la raquette qu'ils ont eu
parce qu'en fait tu t'y attends tellement pas
que t'as personne pour checker
ce genre de matériel
et que ça crée une sidération
et pour le coup tu es réellement vulnérable
un petit point
sur le côté israélien
parce que ce qui est intéressant dans cet attaque
c'est que les retombées ne sont pas uniquement militaires
tant d'un point de vue
sur le nombre de morts ou le nombre de blessés
surtout le nombre de blessés et la saturation
des hôpitaux
mais il y a aussi tout ce qu'il y a autour de l'événement
des spécialistes un peu
de l'osin
et de l'obsèque aussi
si on prend en compte tous les rapports de blessure
le nombre d'admission
à l'hôpital
toute la couverture des médias
les messages chez les réseaux sociaux liés à cet attaque
en fait
tu peux
réaliser un profilage de tous les membres
du ESBOLA
de leur fréquentation, amis, familles, collègues
potentiellement cercles proches
des réseaux de soutien au ESBOLA
qui ne sont pas directement liés à ESBOLA
mais qui sont en soutien
potentiellement des lieux tenus secrets par l'ESBOLA
parce que forcément dès qu'il y a eu
une explosion, tu peux identifier
des lieux, des lieux d'intérêts, des caches
des lieux de souffrance
tu vois un des hôpitaux qui a beaucoup plus de fréquentation que les autres
et par exemple, bref, ça donne énormément
de données qualifiées pour un service de renseignement
comme de l'Hemosan en plus qui est complètement en capacité
de gérer
et de traiter ce type de données
donc c'est vraiment, en fait, cet attaque
est extraordinaire
dans le sens que ça sort complètement de l'ordinaire
de tous les points de vue, que ce soit dans sa réalisation
que ce soit dans les manquements
du côté du ESBOLA et que ce soit dans
ce que le service de renseignement
va en tirer potentiellement à l'avenir
c'est même pas la fin de l'histoire
entre les dégâts humains
etc.
c'est-à-dire que là, avec l'ensemble
même des fies de vidéos, etc.
où tu vois tous les gens justement qui se rentrent dans les hôpitaux
juste tu fais
des screenshots de tous les
l'ensemble de l'organigramme
un centre à l'aimant de l'ESBOLA
et ça, je ne sais pas
quelles autres moyens
enfin, je n'arrive pas à imaginer
une opération suffisamment
sophistiquée qui aurait permis la même chose
c'est assez fort.
Il y a juste le côté où elle est voyante
donc pour un service de renseignement, j'imagine que
c'est un trade-off
comment on dit trade-off ?
Un compromis à faire
dans ce type d'attaque
juste pour finir
parce qu'il y a une suite
le lendemain, c'est que le 18 septembre
une attaque tout à fait similaire
a de nouveau touché le ESBOLA
parce que les Tokiwoki du ESBOLA
ont explosé, donc le deuxième moyen de communication
du ESBOLA
et donc c'est exactement le même type
il y a eu 25 morts pour le coup
un peu plus de morts, 450 blessés
dont une explosion dans une foule
qui était rassemblée pour les finurail
d'un mort qui avait été touché, la veille
par les explosions des bupers
et quand on regarde, le procédé est complètement
similaire de l'explosif dans
des Tokiwoki et je ne vais pas rentrer
dans les détails mais pareil, le fournisseur
a été contacté, c'est pas eux qui
ont fabriqué les Tokiwoki
Un autre fournisseur ?
A priori, ça serait une contrefaçon
pareil avec un système de sociétés
écrans, je ne vais pas refaire toute la même enquête
et puis en plus elle a été un poil moins développé
celle-ci, mais il y a eu
exactement la même chose le lendemain
et depuis il y a clairement un conflit
qui s'est ouvert, là ça sort de notre cas
d'ailleurs le leader
d'USB, depuis, est décédé dans une frappe
aérienne, bref, il y a une guerre
ou un conflit, je ne sais pas comment il l'appelle
ça a été un élément de première étape
et depuis ça dépend quand vous regardez cette vidéo
mais il y a sans doute plein d'épisodes qui se sont passés
mais ça a vraiment été en plus
si on prend
la guerre comme
un fait marquant
un fait marquant du début du conflit
entre l'USB
moi ce qui est intéressant c'est que
l'enchaînement des deux
via des appareils très différents
donc un beeper
un toki-woki
ça fait que, même de toute façon
c'est beaucoup un impact psychologique
à mon avis qui est recherché aussi
à savoir une perte de confiance
dans à peu près tous les moyens
de communication, tu te dis
bon tous les beeper explosent
c'est extrêmement perturbant
et
tu peux t'imaginer que c'était
l'opération
qui ont grillé leurs plus grosses cartes
et là
enchaînement sur un autre outil de communication
je pense que en termes de sidération
ça doit créer
une emprise complètement dingue
sur la confiance
je sais que d'un point de vue historique
il y a eu une autre affaire comme ça
c'était pendant la guerre du Vietnam
où les services de sauvage
américains avaient fait livrer des militions piégés
c'était des militions chinoises
et du coup ils avaient piégés
certains avaient des explosifs qui faisaient que
quand tu tires globalement la cartouche
explosait elle même et c'était un peu la même genre de mécanique
pour avoir un impact psychologique ou quoi
et c'était des chaînes d'approvisionnement
mais pas du tout la même échelle et pas les mêmes techniques
pas le même contrôle non plus
alors il y a une information qui est sortie
mais évidemment
très très difficile à vérifier
dans un média
c'est que
potentiellement cette attaque des bipers
aurait été dans le cadre d'une attaque beaucoup plus
ample et beaucoup plus grosse
mais qu'elle aurait commencé à être détectée
par le S-Bola en interne
on n'a pas les détails
et du coup elle aurait été déclenchée un peu
assez rapidement
je sais pas du tout si c'est fière mais j'ai lu ça dans un article
donc potentiellement que
ça faisait partie de quelque chose
mais qui a été déclenché plus vite que prévu
et un autre texte pour les Toki-Waki
vu que c'est des plus gros appareils
a priori il y en avait moins parce que ça a touché moins de monde
mais par contre ça a fait plus de morts donc il y avait peut-être plus d'explosifs
et d'ailleurs quand on regarde
quelques vidéos on voit que les explosions
sont quand même plus grosses que les bipers
donc
donc voilà c'est pas proche de jouer ça
non mais vraiment merci parce que
effectivement j'avais bon comme tout le monde vu passer la news etc
mais
j'avais pas relevé
toutes les problématiques
notamment le fait que oui effectivement
entre le message et l'explosion
il manquait
d'inconnu quand même
donc très intéressant
et peut-être qu'on en soit à plus du coup plus tard
et peut-être, oui carrément
est-ce que la pause tu voudrais qu'on la fasse maintenant
ou après la deuxième partie
ah en vrai c'est une bonne idée de la faire maintenant
au pire on pourra la faire même en troisième partie
parce que vu qu'on a deux invités qui arrivent
qui sont pas tout à fait arrivé et tout
je pense on va faire une pause
et bah on fait la petite pause maintenant
et vous ne bougez pas on va changer le sujet pour des choses plus légères
puisqu'on va parler de modèle de langage
c'était vachement léger
nous avons notre invité
du jour Jean-Luc Kegnick qui est arrivé ça va
ça va bien ?
j'avoue je sais jamais comment dire ton nom
je le dis bien c'est bien
ça fait très plaisir d'être recevoir
on le disait tout à l'heure
on a eu pour parler de cartes graphiques
de l'évolution
de
du marché
on t'a eu pour parler de ton passé
et aujourd'hui on va parler
de plutôt ton activité actuelle
c'est peut-être plus facile
tu vas avoir moins de temps
c'était un peu tendu la dernière
on peut commencer avec une anecdote d'Ox tu veux
on se le déjà raconté mais parce que je me rends compte que c'est la première fois qu'on est en plateau ensemble je crois
la dernière fois j'étais par là
et on a tous les deux travaillés chez OVH
on s'est rencontrés là bas
rapidement mais on a fait notre intégration
la semaine d'intégration ensemble parce qu'on est arrivés
en même temps à OVH
on a fabriqué les serveurs ensemble
ça ça rapproche
pas de temps parce qu'après on ne s'est pas parlé
pendant plusieurs années mais on se retrouve
des années plus tard c'est un peu rigolo
il y a des trucs marrants l'intérêt de OVH
on fabrique un serveur tous les nouveaux à cette époque là fabriquer un serveur
c'est hyper marrant ça
tu montes avec tes pièces le serveur
en théorie c'est marrant
en vrai je crois que ça c'est cool
ouais après tu as des gens
tu as des gens marketing ça parce que c'est qu'une carte mère
oui en fait
donc tu as des gens qui sont déjà dans la tech
tu as des gens d'HRH
tu as des gens du marketing et du coup quand tu dois monter un serveur
tout le monde dépasse sur un pied d'égalité
et en même temps les gens du market
ils comprennent que
il y a une science il y a 7 ans
c'est hyper important parce que c'est une boîte qui fonctionne
beaucoup avec un différentiel qui est le watercooling
donc le refroidissement par haut
et c'est un gros différentiel pour l'impact carbone
et les coûts
et la techno quand on règle général
donc les gens qui font du marketing qui expliquent ça
finalement en fait ils se confrontent physiquement
à ce truc là donc c'est assez cool
au final d'avoir des gens qui utilisent vraiment
et qui mettent les mains dedans
c'est un bon concept
franchement ouais c'est quoi chez nous de faire ça
j'ai la même configuration
tu dois faire un vidéo
tu dois faire un short
et tu dois trouver une accroche
une trame
ouais ouais ouais ça serait marrant
tu dois faire un smoothie
oui alors là après pour le contact client
tu vois
moi et tu y es
toi y a un truc comme ça d'intégration chez Gladia
on lit tous un livre
on envoie tout le monde
on envoyait deux livres avant mais on en envoie plus
la équipe de la boîte en fait
est-ce que c'est un livre d'entrepreneurs
ouais ouais ouais c'est Netflix
c'est le livre du fondateur Netflix
c'est le n'exficit culture netflix
c'est de no rules rules
je vais me faire bâcher parce que je parle en français
mais la règle c'est qu'il n'y a pas de règle
et ce livre est vraiment très reprenant
dans la culture de la boîte
cool et attends t'as plus de francophone
ou
d'onglophone
on a beaucoup de francophone mais on a pas mal
aussi de gens qui viennent de Stockholm
de Suède
on a des
des gens qui parlent russe
on a des gens qui parlent arabe
on a des gens qui parlent plein de langues
d'ailleurs cette boîte dont on parle
donc une connaissance
qu'est-ce que tu fais c'est quoi Gladia
t'as nous en plus à nous apporter
je sais pas si c'est une exclusivité
mais tu feras de faire une belle levée quand même
de 14,7 millions
ouais en fait tu dis ça en dollars
ça fait 16 millions de dollars
16 millions de dollars
et ça c'est beau
bravo
c'est ce que j'ai dit à Mathieu quand il m'a
raconté c'est que tu nous aurais dit ça il y a
deux ans, il y a trois ans
je t'aurais dit oui alors c'est la vague
mais en ce moment faire de levée c'est pas
si simple
c'est pas simple en plus on a fait la levée un petit peu plus tôt
en fait dans l'année on a
commencé la levée fin
d'année dernière
je peux pas dire il y a un an mais il y a
6,9 mois
enfin il y a 9 mois ouais
et c'était encore pire que maintenant
c'était vraiment dans la vague où les vissims
n'étaient plus du tout d'argent etc donc ça a été
bravo, c'est un signal
que fait Gladia ?
on est spécialisés dans la reconnaissance vocale
mais on a quelque chose de particulier
c'est qu'on est spécialisés sur la partie multilingue
donc comme on est né en Europe
on a tous été frustrés
et notre French accent on se pique l'acczate
et en fait t'es jamais reconnu par les systèmes
de trad, de transcription
et donc nous on a créé notre société
spécialisé sur ce sujet là
on voulait avoir un produit qui était
insensible aux accents
ce qui est extrêmement difficile
on n'en paraît après sur un peu comment ça marche
mais ne pas être sensible aux accents c'est très dur
on voulait supporter beaucoup de langues
qu'aujourd'hui on supporte une centaine de langues
on voulait être capable d'avoir de la traduction
et on voulait être capable d'être à un prix
attractif et d'être rapide
et pour te donner une idée, à l'époque
une heure d'audio pour la transcrire
pour la passer en texte, de faire audio
tout texte puis tout texte comme on dit
ça mettait 45 minutes
chez Google
ça mettait 20 minutes chez Amazon
ça te donne un peu près une idée
à WS, c'était dans les ordres de 20 à 40 minutes
nous, quand on a sorti notre produit
on le faisait en 10 secondes
donc tout le monde a... 45 minutes
45 minutes ça mettait ouais
d'audio à transcrire... non 1 heure ça mettait 45 minutes
1 heure, ok
donc ce qu'on va dire c'est quelque chose qui s'appelle le realtime factor
donc le taux temps réel, on en parlera tout à l'heure
pour les assistants vocaux
mais c'est ta capacité à rattraper le temps réel
c'est vraiment ça qui t'intéresse
donc tu veux avoir un temps minimum de 1
c'est à dire d'aller aussi vite que le temps réel
mais dans l'idéal tu voudrais réduire
peut-être être à 10% du temps réel
c'est à dire que je peux procécer 10 fois plus vite
je peux faire du calcul 10 fois plus vite que la vitesse
voilà, donc nous on l'a fait en 10 secondes
ce qui était...
insane à l'époque
très intéressant, mais on rentre pas trop dans le sujet
justement
parce qu'une raison pour laquelle on voulait t'inviter
c'est que récemment on a eu
des nouvelles annonces de OpenAI
notamment à propos de GPT4O
les annonces en fait elles datent plutôt
d'avant le... c'est les sorties
les annonces datées de l'année dernière
on les avait couvertes
mais là ce sont plutôt des sorties, on voit un peu dans la vraie vie
dans la réalité, quelles sont les features
qui sont annoncées et qu'elles arrivent vraiment
et surtout comment elles fonctionnent
et surtout il y a un effet statistique assez rigolo
parce que beaucoup de gens
peuvent jouer avec et donc on peut découvrir des trucs
je fais mon intro et on se lance dans le vif
du sujet
vous avez peut-être vu ces démonstrations
bluffantes de l'assistant vocal
de GPT4O
qui vous répondent avec un accent marseillais
ou bien un guitariste qui fait un duo
avec GPT4O
on va vous le démontrer juste après
on a le sentiment d'avoir enfin
des assistants vocaux qui servent à quelque chose
mais comment est-ce que ça fonctionne
est-ce que c'est juste du texte
qui est transformé en voix
comment on passe d'un modèle de langage de transformers
à du son
c'est pas du tout intuitif en vrai quand on y pense
en réalité c'est un véritable défi de parvenir
à faire ça et notre invité est un spécialiste
de la gestion de la voix par IA
il va nous expliquer comment ça marche
et surtout quelles sont les deux grands paradigmes
qui s'affrontent pour l'assistant vocal
et pourquoi il y a un énorme enjeu
sur la latence
est-ce que pour commencer Jean-Louis
bienvenue déjà
est-ce que tu peux résumer
les dernières sorties d'OpenAI
qu'est-ce qui est sorti
si jamais tu...
tu as suivi c'était un peu t'inconquiant
et qu'est-ce qui a été annoncé
et est-ce que ça marche etc
il y a deux grosses annonces qui sont faites
dans les deux derniers mois
il y en a une qui a été faite
plutôt sur le texte
donc sur les LLM on va dire pure
je vais mettre des guillemets
parce qu'on va démystifier un peu ça
et il y a effectivement la partie vocale
qui a été dernièrement annoncée
donc ça c'est les deux choses principales
qui sont sorties chez OpenAI
sur la première partie des LLM pure
il y a un modèle qui est sorti
je met un modèle, je mette entre guillemets
je déteste les gens qui font ça
il y a un modèle entre guillemets
qui s'appelle O1
et qui en fait n'est pas vraiment un modèle
en fait c'est un artefact d'ingénierie
donc ce n'est pas un modèle pure qui est plus performant
oui les résultats sont incroyables
mais au lieu de cracher
une sortie en quelques secondes
comme on avait l'habitude sur GPT3
GPT3, 3, 5, 4
là il y a quelque chose de particulier
c'est qu'il met 30 secondes
et quand il met 30 secondes
qu'est-ce qu'il fait ?
il fait ce qu'on appelle le chain of thoughts
la réflexion il va dire
tiens je vais faire un plan d'exécution
tu m'as posé la question pour la résoule
je vais faire étape 1, étape 2, étape 3
comment je résoudrais l'étape 1
puis il arrive à l'étape 2, c'était quoi les étapes ?
après la 1 c'est la 2
la 2 faut faire ça
considérons le résultat de l'étape 1
je vais calculer l'étape 2
puis il arrive à l'étape 3 et fait la même chose
ça met 30 secondes
donc c'est pas vraiment un modèle
c'est un artefact d'ingénierie
et c'est un truc que des utilisateurs
pouvaient faire normalement en formulant
d'une certaine manière leur prompt
mais qu'il aille faire automatiquement
sans qu'on aille le demander en fait
pas vraiment
c'est plus que ça, c'est plus un système de réflexion
en fait t'aurais pu le faire
d'une certaine manière, ou il t'aurais pu le faire en combinant
plusieurs prombes en recopiant, collant etc
c'est des choses que t'aurais pu faire mais c'était pas automatique
effectivement comme tu dis mais oui en copiant, collant
plusieurs prombes à la suite t'aurais pu faire cette chaîne
de réflexion
mais c'est une méthode qui démontre
un sujet
qui je pense est en train d'arriver
c'est qu'au Ponnaia il y a plus les gémonies
le modèle qui était le mieux à l'époque c'était
4
il y a pas de nouveaux modèles qui sortis
vraiment depuis, il y a eu du plus petit modèle
on peut dire je ne sais plus comment s'appelle
4, 1, enfin voilà il y en a plusieurs
mais ce sont plutôt des versions optimisées
mais le meilleur modèle actuellement sur le marché
c'est le modèle
Claw de 3.5
et ce modèle-là
nativement sans les chaines of thoughts
il défonce au Ponnaia
donc la question c'est
j'ai un peu l'impression qu'ils sont en train de stagner
sur la partie LLM
donc ils font des artefacts d'ingénierie
mais aujourd'hui ils sont quand même pas aussi bons
que ce qu'on a vu chez Claude
donc ça c'est la première annonce
et ce la deuxième annonce de la voix qui est hyper intéressante
ils ont effectivement fait un modèle
qui est capable de faire ce qu'on appelle du
end to end speech donc pour les gens qui préfèrent
le français
le end to end speech c'est la voix
de bout en bout voilà
sinon je vais faire
je vais faire bâcher
et concrètement c'est qu'au lieu de
passer par un chatbot etc
tu as ton jarvis en fait
tu as ton assistant vocal qui te ressort de la voix
oui tout à fait
ça c'est du point de vue de utilisateur c'est ce qu'ils constatent
maintenant derrière Cotéopon AI
qu'est ce qui est nouveau, qu'est ce qui est intéressant
sur l'ingénierie
ce qui est hyper intéressant et qu'on avait pas vu
jusqu'à maintenant c'est qu'il y a
des systèmes qui font la reconnaissance vocale
comme Gladiah, le meilleur du monde évidemment
le plus précis
et tu avais des systèmes qui faisaient
de la génération vocale donc de la synthèse vocale
donc du texte to speech
donc on dit speech to texte, texte to speech
normal et au milieu on metait de la logique
et là ce qui est hyper intéressant
avec ce qu'a fait Open AI
c'est que tu mets de l'audio en rentrant
il a son propre
système de réflexion là haut
qui est en fait le même que les LLM ce qu'on appelle
un espace latent en anglais
en gros c'est un espace vectoriel on va faire simple
c'est des gros chiffres
qui vont entraîner ces propres réflexions
mais au lieu de recracher des mots
comme ils faisaient dans un LLM
là il va directement générer
des petits bouts de synthèse vocale
qui combinés ensemble font des phrases
et donc ce qui est hyper intéressant
c'est cette première chose là
la capacité d'avoir la réflexion directement dans un seul modèle
donc ça c'est certain
à 99,9% qu'ils le font
parce que vu les vitesses
et l'attence de bout en bout
c'est quasi impossible d'avoir des systèmes combinés
il faut vraiment que tu es...
on en reparlera après mais il faut vraiment que t'aies un système
qui soit complet en 1 avec un seul modèle pour aller aussi vite
si j'ai bien compris ça veut dire que
là où traditionnellement
on prenait le audio on le transformait
en texte on le passait dans le modèle
de langage il ressortait en texte
et on générait de la voix dessus
là ça fait plutôt voix
espace latent, voix
exactement, c'est tout ça c'est la première chose
qui est hyper impressionnante
et la deuxième c'est que le système a appris
de même que dans le LLM
a appris à avoir des émotions
en tout cas à faker des émotions, à faire
semblant d'avoir des émotions
je dois réfléchir à chaque mot frangré
c'est vraiment... j'ai eu les commentaires la dernière fois
je dis faut que je fasse un effort sur le sujet
mais voilà
t'as l'impression que grâce à ça
il a appris beaucoup de choses donc il a une connaissance
dans son espace à lui
mais à travers...
tu vas lui dire chante
on est dans l'artiste
il va chanter on est dans l'artiste
il va dire là tu es déprimé
t'as perdu ta grand-mère
donc là il a fait un duo avec son nia
c'est ça le latence
c'est ça qui ouvre
ça veut dire qu'il a appris
ça tout seul
en fait il faut bien s'imaginer
que ce système là comme le système
de LLM
je vais me faire bâcher
si je dis complètement que c'est un système
qui est stupide et qui regarde le prochain
ce qu'on appelle le système

il fait le prochain token
le prochain élément à prédire
en fait il a déjà entendu les chansons dans son modèle d'entraînement
parce qu'ils ont pompé Youtube et Compagnie
et qu'en fait là il se dit
ah bah tiens j'ai entendu ces notes là
et ces phrases dans la chanson
du coup la suite c'est ça
donc il a été capable d'apprendre et comprendre tout ça
ça c'est assez bluffant en vrai
et même les accents
du coup les accents marseillais
des émotions effectivement
la tristesse
le...
c'est génial
c'est d'autres phrases qui appellent ça
c'est dingue
si tu veux des tutos de code
de développement
avec un accent marseillais
tu peux l'avoir maintenant quoi
je trouve ça incroyable
mais ça veut dire que pour entraîner
ce modèle de voix
ils ont utilisé plein plein plein
plein de vocaux
avec plein d'accent du coup
là ça veut dire que dans leur modèle d'entraînement
il y a des gens qui ont parlé marseillais
alors bah ils ont récupéré des gens qui parlaient marseillais
à quelque part
les données d'entraînement
sont
probablement les mêmes qu'ont été utilisées pour GPT
parce qu'en fait à l'époque
ils avaient déjà aspiré tout Youtube
parce que le niveau de connaissance que tu as dans la voix
et le niveau de spécialisation que tu as dans la voix
il est plus important que ce que tu as sur le texte
et tu as une concentration qui est plus importante
donc pour te dire
je suis un fan de Tolkien
donc je vais dire ça
Bilbo le Hobbit qui a un bouquin
qui est gros comme ça
c'est à peu près en équivalent 5 heures d'audio
donc en 5 heures d'audio
vous avez déjà généré depuis le début de la conversation
probablement un demi Bilbo le Hobbit
on doit être pas loin de ça
donc tu débites en paroles assez folles
et tu as regardé le nombre d'heures qui sont emplodées sur Youtube
chaque jour c'est dingue
et le truc qui a qui est fou
c'est que si tu vas sur Youtube
c'est des gens qui sont spécialisés
tu vas faire une doublée
tu vas spécialiser dans les moteurs de machin
tu vas te parler de collecteur
de trucs comme ça
tu vas aller sur un autre, tu vas aller sur Mikot
tu vas parler de code
tu vas avoir des gens qui sont hyper spécialistes
et donc tu as juste à faire du speech to texte
c'est comme ça que Whisper est né
ils ont fait Whisper, ils ont dit le plus grand niveau de connaissance
et la meilleure qualité, la plus grande expertise
c'est pas les blogs
c'est toutes les vidéos de tuto sur Youtube
donc on va pomper Youtube, on va faire un système de transcription
de Youtube vers du texte
et ensuite on va faire manger tout le texte à un modèle
et ce modèle aura suffisamment de données
pour être super puissant
hyper intéressant, je ne l'avais jamais réalisé
c'est comme ça que ça s'est passé
donc Whisper était un accident de parcours
à l'époque
le texte moyen d'Internet
est moins qualitatif que
le registrement audio moyen d'Internet
regarde là
si on écrivait un blog poste à la place de ça
est-ce que tu penses que ce serait aussi riche avec autant d'anecdotes
et autant de subtilités
et même ce que tu expliquais
c'est que même dans l'information de la voix
il y a aussi d'autres choses
que je demande de l'information pure
il y a l'émotion
tu vas voir l'accent
tu vas voir le genre
il y a beaucoup de choses que tu peux récupérer
là-dedans
la voix est franchement le vecteur
aujourd'hui
avec la vidéo, avec le plus gros niveau de concentration
d'information
je me suis fait un peu une idée
de comment fonctionner l'entraînement
d'un modèle de langage texte
d'abord on l'entraîne sur la prédiction
de tokens, sur des énormes volumes
ça fait des modèles fondationnels
et après on les spécialise
en instructions
en mode assistant
où là on lui donne énormément de conversations
et comment ça comprend
ça marche comment avec la voix
tu peux lui faire prédire
les prochains tokens de voix
mais tu dois aussi avoir des conversations
après pour le spécialiser
pour revenir vite fait
sur ton truc du LLM
qu'est ce que tu es en train de faire
tu es en train de me poser des questions
je vais dire un expert je mets ça en truc y met
en tant qu'utilisateur lambda
tu es en train de poser un système plus intelligent
toi sur ce domaine là pour avoir une réponse
ça c'est les podcasts, c'est les vidéos youtube
c'est les formats d'interviews qu'on a
c'est déjà dans le modèle en gros
le LLM en tant que tel
et dans la manière dont tu structure ça
de base youtube c'est un contenu
absolument monstrueux
si tu prends juste les podcasts
tu vas probablement avoir l'assistant le plus intelligent
avec le plus grand niveau de concentration
et donc après la question c'est
est ce que tu les spécialises ça dépend de ce que tu cherches à faire
par exemple l'assistant d'opinéaï
comment est ce qu'il sait quand s'arrêter de générer
l'audio
pourquoi il génère pas la réponse tu vois
en gros il répond
pourquoi il génère pas la question d'après
comment il sait où s'arrêter
parce que quand tu as un
système d'audio de reconnaissance vocale
donc tu as un certain nombre de prédictions qui viennent
donc on va prendre un petit bout d'audio
donc c'est des petits morceaux
des petites pièces
d'audio qui font en général
pour le cas de whisper c'est 20ms
et chaque petit bout de 20ms
va être transformé
en image
donc tu as une série temporelle
une série temporelle c'est un signal
qui oscillent
ça c'est un petit bout de 20ms d'audio
le truc c'est que c'est très difficile de passer
de la série temporelle de quelque chose qui se passe
d'un temps à quelque chose qu'on va transformer
en vecteur parce qu'un vecteur c'est quelque chose de
relativement statique
donc ce qu'on va faire c'est qu'on va prendre une image
et cette image là on traitement du signal
ça s'appelle une décomposition de fourrier
et donc vous l'avez déjà fait à l'école
c'est quand tu passes un signal tu te changez le oscilloscope et là tu voyais des bars
vous souvenez de ça quand on était au lycée
c'est des jolis images rouge, orange, bleu
ouais voilà c'est ça ce sont des spectres
exactement comme ça tu vas avoir une forme de spectre
donc ça c'est des compositions de fourrier on va voir la distribution
des fréquences
ça c'est une image instantanée
sur une petite portion de 20ms
ensuite on va appliquer ce qu'on appelle
un logarithm dessus
pour faire correspondre le comportement à l'oreille humaine
parce que c'est comme ça que fonctionne l'oreille humaine
elle a une espèce de défaite
logarithmique pour capter certaines fréquences
et en isoler d'autres
et puis ça ça va
se transformer en vecteur
en des petits nombres
et puis là on retrouve la même architecture qu'on voit avec un lm
ou quand tu tapes ça se transforme en token
et donc on a des tokens audio
bah là tu avais des tokens de texte, tu avais des tokens audio
c'est incroyable, j'avais juste jamais pris le temps
de regarder en fait
parce que le son c'était pas le truc le plus
sexy, c'est un truc de vieux
c'est un investisseur m'a dit un jour
on m'a dit c'est un truc de vieux
j'ai un moment fou
bah nan mais tu sais quand t'as midjourné
d'un côté, t'as brille partout, c'est glossy
en fait ce qui est fascinant
c'est de voir que c'est absolument la même technologie
qui est utilisée en diffusion d'image
et en génération du son
là ça va être des systèmes qu'on appelle auto-régressés
donc c'est des systèmes qui tournent sur eux-mêmes
parce qu'il va prendre la sortie comme un lm
donc il va générer, donc tu me dis
poser la question de comment est-ce qu'il va générer
tes tokens et quand est-ce qu'ils s'arrêtent
tu commences par comprendre comment fonctionne le speech
tout texte, donc je t'ai donné les petits morceaux de 20 millisecondes
mais toi tu as des fins de phrase
ce qu'on appelle des utérances, ça c'est le mot technique
je viens de faire une utérance
et là je viens d'en faire une autre
d'accord, une utérance c'est une pause
et le système il va apprendre
quand tu vas l'entraîner
qu'il y a un point
à la fin d'une phrase
qu'il va y avoir une pause
et il va apprendre que la durée
entre le point que tu vas représenter de façon textuelle
et l'audio, il y a une coupure
de son entre guillemets
il va savoir qu'au bout d'un certain temps après cette coupure de son
ça représente une nouvelle phrase
et il va se couper tout seul
il va mettre un token
qui va s'appeler end of sentence
ou end of sequence
enfin voilà, tu vas avoir des tokens qui sont spécialisés
qui vont dire maintenant
tu t'arrêtes et il a appris à s'arrêter
en regardant ce qui se passait dans la transcription audio
il a dit, là c'est le moment
où les gens se thèsent
donc quand tu génères ça et que t'arrives là
au bout d'un certain temps il voit plusieurs tokens blancs
des plusieurs 20 millisecondes de blancs
il a appris tout seul
à dire je me tais maintenant et je n'aimais très plus aucun token
et c'est aussi entre guillemets bêtes
que de
de la non voix
il sait pas que l'intonation
elle baisse en fin de phrase par exemple
ou que quand on dit typiquement
une formulation de ce genre
la probabilité qu'il y a un point ou qu'il y a une fin de phrase
elle est plus élevée
il va comprendre ça parce que c'est un système
sur lequel tu as donné un état de sortie
en disant ça c'est la phrase
le sous-titre
si tu veux parce qu'ils ont bouffé du sous-titre aussi
whisper tu peux regarder
il y a du sous-titre à plein balle
c'est subtitle made by Amaru
sous-titre par Radio Canada
tu as un silence parfois
whisper qui génère des trucs
merci à vous tous
mais pourquoi on en avait je crois un petit peu parlé
déjà mais c'est parce que quand tu finis ton film
il y a la musique de fin Star Wars
et puis là t'as marqué
ces sous-titres ont été fait par la...
c'est le crédit et du coup il a appris que du bruit
du son des trucs n'était pas de la voix
il va regarder la chose la plus proche et il va te dire que c'est
c'était sous-titre
donc il a optimisé pour essayer de
de correspondre à la réalité
de correspondre à ce qu'on lui a donné en entrée donc quand il va avoir un blanc
il va chercher ce qui correspond de plus
donc t'as... il y a la non voie
mais ce qui peut arriver par exemple si tu laisses
un gros blanc donc ça dépend
comment le système est fait mais bon on va dire ça
simplement
si tu laisses un gros blanc
tu vas avoir token
token token de blanc de blanc de blanc de blanc
il va y mettre un token de fin de séquence
donc il va dire pour moi c'est terminé
ok et si tu te recommences à parler
il s'est terminé pour lui
ça il faut que tu vois à ce qu'il y a un moment
le jeu s'arrête pour lui
si tu as mis un token c'est l'équivalent d'un point final
tu peux dire ce que tu veux après
dis qu'il a mis son point final
le système de LLM ou le système audio
il a terminé sa séquence
tu peux pas revenir et la redémarrer
il faudrait que tu réinities
le système et c'est comme ça
que dans les voies il arrive à s'arrêter au bon moment
parce que quand il génère il a appris qu'à un moment donné
c'est terminé c'est point final
ok mais dans le cas d'open AI
où c'est rendu des conversations qui peuvent être longues
c'est à dire que lui c'est pas une phrase
qui peut faire tout un paragraph
est-ce que normalement
il est pas censé prédire le fait que
cette personne
de son point de vue vient de s'arrêter
pourquoi il génère pas la question qui suit
tu vois ce que je veux dire
ce qui se passe quand tu utilises
un modèle fondational
et que tu lui demandes de générer
sans token de fin
lui il continue
tu vois il génère toute la discussion
j'en sais rien
j'ai aucune idée
il doit avoir spécialisé
d'une certaine manière quand même leur modèle
pour faire qu'il fasse la conversation
peut-être que
ils ont isolé le data set
sur des vidéos
qui étaient moins monologues
donc l'équivalent de ce que je fais pas là
mais peut-être plus sur des podcasts
si tu lui fais bouffer du podcast
et peut-être plus des vidéos avec
il doit y mettre un speaker turn un moment ou un truc comme ça
un speaker turn
ouais je...
non non non c'est une bonne... ouais j'ai pas pensé à ça
oui oui tu as tout à fait raison
il doit y mettre un speaker turn
il a dû avoir compris que je me fais trancher parmi code
mais ouais
c'est possible qu'il ait détecté que c'était 2 vecteurs différents de voix
donc 2 emprunts de vocales différentes
et qu'il ait fait le changement ça c'est tout à fait possible
j'ai une question pour toi c'est un truc que j'ai déjà vu
à des endroits qui est super drôle et flippant
c'est quand t'as des...
il y avait les premiers outils de génération de voix
parfois ils dérivaient
je sais pas comment dire mais...
ouais il a des hallucinations ouais
et les hallucinations de voix c'est... t'as déjà entendu ça Mathieu ?
non c'est le truc le plus perturbant au monde
ouais ouais tu fais un test, tu rajoutes point de plan d'exclamation
à la fin d'une phrase
ça va ressembler à un film porno
quoi c'est...
je peux le dire non ?
ouais c'est clairement ça mais ça fait une minute
c'est très très chelou
bah ouais parce qu'il a appris que...
oublie pas les séquences de 20... 20 millisecondes
que tu prenais, les petits bouts de 20 millisecondes
et le petit bout de 20 millisecondes c'est la...
l'exclamation donc c'est ta fin de phrase
et donc lui il a appris que ce petit bout là
c'est ouais ça va bien
le yin c'est la première exclamation
donc quand tu mets un petit point de exclamation il apprend que c'est yin yin yin
et il les cumule
et du coup il part comme ça, il commence à mettre
et comme sur llm c'est la même chose
si tu commences à mettre 1,999999999
tu le demandes de continuer
il va te rajouter des neufs jusqu'à l'infini
quand il commence à rentrer en loup
donc c'est un système autorégressif
autorégressif ça veut dire qu'il se...
il revient sur lui-même, un peu comme un miroir
et au bout d'un moment quand il a parété de voir
une séquence qui se répétait
il lui dit, considérant la séquence précédente
quelle est la séquence la plus probable suivante
j'ai vu plein de neufs, je vais rajouter un neuf
considérant la séquence précédente
et la séquence suivante, j'ai vu encore plus de neufs
donc je vais rajouter un neuf et au bout d'un moment
il fait ça, c'est pareil avec les points d'exclamation
il a vu plein de points d'exclamation, on bout d'un moment il dit
considérant que j'ai eu plein de points d'exclamation, qu'est-ce que je rajoute
un point d'exclamation et là le truc est par en sucette
puisque l'audio c'est un montage de voix
sur les points d'interrogation, il dit j'ai monté les voix
donc je vais monter encore plus, c'est la surenchère
moi j'ai une question sur les 20 000 secondes
parce que tu as dit on prend 20 000 secondes
et on en fait une image, donc on fait
quelque chose qui est dynamique avec qui t'as dit
on en fait un truc statique
20 000 secondes c'est suffisant
c'est suffisamment court
pour que ça ne se voit pas quand on y a à part
que c'est découpé en 20 000 secondes
ça c'est quand tu fais de l'écoute vocal
tu fais de la génération vocal
donc je n'ai pas le modèle d'openhia
je sais pas exactement comment ils le font
et je suis pas l'ultraspecialiste dans la génération vocal
mais tu vas avoir ce qu'on appelle
des phonèmes, donc 20 000 secondes
ça peut presque correspond à des phonèmes
les phonèmes c'est des morceaux essentiels de ta voix
les sons, les hum, les choses comme ça
donc c'est ça qui va venir, enfin même c'est un peu plus
dans les cailles de français
là tu avais les écritures phonétiques
même les phonèmes c'est encore
plus court, mais tu pourrais très bien
faire 10 000 secondes, tu pourrais très bien
faire 5 000 secondes, mais oui les trucs
sur call, d'ailleurs tu as vu la vidéo
avec la personne qui joue la guitare
c'est fluide, mais c'est quand même
un petit peu robotique, dès que tu vas dans un truc
un peu chiadé,
ça commence à devenir robotique, on sent le découpage
et le recolage d'une certaine manière de ces tokens
quand même.
Il y a un truc qui
moi
m'intéresse, c'est que
intuitivement, justement on a vu ces nouvelles annonces
d'openhia etc. et intuitivement
ça paraît être un progrès de fou
ce qu'on expliquait, c'est alors le fait
qu'on a supprimé le passage au texte
avant, à la fin
notamment pour un critère qui
je pense c'est pas forcément intuitive pour tout le monde
mais c'est l'importance de la latence
on peut s'arrêter un peu et expliquer pourquoi
c'est autant de gens réfléchissent
à ce problème-là et comment on
réduit la latence entre
l'expression de l'utilisateur et la réponse
qui l'obtient. Oui t'as tout à fait raison
c'est d'ailleurs notre nouveau produit qui tourne en
moins de 310 secondes
un humain
ça les études qui ont été faites pour
constater qu'un humain
en dessous de 500 ms et ne fait pas la différence
entre l'instantané
et on va dire le délai
au dessus de 500 ms tu commences à avoir
une perception. Voilà je mets
les gamers de côté
parce que je sais que c'est important de les
les gens qui ont été sur-entraînés
ou les pilotes de F1 évidemment
ils en ont des fonctions différentes
mais un humain basique
genre vous moi
ça les 500 ms
voilà faut que tu dises que c'est
un humain basique
tu as d'abord
la capacité à faire la reconnaissance vocale
qui doit être en moins de 500 ms
ensuite tu dois prendre un certain nombre d'actions
habituellement c'est comme ça qu'on fait
dans l'entreprise aller chercher dans une base de données
retrouver la fiche client ou la chose comme ça
puis après tu as le fait de parler
et tu vas voir ce qu'on va regarder
c'est pas la fin, à partir du moment où t'as fini de parler
la latence qu'on va avoir on va plutôt regarder
le temps à émettre le premier son
ce qu'on appelle le time to first bite
donc le temps à recevoir le premier
beat d'audio dans le flux
donc ça tu peux descendre
à 100 ms
autour de ça
il y en a même qui descend à 80 ms
donc tu fais 300 ms
qui est un peu le 200 ms
qui est un peu l'état de l'art
tu vas avoir 100 ms
qui est un peu l'état de l'art
tu fais 200, 300 plus 100
ça te fait 400
tu es proche de la limite
et avant on met un certain nombre de systèmes
donc si je te prends un LLM
les LLM le plus rapide vont te faire
du 300, 400, 500 ms
donc tu vois
tu fais 200, 300, plus 300 ça fait 600
plus 100 ça fait 700
t'as détecté un délai
pour détailler les 3 trucs que t'as dit c'est
le passage du texte à la
speech to text, text to text
donc LLM par exemple
plus text to speech
donc oui tu peux streamer des tokens du LLM
dans l'audio, oui il y a plein de choses qu'on peut optimiser
mais globalement tu te dis que t'es à
600, 700, 800, 800
il y a 3 temps à additionner pour avoir le
tu poses une question, t'as une réponse
et c'est même pire que ça
c'est même pire que ça
donc là ça on va en parler
c'est même pire que ça
parce que tu vas avoir un problème de réseau
entre
ton navigateur
et le data center
tu vas avoir sur la même plaque
géographique 50
50 millisecondes
tu vois donc
ça va très vite et pourquoi c'est si important
parce que moi je propose
de vous montrer une petite vidéo
qui est une expérimentation qu'on avait fait
je sais pas si on... ouais si si carrément
une expérimentation qu'on avait fait au tout
début de whisper
je crois que c'était pas si longtemps peut-être elle a sorti du v2
enfin c'était il y a au moins
un an et demi je pense, moins au moins
et c'était à une époque où justement on avait tous
envie de tester
comment ça va
je suis une intelligence artificielle
donc je ne me sens pas les émotions
ça typiquement c'était
il a mis un 25 c'est un trichard
oh Michel comment ça va
un pas avant
moyen mais vous allez voir que le résultat
est quand même plutôt pas mal
je vous propose sans plus attendre
qu'on regarde ça ensemble
ok Michel comment ça va
je suis une intelligence artificielle
c'est long hein
c'est long
donc là on s'est bien mangé 4 secondes je pense
et on était contents
et déjà on était contents
et là c'est exactement ce que tu décrivais qu'il se passe
et encore ça tournait en local
c'est que tu avais la transcription en texte
on avait un modèle de langage qui est remetté un truc
et déjà
moi je me souviens qu'on passait pas mal de temps
à essayer de quantiser les modèles
pour qu'ils aient des influences les plus rapides possible
et aussi bref
c'était déjà un peu de travail d'arriver à ça
alors arriver déjà
aux ordres de grandeur que tu donnes 500ms
c'est encore une autre paire de manches
et je pense que là tout le monde a capté
que en fait
quand t'es à la voix de 200ms
c'est énorme, ça se joue vraiment à du détail
et on pense à tous les usages genre
les assistants au téléphone
à contrôler son ordi
à la voix
il y a plein d'usages comme ça qui ont un potentiel de fou
et où c'est juste une histoire
de 200ms
oui et non
tu vois c'est assez drôle parce que
c'est quoi le sujet
c'est le sujet de la rapidité ou c'est le sujet de la perception
et ça c'est une bonne question
et je me l'autopose
donc c'est bien
si je te mets
maintenant
plus de 500ms de pause
comme j'aime le faire, est-ce que c'est choquant ? pas tellement
parce que t'as la vidéo en face de toi
donc c'est pas grave parce que tu sais qu'il y a une action du système
t'as une
une boucle de rétroaction
t'as vu ? j'ai fait attention
t'as une boucle de rétroaction qui vient vers toi
d'accord ? qui est la boucle de rétroation virtuelle
maintenant si tu fermes les yeux
et que je m'arrête
de parler tu vas dire what the fuck
donc en fait c'est ça le truc
t'as besoin de savoir que le système il est en train de fonctionner
tu dis est-ce que Jean-Louis s'est barré là
il a fini sa phrase c'est cassé c'est terminé
donc
j'ai vu aussi des gens qui trichaient
bien oui bien sûr que tu triches
il y a mille façons de tricher si tu regardes les systèmes téléphoniques
donc là tu vois on parle d'open AI
magnifique, tu montes ce qu'on appelle
ce que tu avais le schéma tout à l'heure t'as l'encoder
donc on encode l'audio, on va dans l'espace
là-temps, puis t'as le décoder
voilà le décoder qui est en haut à droite
qui va te générer
les bouts d'audio
donc on a monté une montagne
on l'a descendu, on a directement généré
des tokens d'audio, super c'est une montagne
quand on fait le système classique
on va faire speech
tout texte, on descend la montagne
on va prendre le résultat du
qui est du texte, on va monter dans un LLM
on va faire texte, tout texte
on va redescendre la montagne
et puis après on va reprendre texte, tout speech
donc texte, tout speech, on monte et on descend
3 montagnes, encodeur, décodeur, encodeur
décodeur, encodeur, encodeur, encodeur
ce qu'ils ont fait c'est qu'ils ont mergé tout ça
donc effectivement ils ont pu remonter et descendre une montagne
ils ont gagné 2 montées
ils ont gagné 2 descentes
ça c'est absolument incroyable
maintenant quand tu fais un système
de par exemple, on va dire la poste
ou la Fnac, ou Orange, puisqu'on appelle tout ce
Orange ou d'autres topérataires téléphoniques
qu'est-ce qui se passe ?
bah en fait faut que je vérifie qui t'es
faut que je vérifie ton numéro de téléphone, je veux vérifier ta fiche client etc
est-ce que tu peux faire ça directement
au haut de la montagne, qui est inclus dans le modèle
tu peux pas faire ça
donc t'es obligé de faire par le texte
faire speech, tout texte
d'appeler des systèmes tiers, des bases de données
des choses comme ça, faire tes raisonnements
puis après faire du texte ou speech
donc en termes d'entreprise
en termes de grand public, ce qu'a fait Open Air
c'est incroyable, en termes d'entreprise
c'est pas applicable, d'accord ?
maintenant comment tu fais pour avoir
un assistent en vocale au téléphone ?
parce que t'as mis de ta main comme ça te t'as l'air, ça veut dire que t'appelais
Orange, Free ou autre
coucou xavier
tu fais ça, bon très bien
comment tu as une boucle de rétroaction sachant que
t'as pas le visuel et tu sais pas si le système
il est en train de réfléchir ?
comment font les gens ? c'est très simple
il met un bruit de call center derrière avec des téléphones
des gens qui bougent, des choses comme ça
tu peux regarder, il y a de la smr sur les call centers
je vous jure, vous allez sur Youtube, tu fais
ASMR call center, t'entends des bruits, des machins
des téléphones qui sonnent
donc tu mets un petit ASMR de call center
tu mets des bruits de touches de clavier
des keystroke en anglais
tu mets des bruits de touches de clavier et tu mets
un autre chose par dessus, tu mets une troisième bandes son
qui sont des filler words, ça s'appelle
des mots de remplissage
très bien
je regarde, j'ai bien compris
d'accord, et si tu écoutes OpenEIA, ils le font aussi
et les vrais gens le font aussi
les vrais gens le font parce que
t'as besoin d'avoir une boucle de rétroaction
tu dis c'est qui la personne ? vous êtes là ?
vous avez accroché ? ça fonctionne le système
ou pas ? donc en fait
la question c'est est-ce que t'as besoin
que tout tourne de bout en bout à 500ms
comme le fait OpenEIA, est-ce qu'est hyper impressionnant ?
ou t'as besoin d'un système qui réfléchit
entre les deux pour aller chercher des CRM
se synchroniser, t'as fait un changement d'adresse
il faut se synchroniser avec la poste, avec QPS etc
et puis tu acceptes
qu'il y a un petit peu de délai en entendant
la personne qui est en train de taper etc
je vais te même te dire un autre truc
une autre réflexion qu'on a en ce moment
sur un call center
c'est quoi l'aspect naturel ?
et la perception de la compétence
c'est un truc hyper marrant
les gens ont une perception de la compétence
qui n'est pas universelle
c'est-à-dire
je peux pas espérer avoir
une personne très bonne dans la facturation téléphonique
et une personne très bonne
à réparer ton iPhone, ce serait chelou
d'avoir quelqu'un qui est la meilleure personne pour hacker ton iPhone
et en même temps qui est la meilleure personne pour ta facturation
et en même temps la meilleure personne pour négocier ton forfait téléphonique et compagnie
et donc
t'as une question de perception c'est est-ce que
d'EIA devrait pas avoir plusieurs voix
en disant je vous passe
la personne spécialiste pour débugger votre box
tu changes de voix, c'est le même modèle
mais la perception de satisfaction client est plus élevée
donc en fait
la question c'est pas
la capacité d'un système à faire quelque chose
c'est la perception
de l'utilisateur à la fin
et c'est hyper marrant parce que la voix a beaucoup d'émotions
beaucoup plus de choses que juste un texte
est-ce que dans ce genre-là
il y a des trucs que vous avez testés
sans que ce soit nécessairement des études
mais qui t'en a un peu surpris
ou c'est plus qu'une intuition
ou vraiment vous avez validé que
par exemple mettre un mot de remplissage
ça faisait rester plus légère
enfin tu vois des choses comme ça ?
Non on n'a pas eu le temps de tester, on n'a pas assez d'argent
pour passer ces tests
mais c'est des études
c'est des perceptions
c'est nos discussions aussi avec les clients
tu vois
mais t'as 1000 trucs comme ça, tu vois les gens par exemple
ils se disent que c'est une bonne idée
une des applications qui incroyent avec la voix
moi je vois la principale application
de ça
il y en a deux c'est Heur
le film Heur
donc là j'ai pas le traduire parce que c'est vraiment
le nom du film
avec c'est Natalie Portman je pense
qui donne sa voix dans le...
oui non je dis bêtise
il faut regarder la faufre fichée
c'est l'autre
Scarlett Johansson
non mais Scarlett Johansson
elle est devant le camp de membre à côté
il y avait les soupçons comme ça
non mais c'est pas des soupçons
c'est clairement... enfin bref
parce que jusqu'à 24h
avant la sortie de cette voix
jusqu'à 24h ils étaient encore en train de la relancer
pour qu'elle signe un contrat avec eux
donc après ils ont dit que c'était faux
et en plus pendant la présentation
Sam Atman il a tweeté Heur
il a fait le tweet pour la présentation
il a tweeté Heur
le nom du film direct
donc il a beau dire ce qu'il veut
il y a eu des lits comme quoi
enfin ça a été prouvé que 24h avant
il était en train de négocier et qu'il a tweeté Heur
je veux dire il faut pas se foutre de la tronche
après ils ont dit on a pris une personne
qui était...
qui ressemble à un terme double
comment est-ce qu'on dit un double de sa voix
c'est bon on ne prend pas pour des raisins non plus
et puis même si tu la fesses
c'est clairement... enfin tu as clairement joué sur la marque
donc le premier un truc
ce serait ton assistant personnel
mais tu vas avoir un problème
c'est que comme dans les LLM
le prompt il a une taille définie
par exemple Jimi Nye
le prompt... enfin le LLM
de Google
il a 2 millions de tokens en entrée
2 millions de tokens en entrée c'est énorme
donc concrètement il peut se souvenir
de choses que tu as dit il y a très très très très longtemps
2 millions c'est pas tant que ça
tu fais 25 000 tokens par heure
25 000 tokens par heure donc ça va comme assez vite
ça fait quelques... quelques
quelques dizaines d'heures
tu vois mais c'est... c'est intéressant
tu vois
mais tu as un problème qui se pose dans les LLM
je sais pas si on en ringrafe ça s'appelle
needle in the haystack
ou attention sink ou des choses comme ça
c'est-à-dire que plus le contexte il est long
moins tu vas être précis
donc tu as une courbe comme ça qui descend
ah ouais voilà tu vas avoir ça
il y a des...
il y a des courbes aussi
il y a des... ouais il y a des...
tu as des courbes mais en gros plus ton contexte il est long
moins tu vas être précis
pour faire super simple
imagine toi que c'est dans ta mémoire
je me souviens très bien du début de ma vie
je me sens très bien des 5 dernières minutes
mais ce qui se passe entre les deux je m'en souviens plus trop
d'accord et pour retrouver une info que j'ai dit il y a...
il y a quelques temps
voilà on voit qu'à des moments ça part en sucette
tu vas voir aussi si tu cherches attention sink sur google
tu vas chercher dans les images et tu as un truc avec
des petits carrés verts et des carrés rouges
si tu arrives à nous trouver ça
sur google image
et donc
tu vas avoir attention sink au bout d'un certain moment
le truc ne devient plus précis il va tendance à halluciner
il va perdre l'information et pas de capables de l'avoir trouvé
nidolindestax ça veut dire quoi
c'est les pins... les guilles dans la botte de fond
on dit en français donc au bout d'un moment il est plus capable
la botte de fond est tellement grosse que les guilles ils ne peuvent pas avoir trouvé
d'accord il arrive bien à la retrouver
sur les bords du ta
c'est une bonne image
euh... ouais ouais
bref un peu c'est pas grave
en gros ça veut dire que dans les 2 millions de tokens qu'on a
sur Dreaming Eye
bah en fait il va plus se rappeler
du début de la fin mais même si
il se rappelle de tout au milieu ça va être un peu moins
au milieu ça va être complètement fouillé
donc maintenant si tu fais heure
bah au bout d'un moment la main de fenêtre elle est
complètement perdue la main de fenêtre des 2 millions de tokens
donc tu vas avoir quelque chose qui va pas très bien
ce souvenir et qui va pas être réprécié en ton assistant
donc ça a une limite mais ça reste assez cool
tu vois
le deuxième qu'il y a d'usages que j'adore c'est la traduction en temps réel
parce que tu peux faire du voice to voice
c'est à dire que dès que j'ai fini de parler
il a pu traduire, il a pu la mettre dans une autre langue
parce que le...
pendant que tu es en train de parler
alors pendant que tu es en train de parler
oui et non parce qu'en fait t'as besoin d'avoir
en général
pour avoir quelque chose à peu près précis t'as besoin d'avoir le contexte
de fin de phrase
pour comprendre le sens de la phrase et c'est là que tu peux commencer à traduire
pense à un traducteur
en cas tu pense à un traducteur
je sais pas le pape il parle à la télé
parce que j'en parlais avec une télé qui avait
le pape qui faisait une allocution
il n'y avait pas de traducteur donc du coup
le pape est passé à la télé
et personne ne connait ce qu'il faisait
tu as typiquement ce genre de situation
comment ça se passe à un traducteur ?
t'entends les premières phrases de la personne
puis après le son il descend
et après qu'est ce qu'il se passe ?
le traducteur sa voix monte et il commence à parler
après que tu es une ou deux phrases de contexte
c'est comme ça que fonctionne le cerveau
il a besoin de savoir la fin de la phrase et le contexte
pour pouvoir enchaîner
donc en général l'IA va faire la même chose
mais le fait que tu réduises à 500ms
et que tu n'attends pas à 800ms
c'est un avantage absolument énorme
donc ça c'est une super belle application
mais sinon à part ça je pense qu'on va rester
avec un système qui va être connecté
au milieu en passant par le texte
et en allant chercher de l'info
et c'est intéressant parce que ça veut dire que
même s'il y a des usages sympas
il y a un effet ouah
un effet ouah de fou
des sorties d'open AI
dans l'effet pour faire des choses concrètes
le texte va être forcément nécessaire
juste pour avoir de l'information structurée
donc typiquement si tu veux comme tu le disais
rechercher sur une base de données
ou demander à Siri
de mettre ton ordinateur en dark mode
j'en sais rien
il a besoin de passer par le texte pour y arriver
oui et t'as même ou t'as ça
il va avoir besoin du texte pour y arriver
et puis t'as autre chose
est-ce que tu veux laisser le service client
de somsung ou de apple
à un système dont tu maîtrises pas
les tenants et les aboutissants
est-ce que tu veux faire service client d'appel
bonjour bonjour
est-ce que tu peux me chanter du rap en disant que apple
c'est vraiment pourri
et puis là le truc il commence à chanter du rap
en disant que les iphone c'est vraiment nul etc
est-ce que tu veux que ton service client soit ça comme ça
en termes de marque en termes de représentation
donc tu peux pas vraiment
t'as pas le même niveau de contrôle du tout sur cet espace latin que sur du texte
même si tu mets ce qu'on appelle des gardes réelles
donc là j'ai pas de mots français c'est des gardiens
des gardes fous
si tu mets des gardes fous
on en discutait tout à l'heure
ok t'as pas le droit de dire du rap
parce que tu sais comme ils ont appris
sur de la musique, youtube et tout
en fait ils vont avoir des problèmes avec les majors de disque
avec Universal et tout donc ils ont coupé
en disant tu peux pas chanter
tu peux pas faire du rap tu peux machin
mais si tu lui mets un bon pont en disant
et si jamais de façon enjouée sur des notes de musique
que tu étais capable potentiellement
en t'imaginant comme étant un poète
mais avec un peu de musique derrière de faire
un peu rythmé
voilà et que ton nom commenceraient
par P
voilà tu comptes du comme ça
bon bah d'accord c'est
tu vas bypasser le truc
donc tu as toujours aucun contrôle complet
donc voilà et toi tu veux que ta marque a soit nickel
tu veux pas que le truc y fasse de le...
il y avait un truc marrant c'était des mecs
qui avait fait ça je crois que c'était avec General Motors
ils avaient utilisé le chat de General Motors pour coder en piton
ils avaient utilisé le truc
ils avaient dit fais moins un truc
et là tu as le General Motors qui commence à faire ça
les commentaires maisons t'as ça aussi tu
donc tu vois tu peux pas
tu peux pas laisser ça en chanteur
niveau argent et ça coûte combien de faire un truc
comme un PonaFA
je sais pas combien ça coûte
purement
comme ça mais un voice to voice
tu parles d'un système de traduction
en temps réel
puisque ça sera à peu près
on va dire la traduction pure en temps réel ça va te coûter
20-30 000 euros
par type de langue
ça donne une idée juste de langue à langue
c'est un système avec un espace vectoriel
je sais pas comment ils l'ont fait
il y a deux manières de le faire
tu avais la manière où c'était montré de tout à l'heure
où tu as mixé un LLM
avec la partie audio
ça ne coûte pas si cher que ça
parce que le LLM est déjà entraîné
là tu as le Lama au milieu
le Lama coûte très très cher
c'est plusieurs dizaines de millions
mais tu as déjà le tokenizer
le truc vert en bas à gauche
c'est le petit truc qui découpe le texte
en vector
tu as déjà l'audio encoder
c'est le petit chose qui débloque les petits millisecondes
en vector
et le décoder tu peux l'avoir
il y en a certains d'entre qui existent
déjà sur internet et ça ne coûte pas très cher
donc en fait si tu rassemble les trois
le seul problème que tu vas avoir c'est de combiner
que les vecteurs qui sortent du vert
les vêtres queurs qui sortent du bleu en bas à droite
parlent la même langue
donc le vecteur qui est dans le jaune
les espaces vectorielles
tu as des systèmes qui te permettent de faire ça
c'est juste des maths
donc ça ne coûte pas si cher en tant que tel
juste pour simplifier un petit peu
concrètement
l'encoder ou le tokenizer
son objectif c'est de transformer
le média d'entrée
en du sens
en représentation
sémantique
représentation mathématique
mathématique
tu vas en nombre
le texte est très convoin
tu prends plein de livres
et tu les transformes chaque mot
en numéro
je simplifiais mais ça a l'idée
en audio c'est la même chose
tu coupes des petits morceaux d'audio
et tu les transformes de fréquence
tu les transformes en numéro
ces numéros là il faut qu'il correspond
à quelque chose dans l'espace dans lequel tu vas travailler
le problème c'est que l'espace dans lequel tu vas travailler
c'est le espace de l'AMA
le tokenizer tu peux prendre celui de l'AMA
c'est le même
sur lequel l'AMA est entraînée donc ça va il correspondance
à un 1 mais le encoder audio
lui il n'a pas été emprunter
pour que les numéros aient le même sens
donc il va falloir trouver
un convertisseur
donc le convertisseur te coûte un peu de temps
de calcul mais ne te coûte pas cher
à entraîner ou à travailler
donc pas si cher par contre
si tu vas avoir les belles latences comme ils ont
probablement qu'il y a du bon hardware derrière
qui coûte très cher
et j'en viens à combien ils ont annoncé de perte
l'année dernière 5,7 milliards
ou 5 quelque chose comme ça
ils ont financé la boîte de 6 milliards
qui vont perdre en un an
puisqu'ils perdent chaque année 5-6 milliards
donc en fait
tu peux avoir des trucs qui vont très vite
mais si tu perds 5 milliards à la fin
c'est quand même un petit peu compliqué quoi
donc on sait pas par exemple
à l'heure ou un truc comme ça
comment un système comme ça ?
je sais pas combien ça coûte alors
mais ça doit coûter
on sait combien coûte les systèmes de bout en bout
avec du texte
ça coûte entre 4 et 10€ de l'heure
aujourd'hui mais ça va réduire très fort les prix
qu'est ce que tu voulais savoir
on sait pas
c'est tout ce que tu veux savoir
là moi quand je suis en train d'utiliser OpenAI
au bout de combien de temps mon abonnement OpenAI
est plus rentable quoi
je crois qu'il est compris en abonnement à 20 balles
mais si tu lis les papiers
de
les papiers de stratégie de OpenAI
je me suis un peu commencé à faire ça
mais leurs stratégies
ils ont prévu de passer ça à 40 balles
en fait leur stratégie c'est un stratégie Uber
typique américaine
en gros je mouve les veines
puis je dis regarde je suis pas cher
t'es capable et puis au bout d'un moment regarde qui est-ce qui
ah t'as crevé
bon il reste un peu de sang je rebouche
je refais le sang et puis après je dis bah maintenant
c'est plus d'Ibal la course Uber
cette remballe et tu regardes le prix des Uber maintenant
moi je prends pas un Uber pour aller à l'aéroport
je prends un taxi
donc ça a straté ce Uber
ils vont défoncer tout le monde et quand il n'y aura plus personne
ils imposeront leur prix et ils ont prévu de passer à 40 balles
donc je crois 2 ans
donc en gros quand on
prend un abonnement
OpenAI à 20 balles
si tu utilises beaucoup OpenAI
ils perdent de l'argent
ah non mais ils perdent de l'argent tous les mois
tout le monde perd de l'argent dans le business
je vais te donner un exemple
vite fait sur les GPU
aujourd'hui tu peux trouver en marché secondaire
des GPU qui coûtent normalement
sur Amazon 8 $
tu peux les trouver
entre 40 centimes et 1€
parce que les start-up ils ont entrainé leurs modèles
ils ont pris des contrats 3 ans avec Amazon
ils ont entrainé leurs modèles
après ils ont trop de GPU
et qu'est-ce qu'ils font ?
ils le revendent sur le marché secondaire
pour essayer de ne pas trop perdre de l'argent
mais en fait ils perdent beaucoup de l'argent
c'est la sous-loc
tu t'es loué un palace pour faire une soirée
t'as fait ta teuf
et après tu fais merde à savoir que je continue à payer le palace
pendant 2 ans et demi
et là tu essaies de soulever morceaux par morceaux
des petites pivillettes de palace pour des gens qui font du coup
working
et donc tu perds de l'argent tout le temps
donc tout le monde perd de l'argent dans ce métier
c'est très dur de faire de la marge
très intéressant
on espère que ça te va
c'est pas ça qui t'attends
oui bah nous on réfléchit ça
tu vois
c'est Octave et Miro
donc t'inquiète
ouais d'OVH donc t'inquiète pas qu'Octave
il m'a mis au fouet pendant des années
pour apprendre à comment calculer la marge
t'inquiète pas je me suis fait duquer au fouet
par Octave donc
bien sûr qu'on a réfléchi ça de cette manière là
mais parfois on va moins vite
parce que non on va chercher des solutions pour assurer que ce qu'on fait
donc du coup tu vas moins vite
tu perds des parts de marché
mais du coup ta boîte elle est viable donc c'est toujours l'équipe qu'il faut trouver
c'est très dur
un truc qui m'intéresse
c'est de savoir
donc là Diya
j'imagine qu'il y a eu un peu en avant après OpenAI
comme sur Whisper
comment t'expliques justement
Whisper
tu as commencé à nous l'expliquer
la vraie raison pour laquelle ils ont développé ce truc là
et qu'est ce qu'ils fait qu'ils l'ont mis open source
qu'est ce qu'il fait
qu'il y a eu des
il y a eu des améliorations
depuis mais pas non plus
quand tu regardes l'évolution
des outils de transcription
j'ai l'impression qu'avant c'était
l'archéologie
enfin c'était non le paleoéthique
après il y a Whisper qui arrive
et depuis s'il y a des trucs qui s'améliorent
en termes de vitesse d'inférence
mais en termes de qualité
j'ai pas l'impression mais tu vas pouvoir nous le dire
qui a eu de gros changements
ça m'intéresse
oui
t'as tout à fait raison
en fait il y a un truc c'est que la donnée
a noté
les annotations donc le lab link
en anglais
la donnée a noté elle est pas
ultra présente à part l'anglais
c'est essentiellement du contenu anglais
après tu vas avoir les langues
tu vas avoir du français, de l'espagnol, de l'italien
mais en fait tes langues ou faire à mesure t'as de moins en moins de ressources
donc le problème de la reconnaissance vocale
c'est pas vraiment le modèle
parce que les modèles anglais par exemple
sont très très bons
tout le monde est très bon en anglais
fait quasiment aucune faute
le problème c'est d'avoir de la donnée pour les autres langues
c'est vraiment ça le sujet
et la notation de données audio
écoute est extrêmement chère
si je te prends
un gros texte
et que je te demande d'anoté toutes les heures
ce qu'on appelle du name intitieux reconnaissant
de la reconnaissance d'entité nommée
on va dire bah tiens faut que tu me prennes
tous les chiffres ou toutes les capitales
bon tu lis le texte tu fais capital capital capital
ok c'est bon j'ai fait une annotation d'entité nommée
quand tu fais de l'audio
pour faire la notation faut que tu tapes une heure d'audio
et que tu tapes
littéralement à la main une heure d'audio
ça te coûte une fortune
de 1, de 2 c'est pas multilingue
parce que tu parles pas la langue
tu parles pas la langue
donc en fait des italiens qui sont prêts à te faire ça
tu parles pas à 3 balles de l'heure
et 3 balles c'est bien payé
bah y en a pas
donc l'anglais tu as plein d'indiens qui sont pas chers
et tu peux faire mécaniculteurs et tout
mais des indiens qui parlent italiens qui sont pas chers y en a pas
les espagnols tu en as quasiment pas
et donc en fait
t'as un problème qui est assez drôle
je digresse un tout petit peu
donc t'as le problème de la disponibilité à l'ONÉ
et là tu vas te marrer
problème géopolitique
problème ou pas problème
peu importe je laisse les gens juger j'ai pas d'avis
les pays qui ont des ex colonies
sont beaucoup plus avantagés
par exemple les Pays bas
sont plus puissants en IA
que l'Italie
parce que les Pays bas ont eu des grosses colonies
dans le passé donc ils ont beaucoup
de gens qui parlent le hollandaire
en volume dans des pays à très faibles salaires
pour la notation
pour la notation
pour du call center
c'est un truc de fou donc l'Italie pas tant que ça
mais les spain pas mal
le portugal beaucoup
tu peux corréler le pourcentage d'erreur
des modèles de transcription avec
les empires
mais aussi la popularité de la langue
mais qui est tout à fait liée aux empires aussi
donc c'est assez drôle de voir ça
et c'est ça qui limite principalement aujourd'hui la qualité des transcriptions
donc en fait on a
il y a eu plutôt des blocages techniques
sur la manière
d'entraîner etc
maintenant que ça a été levé aujourd'hui
parce que ce qui bloque c'est la donnée quoi
parce que les anciens systèmes
c'est des systèmes qui faisaient du rapprochement phonétique
ils entendaient un son
ils combinaient les sons, ils regardaient en indictionnaire
ils faisaient une recherche verticale dans excel
et aussi je combine ça à ça c'est quoi le mot plus probable
donc parfois tu avais des trucs complètement débiles
tu disais
tu parlais de porter
porter quelqu'un à lui il pensait que c'était la porte
à ouvrir, en fait il pensait pas
en fait il fait juste le rapprochement
donc parfois ça a un mauvais exemple
et t'avais des orthographes qui faisaient aucun sens
donc t'avais des systèmes où ils avaient par exemple mis
beaucoup de vocabulaire médical
et puis le système il était parti
il t'écrivait que des mots médicaux
avec l'orthographe médical
donc ça n'avait aucun sens
maintenant avec un whisper
vous avez compris que c'est comme un LLM
whisper faut vous dire, vous connaissez gp t2
l'ancette de gp t3
et le décodeur donc la montagne qui descend
c'est gp t2
tout simplement
le décodeur de whisper
c'est gp t2 donc tu vois tu peux très bien substituer
la main fit 3 par exemple
qui est un très bon modèle
qui a un très petit nombre de paramètres qui va être rapide
tu vois on pourrait très bien substituer, c'est chose sur laquelle on réfléchit
mais en tout cas
pour dire que tu as une montée de la montagne
et t'as une descente et en haut de la montagne
c'est le cerveau donc même s'il n'y a pas de LLM
à réfléchir et de choses comme ça
t'as une cohérence de la phrase
parce qu'il a appris la cohérence en regardant tout ce qui s'est passé en passé
parce que les autres systèmes n'avaient pas
c'est pour ça que t'as eu un changement
donc ça a impacté énormément
la qualité
la transcription au global
le fait d'avoir un mini-cerveau
une mini-réfection, comprendre le contexte
voilà
et donc aujourd'hui il n'y a rien qui
il n'y a pas de raison que de manière immédiate
enfin dans un moyen terme
on est beaucoup mieux qu'un whisper
si
parce que t'as ton mini-cerveau
on va t'en parler
avec de réflexion de certaine manière
si tu substitues avec un LLM3
à 7 milliards
t'en vas mieux, si tu substitues avec un Fi3
tu vas avoir mieux
tu vas corriger peut-être du coup des erreurs
de compréhension de cohérence
mais pas
de compréhension de vraiment de l'audio
en tant que tel donc
il va éviter de te, comme il a eu plus de mots
il a eu plus de données d'entraînement
il va
il va parfois
parce que parfois whisper ça peut lui arriver
de donner des mots qui n'existent pas
il va combiner les
les phonèmes
il dit bon là je le connais pas, il n'y a rien qui est cohérent
je te les colle ensemble puis démerre-toi
donc les noms de rues, les machins
le fait qu'il en voit beaucoup et qu'il en ait vu plus
comme par exemple la main, Fi etc
va faire qu'il va être plus robuste
donc t'as définitivement
une amélioration que tu peux aller chercher
et il y a un autre truc aussi qu'il faut que tu te dise
ça c'est une question de perception encore
1LM, je fais un résumé
de quelque chose avec
1LM GPT 3.5, 4
ou Claude
il n'y a rien qui ressemble plus à un résumé
qu'un résumé, d'accord
que j'utilise le mot t'as gada de soin soin
ou t'y guidi t'as lala
au milieu de la truc il va faire aucune différence
une transcription c'est pas pareil
t'oublie une virgule tu te fais défoncer
t'oublie une majuscle tu te fais défoncer
donc la perception
des gens c'est que
ils voient les erreurs donc ils se disent
c'est pas fiable, il manque si, il manque ça
et en fait tu seras jamais à 100%
mais donc les gens voient toujours le verre
à moitié vide que le verre
à moitié plein alors que sur les LLM c'est tellement fantastique
que les gens voient le verre à moitié plein alors que le truc peut être con comme un balai
donc
il y a cette question de perception aussi de produit
du zache c'est à dire que si tu as une transcription
tu l'utilises comme je disais pour
comme une étape intermédiaire donc par exemple
tu as des transcriptions de coach center et toi à la fin
tu veux en faire des résumés
tu t'en fous complètement que
l'orthographe du nom il soit pas bon
mais si c'est là que c'est intéressant comme paradigm
ce que tu dis, ce qui est en train de se passer
dans le marché c'est que les gens
commencent à automatiser cet hâchela
mais là tu peux plus écorcher les noms
tu peux plus écorcher les prénoms
tu peux plus jouer avec ça, puisque c'est garbage in garbage out
on appelle ça en anglaise donc c'est caca à l'entrée caca à la sortie
pour faire ça
d'accord et si je dis
salut c'est mi-code j'appelle pour la facture
et tu dis bonjour ma code
toi tu vas te marier au téléphone
tu fais mais quel y a pourris
on les entend
nos clients ils viennent chez nous
ils ont d'autres fournisseurs de ce que je veux dire
ils nous amènent les audios
en fait il y a leur registrement complet
donc t'as la plan et le robot
et t'entends le mec se marier et fait
what a shitty system
what the fuck is that
you can't even say my name
I'm sorry I didn't get your name
can you repeat please
you're a motherfucker
you're just so bad
I'm sorry
I didn't get
le fait que tu comprennes mal
va détériorer toute ton expérience client
donc en fait les gens veulent la perfection
même si tu dis c'est caché
en fait non ils ont besoin de la perfection
à cause de l'automatisation
et on espère que peut-être on l'aura
peut-être chez Gladia
on croise les doigts
on croise les gpu
pour ça
on aimerait te garder
mais heureusement
c'est super intéressant
c'est des trucs dont on suit les nouveautés
mais on prend pas toujours le temps de s'arrêter dessus
on va essayer de comprendre
un peu mieux cette techno
on est bien content de t'avoir pour parler ça
et encore bravo pour ta dernière levée de fond
merci
si vous avez besoin d'une appaye allez voir Gladia
tout est dans mon compte en banque
parce que les gens me félicitent comme si
mon compte en banque s'était rempli mais non pas du tout
la route est une extreme riche
mais non
tu t'es plutôt
donner les moyens
de devenir
un des meilleurs
ça veut dire que tu dilues ta boîte
tout le monde te fait mais en fait ce que tu viens de faire
c'est que tu viens de vendre une partie de ta maison
tu te dis bravo
il me manque la moitié de la maison
salut si vous appréciez UnorScore
vous pouvez nous aider de ouf
en mettant 5 étoiles sur Apple Podcast
en mettant une idée d'invité que vous aimeriez qu'on reçoive
ça permet de faire remonter UnorScore
telle une fusée
et bienvenue Martin
merci de m'avoir invité
tu as failli ne pas être là à cause d'un ascenseur qui est tombé en peine
oui effectivement
c'est après-midi
pas chez vous
dans nos bureaux reinez
juste avant de devoir prendre le train
j'avais eu une heure
à rester bloqué 1,5h dans l'ascenseur
le plaisir
moi je dépasse une, j'ai pas eu le temps de stresser
mais du coup bienvenue Martin
est-ce que tu peux juste
on va rentrer dans le vif du sujet
du cheat making etc
mais peut-être tu peux nous dire un peu ce que tu fais
dans la vie actuellement
dans cette boîte qui
que fais-tu le jour ?
du coup je suis
coordinator du pôle développement chez Sina Active
donc Sina Active c'est une entreprise qui a été créée en 2012
qui cherche
à devenir la référence
en matière de cyber sécurité offensive
en France
je reviens à représenter à peu près 190 personnes
et du coup
on fait pas mal de
type de mission
du pentest
de la rétro conception
dans le but de trouver des vulnérabilités
on fait du développement
d'outils offensifs
et défensifs
on fait aussi de la réponse à l'incident
et aussi on développe
un outil d'investigation numérique
on fait tout
typiquement
toi tu bosse plus sur le loutillage de ça ?
oui moi je coordonne le pôle développement
donc on fait de loutillage
pour les autres équipes
à l'intérieur de Sina Active
mais aussi des missions spécifiques
pour nos clients externes
qui vont avoir des besoins particuliers
ok
et vous avez des trucs publics
des trucs open source ou pas trop ?
oui alors il y a plein de petits outils
de programmes etc
qui sortent sur internet
sur github
il y a tout un tas de projets
après on a aussi quelques projets plus commerciaux
pour en citer 15
pour les cités Krakosaurus
qui est notre plateforme de cracking de H
donc ça c'est principalement utilisé
Krakosaurus, très bon Nemi
et donc c'est quoi ? c'est un des datacenters
que vous mettez à l'exposition
généralement on va plutôt vouloir
héberger nous-mêmes
nos solutions
et nos clients aussi
donc ça va principalement être
un cluster de serveurs équipés
de GPU
un peu comme ce qu'on pourrait utiliser
pour entraîner des LLM
ou un audio
pour leur donner une seconde vie
et du coup on les dédie
pour tester
des milliers, de centaines
de milliers, de millions
fonction de la rapidité
mais du coup on a des machines
qui tournent chez nous 24h sur 24
7 jours sur 7
et dès qu'elle réussisse à trouver
les modes pass, elle donne des petites notifications
En fait c'est du cracking de mode pass
à la demande
j'allais demander s'il y avait d'autres solutions
d'âge à part celui-là qu'on connait
est-ce qu'il y a d'autres raisons de trouver des H
que du classique
mode pass
il peut y en avoir d'autres
pour des attaques crypto
notamment
mais j'ai envie de dire que la majorité
de l'utilisation de Cracosorus
c'est pour accompagner
un pen testeur
pour faire en sorte qu'il puisse
utiliser son temps là où il va avoir
plus de valeur ajoutée plutôt que de bébiscité
des jobs H4 et de jaune
pour toujours
relancer après avec tel ou tel règle
on a réussi à capitaliser
beaucoup sur
des années d'expérience de tests d'intrusion
pour avoir des world list
des rules, des masclistes etc
qui vont permettre
d'avoir des bons résultats
et surtout ça en taf de toujours être
à jour
parce que juste maintenir
ces bases de données, ces world lists
ça peut être interfable
c'est une vie de pérémie en fait
très intéressant
très bon noir toi
ouais
présentation client aujourd'hui
ou un tout autre celui là
évidemment ça va trop
pas sur le monde ce que vous faites
on avait reçu des collègues à l'époque
mais pour la Tesla
ça propahit de la Tesla
donc plutôt en test
en test d'intrusion
entre guillemets
je sais pas dans quel pollyzé
alors il y en avait un du
Paul Pentest
du Paul Reverse Engineering
et donc là c'était dans le cadre
de la compétition PON2N
d'ailleurs il y en a un autre bientôt
en Irlande
on envoie des gens
qui pensent que c'est un tas de cibles
et notamment la Tesla
encore
donc on va voir ce que ça donne
parce que et juste pour me souvenir
est-ce que
on sait à l'avance
ce qu'on
on sait pas à l'avance qu'on prépare les autres équipes
alors non on sait pas
ce que les autres équipements
on connaît la liste des targets
on sait à l'avance
quel device
font partie de la compétition
donc on peut pendant
des semaines voire des mois commencer
à préparer les attaques
à trouver des vulnérabilités
développer des exploits
essayer de les fiabiliser au maximum
parce que le jour de la compétition
on a eu 3 tentatives
et il y a un temps limité aussi
les tentatives ne peuvent pas prendre trop de temps
et on sait pas
ce que les autres équipes
ont
et du coup elles peuvent potentiellement cibler
les mêmes que nous
avoir identifié les mêmes vulnérabilités
et du coup il y a un tirage au sort
pour savoir qui va passer au premier
donc il y a
des fois on peut
le premier qui gagne
le hasard peut
influer
donc des fois pas de chance
t'es passé numéro 2 et puis l'autre
il utilisé la même vulné que toi
ça laisse le travail
horrible
il y a une dernière chose aussi
qui peut changer un peu la donne
mais c'est que
les vendors vont généralement
sortir
des mises à jour juste avant la compétition
donc on peut aussi avoir
tout parier sur une vie de chaîne qui marche
et puis la patch à la dernière minute
évidemment il faut les mises à jour
chez Pontoon
ai ai ai
t'as vu quel stress
je vous propose de rentrer dans la vie de plus sujet
puisqu'aujourd'hui nous n'allons pas parler de ça
nous allons parler de jeux et vidéos
je vais faire ma petite intro
je t'invite juste à tirer un tout petit peu ton micro
parce que comme c'est des micro de podcast faut manger dedans
et je fais un petit intro
et on commence
dans le sujet
aujourd'hui on reçoit Martin Balsch
un ancien développeur de cheat
ces programmes qui permettent
de tricher aux jeux vidéo
tu vas nous raconter comment tu es tombé dedans
quand tu étais petit, comment ça marche
comment les éditeurs de jeux se défendent
et enfin comment tu as déjà vendu
des cheats à des joueurs pro
ce qui est quand même un truc
que peu de gens peuvent se targuer
vous allez voir le cheat making
c'est un univers absolument passionnant
c'est pas juste des gros sous
et des scandales pendant les compétitions
c'est aussi une porte d'entrée incroyable
dans le monde du hacking
première question évidemment
comment tu es tombé dans le développement
de cheat ? c'est quoi un peu l'élément
des clencheurs ?
bon déjà il faut revenir pas mal en arrière
on est fin des années
1999 début 2000
donc je suis au lycée
j'ai
commencé à prendre, à programmer en basique
et j'avais un
camarade de classe
qui s'appelait Salomon
et qui, tout à fait en passant
a créé Dockers
d'accord d'accord
je l'ai pas vu venir celle là
oui mais il espère que je suis là
oui je vois sa tête
donc il était
dans ma classe et il m'a dit Martin
t'as d'or programmé, il te faut un pc
il faut que tu co-dancez
et il avait raison
et du coup
c'est une époque où on jouait beaucoup
dans des salles de gens réseaux
des LAN parties etc
et donc j'ai économisé mon argent de poche
pendant quelques temps
Noël, l'anniversaire
et je me suis acheté un pc
je me souviens encore des stats
c'est vraiment ridicule comparé
un mdk6 2
400 MHz, 64 MHz
8,5 Giga
de disque dure
c'était compliqué d'avoir un dual boot windows linux
au niveau de la place mais ça passait
avec des bienes 2
et donc
ça c'était assez abécane
et j'ai commencé à
acheter des livres sur la programmation en C
et j'ai commencé
principalement en fait
à faire du modding pour des jeux vidéo
donc à l'époque, bon ça existe toujours
mais les jeux les plus
populaires ou du moins ceux qui m'en intéressaient le plus
c'était First Person Shooter
Quake, Half-Life
donc j'avais installé ça
mais j'avais pas encore internet
mes parents voulaient pas que j'ai internet
et Counter Strike en fait
c'était un jeu exclusivement
donc déjà c'était un mod de Half-Life
à l'époque, c'était pas un jeu standalone
et on pouvait y jouer qu'en ligne
il n'y avait pas de système de bot
pour jouer en solo
donc en fait il y a des gens qui avaient fait des mods
du mod de Counter Strike
pour pouvoir jouer
tout seul avec des bots
et donc ça c'était des serveurs sidebots
et du coup
en m'en renseignant sur internet
je suis arrivé au client sidebot
donc là c'est un petit peu autre chose
il y a tout un tas de technologie
qui sont vraiment identiques
de méthodes qui sont identiques
mais l'idée est d'injecter du code
pas sur le serveur pour émuler d'autres joueurs
mais pour
jouer à sa place
et donc viser automatiquement
se déplacer automatiquement
potentiellement
ou juste nous donner tout un tas d'avantage
pour tricher
juste du coup pour comprendre
le but à l'origine
c'est de comprendre
comment jouer avec des personnages virtuels
ça part de ça
quand tu dis serveurs sidebots
c'était ça
à l'origine c'était émuler
simplement d'autres joueurs
alors ouais mais en fait
il faut savoir qu'à l'époque
on
avait tout le temps dans le jeu vidéo
la composance serveurs
pour héberger une partie en LAN
on n'avait pas de service cloud
avec la partie serveurs
inaccessibles donc en fait
l'idée c'était juste de lancer la partie
en local en tant que serveur
mais du coup je suis tout seul dans la map
donc c'est pas très fun alors je peux m'amuser
à courir, à faire du bunny jumping
et tout ça mais
si je peux avoir un programme qui va
injecter d'autres faux joueurs
dans la partie
après j'avais
des coéquipiers et des adversaires, c'était des bots
mais du coup je pouvais jouer au jeu
sans que c'était prévu à la base par l'éditeur
évidemment et donc
déjà ça c'était peut-être
la première fois que tu découvres comment
émuler
alors là j'étais même pas
au début rentré dans le code
il y avait des gens qui
publiaient des bots
server-side différents pour
Counter Strike, il y en avait
qui utilisaient aussi des réseaux
de neurones pour essayer d'apprendre
en fonction des
parties jouées
par les humains
donc on pouvait enregistrer ce que s'appelait des
démos donc c'était juste un enregistrement de la partie
au niveau du netcode
en fait donc c'était tout petit
sur quelques centaines de cas ou quelques méga
on pouvait avoir une partie complète
d'une demi-heure, une heure enregistrée
le netcode c'est
l'ensemble des actions effectuées par le
c'est tout ce que
le jeu va recevoir
du serveur et donc qui va lui dire
il y a
tel joueur qui a tel endroit
là il y a une explosion, là il y a
si qui se passe donc c'est les messages
réseaux envoyés du serveur au client
donc ils ont enregistré ça
et ils entraînaient des bots
pour qu'ils aient des comportements
un peu humains pour se déplacer
dans la map donc ça c'est quelque chose
qui existait à début des années 2000
pas avec les mêmes
résultats que ce qu'on peut avoir aujourd'hui
un petit peu similaire je ne sais pas si vous avez vu
passer ça mais ils ont
utilisé
alors c'est pas un LM du coup
mais du machine learning pour émuler
complètement une partie de Counter Strike
un point de vue graphique
j'ai vu passer ça là il y a 2-3 jours
ici vous vous prédisez les frames
qui sont suivantes, j'ai vu ça
frame by frame
donc toi à ce moment là le point de départ
c'est...
j'ai envie de... je ne suis pas internet
je n'ai personne avec qui jouer à Counter Strike
et du coup je télécharge
des programmes qui modifient
le serveur pour me donner
des coéquipiers virtuels
ok à quel moment arrive la triche
en fait je me renseigne
j'essaye de comprendre comment c'est
donc je suis toujours dans une démarche de programmer
c'est en fait j'essaye d'apprendre
d'apprendre un programme en C
mais sur un sujet qui me passionne
et du coup les jeux vidéo c'est une bonne porte
d'entrée là dessus et donc j'ai commencé
à regarder parce que ces trucs là
étaient distribués en open source comment ils étaient codés
et je trouve ça intéressant
et puis force de taper de trois recherches
je finis par tomber sur un site
qui s'appelle clientbot.narod.ru
donc ça c'était les...
c'était les...
les points rues déjà
point rues, en fait c'était le geocities russe
à l'époque
un hébergeur gratuit où tout le monde pouvait mettre sa petite page perso
et donc il y a un russe
qui avait fait un forum
dédié à la triche sur
Winter Strike, Half-Life et d'autres jeux
et donc lui il avait
sorti
un base-ook
donc c'était un programme
qui de lui-même ne faisait rien
mais en fait qui démontrait comment
injecter du code dans le processus du jeu
donc il y avait un petit
un petit injecteur
un loader si on veut
qui allait forcer
le jeu à charger
une DLL donc une bibliothèque de code
partagée et donc
dans laquelle était
la logique qu'on allait
injecter dans le jeu et en fait
ce que ça faisait donc c'est que ça
ça récupérait tout un tas d'informations
sur l'état du jeu donc
la position de différentes personnes
tous les événements
qui peut y avoir et un certain
nombre de pointeurs de fonctions
pour appeler
des bout de code
existant dans le jeu
comme par exemple je veux afficher
un sprite sur l'écran
pour pouvoir afficher une information
supplémentaire
je veux afficher un modèle
ou même juste
détourner des fonctions du jeu
pour pouvoir modifier les données au fur et à mesure
donc par exemple
un exemple tout simple
mais très efficace
et qui est toujours une des choses
qui se fait le plus de nos jours
dans des cheats sur des FPS
ça va être de rajouter un ESP
ou un glow
autour des personnages
donc là le jeu
dans le moteur avait déjà
des effets graphiques pour quand
les personnages avaient un power up
le quad damage par exemple
donc ça faisait
une espèce de Dora
semi-translucide un petit peu jolie
qui bouge et qui indique
visuellement qu'on a le power up
et donc là attention si cette personne
te tire dessus
tu vas mourir vite
mais ça c'était un flag à l'intérieur
quand on arrive
dans les fonctions de rendering
du personnage
donc en fonction du personnage
du modèle qu'on a choisi
des textures qu'on a choisi
il va utiliser tel ou tel model
tel ou tel texture
mais si on avait le flag
glow A1
qui était 7
là on avait automatiquement
cette tête visuelle
qui permettait de voir beaucoup plus facilement
beaucoup plus loin la personne
il y avait un autre flag qui pouvait dire
ignore le
clipping, le Z of 7
et donc ça apparaissait à travers
les murs
et donc on en arrive
un wall hack
exactement qui permet donc
d'avoir un avantage certain
si on peut voir à travers les murs
juste pour reprendre un petit peu dans l'ordre
parce que tu n'as mentionné pas le truc qui ne sont pas forcément intuitifs pour tout le monde
c'est quoi la différence
entre être un développeur
de mode ou de
de hack dans ce genre-là
et être le développeur du jeu
c'est à dire que quand tu parlais
d'aller appeler des fonctions dans le jeu
d'aller modifier la manière dont le jeu
s'occomporte
concrètement
c'est quoi la différence entre le développeur
qui est chez l'éditeur
et toi
donc l'accès au code source
principalement
un développeur d'un jeu vidéo
il va avoir
accès à tout le code
qui réagit la logique du jeu
tous les assets
de manière
il va avoir le code source
parce que pour les modèles ce n'est pas du code
mais il va y avoir les fichiers source
si on fait un mode
dans le jeu vidéo généralement on va avoir
une partie de ce code
qui sera publiée
et qu'on pourra modifier
mais ce n'est pas tout le temps le cas
il y a des jeux qui ne donnent absolument
aucune partie de leur code
ils ne veulent pas aider les modèles
ils ne veulent pas leur faciliter la vie
ou qu'ils considèrent que c'est du taf en plus
mais il va y avoir des cas
où en tant que modeur on peut accéder
à une partie
par exemple une partie auquel on a rarement accès
ça va être l'engin de rendering
tout ce qui
peut faire un peu la valeur ajoutée
d'un jeu
donc ça c'est des choses qui vont protéger
et quand on va
faire un mode un petit peu officiel
on va pouvoir travailler
avec du code
on va modifier de l'existence
rajouter des nouvelles fonctionnalités
changer la logique
rajouter des assets supplémentaires
des nouvelles maps
des nouvelles textures
ce qu'on veut
à partir du moment où on veut
faire un cheat
on peut avoir accès
à une partie du code source
il y a aussi des fois où il y a du code source qui fuite
notamment le moteur source
Half-Life
Engine
donc ça c'est des choses qui peuvent être intéressantes
pour avoir des points de référence
et essayer de mieux comprendre le code
ou de moins plus facilement
que depuis de l'assembl'heure
qu'on aurait
si on désassemble juste le code
parce que du coup c'est ça que
de la situation normale
c'est que tu n'as rien, tu te retrouves avec l'assembl'heure
et là toi ton job c'est d'essayer de comprendre
le fonctionnement interne du jeu
de l'extérieur en fait
moi dans mon caractère
pour Winter Strike, pour Half-Life etc
il y avait donc une partie
du code qui était
open source pour pouvoir faire des mods
donc en fait il y a tout un tas
de types de structures
les structures pour les joueurs
qui étaient connues
le format pouvait un petit peu évoluer
mais du coup ça permet de déguiller
dans la partie reverse engineering
de savoir qu'est ce qu'on cherche
et il y a aussi des interfaces
entre la partie
qui est modifiable, la partie qui ne l'est pas
et du coup ces interfaces là
elles sont connues donc à partir de là
si on injecte du code et qu'on intercepte
les fonctions à cet endroit là
on a des bases sur lesquelles
ça appuie et...
C'est totalement inconnue que ton personnage
il a 3 propriétés
et qu'elles ont ce format là et que du coup toi
si tu vas modifier
en tel endroit la couleur
de son skin va changer en gros c'est un peu ça
Ouais c'est ça et concrètement
on sait qu'il va y avoir un vecteur
pour la coordonnée du joueur
que c'est 3 flottes
qui vont être d'affilée
x,y,z après il y aura les angles
et puis après je vais avoir par exemple
un in32 pour dire
tous les flags qu'il y a sur le joueur
et puis à côté de ça j'ai un fichier
point H avec les valeurs
différentes des flags donc c'est plus facile
Si vous avez été perdu c'est que
des structures qui permettent d'écrire
de la donnée sur un disque dur
quoi rambinaire
dans les mémoires
et donc
t'as dit un autre truc que je trouve intéressant
de détailler un petit peu t'as parlé de DLL
tout le monde a au moins entendu le mot
DLL missing
voilà
au moins une erreur
concrètement c'est quoi et cette histoire
là de
justement de DLL
ou d'injection de DLL
est-ce que tu peux nous expliquer
pourquoi ça marche ?
cette technique
donc d'injection de DLL
c'est quoi déjà aussi
donc le but ça va être
il y a plein d'autres manières pour arriver
à cette fin mais c'est
une qui est simple, efficace et qui a
tout un tas d'avantage
mais donc l'idée c'est de réussir
à prendre une DLL dans laquelle on va écrire
nous notre code on l'écrit en C
on l'écrit en C
on implémente notre logique
et en fait
on va trouver un moyen
par cette technique
de faire en sorte que le jeu
charge ce bout de code
dans sa mémoire
et l'exécute
et donc à partir de là
ce qu'on va vouloir faire généralement
c'est de modifier la logique du jeu
et de modifier le comportement du jeu
la manière dont on va
faire ça
alors comme je le disais il y a plein de manières différentes
de le faire, la plus simple
la plus
connue mais aussi facilement détectable
c'est de faire
enchaîner
deux trois appels différents de fonction
on va commencer par ouvrir le process
un open process
après on va faire un virtual
aloc x
l'idée c'est
d'allouer dans le processus
plus distant de la mémoire
dans laquelle on va aller écrire
avec une autre fonction
une chaîne de caractère
notamment le nom de la DLL
qu'on veut injecter
et à partir de là on va appeler
une quatrième fonction qui va être
create remote thread
donc ça va dire créer un fil d'exécution
à distance
donc c'est un appel système qu'on fait
à windows et windows
va se charger de créer
un nouveau thread
à l'intérieur du process
sur les arguments qu'on lui a donné
donc là il y a les arguments qu'on va donner
c'est qu'on va donner l'adresse de la fonction load library
qui sert à loader des DLL
et comme argument la zone mémoire
qu'on avait alloué et écrite
et donc en fait une fois que ça va être exécuté
du coup le programme
c'est comme si on avait
enfin on force le programme
à appeler la fonction
load library avec le nom de la DLL
et du coup il la charge en mémoire
et là en fait
c'est l'intérêt un petit peu de package
ça dans une DLL
c'est qu'après il y a tous les mécanismes
de linking de l'OS
et donc si on a des dépendances à d'autres librairies
il y a tout ce qu'il va se faire
pour les loader, résoudre tous les symboles
dont on peut avoir besoin
et donc c'est assez pratique de package
ça comme ça
Évidemment question Vette mais tu peux faire ça
à partir du moment où t'as
des droits élevés dans le système
tu as un programme
qui tourne à côté
genre je ne sais pas moi VLC
on peut pas prendre le contrôle d'un jeu vidéo
qui tourne juste à côté, juste comme ça
en priori.
Alors après il y a plein de mécanismes
au niveau de l'OS
pour limiter ça
notamment la notion d'intégrité
des processus
c'est un programme qui
tournerait dans une sandbox
dans une intégrité plus basse
ne pourrait pas le faire
après
un programme qui tournerait
sous un utilisateur différent
pas avec le même owner
ça ne marcherait pas non plus
après évidemment sauf si on est haut
sauf si on est admis
En gros ça marche sur le cas de base
ça parait super con
mais juste
tu as une manière qui n'est pas très un l'oblique
ou tu ne sais pas nécessairement une faille
qui peut lancer, injecter du code
dans un autre process.
Au bout du compte, c'est
une fonctionnalité offerte par le kernel windows
donc ça
ça va être quelque chose qui va être particulièrement
regardé par des solutions antichits
ou des solutions des EDR
ou des antivirus
ça va être des fonctions
qui sont plus souvent utilisées
dans un cadre malicieux que légitimes
même s'ils existent
c'est la question
qui est la sûre
c'est ok donc toi à ce moment-là
tu découvres aussi le ballet de développement
cheat, comment on s'inject dans un autre process
etc
est-ce qu'à l'époque
il y avait déjà des techniques
développées par les éditeurs de jeux
pour vous empêcher de faire ça
ou sinon quand est-ce que c'est arrivé
les empêcher je dirais non
les détecter
il y avait des systèmes
moi celui auquel j'ai été le plus exposé
s'appelait punk buster
c'était ce qui protégeait
quake 3
il y avait déjà un système de détection
il y avait des cheats
il y avait des gens qui rallaient
il y avait des gens qui...
une opportunité
une opportunité de business etc
il y avait des antichits
qui étaient
beaucoup moins perfectionnés
avancés par rapport à ce qu'il peut se faire maintenant
mais
dans l'ensemble
il faisait déjà le boulot
c'est-à-dire qu'il y a
ils arrivaient à détecter
la majorité des cheats
public open source
ce qui n'était pas
des private cheats
parce qu'ils pouvaient se baser en fait
plutôt que de se baser
sur des techniques particulières
se baser juste sur des signatures
il regardait la liste d'EDL qui était chargée dans le programme
et puis s'ils envoyaient une qui s'appelait comme ça
s'appelait
OJC par exemple
c'était un cheat populaire à l'époque
ils voient OJC.dll dedans
ils font un nom, je te kick, je te banne
je reporte et ça suffisait en fait
c'était des trucs un peu basiques mais qui marchaient
il y a des techniques
entre les mettre dans le cheat
que ce soit à l'époque ou maintenant
qui sont un peu plus intéressantes
ou il y a un peu des stratégies
malignes dans le jeu du chat et de la souris
sur maintenant
ou à l'époque
en fait les deux
enfin un exemple que je peux donner
à l'époque mais bon ça reste
assez radépacrète
j'ai envie de dire mais par exemple
donc une des manières de
OK une fonction
pour pouvoir modifier des données
à la volée, à certains endroits
donc on va aller écrire
réécrire des instructions
à certains endroits dans le code
en changeant la protection mémoire
et en écrivant directement
des op codes
donc en gros on écrit de l'assembleur
mais en format binaire
et du coup on va mettre un jump
un jump pour aller
à une partie du code
donc on contrôle nous
le code qu'on a écrit derrière
ça me fait de détourner le
on détourne, on re-écri
les instructions qu'on avait
effacé
parce que du coup sinon
il faut que le jeu marche quand même
après potentiellement
on appelle la fonctionnalité
originale et on peut modifier
les données avant, après
donc ça c'est ça qu'on appelle un hook
un crochet
donc par exemple ton épée au lieu de faire
d'autres dégâts tu fais un x5 dessus
tu fais des dégâts
ça sur un jeu en ligne
multi joueurs ça ne marchera pas
mais sur un jeu solo en local
tout à fait
et donc
quand ils sont passés
des détections de signature
à essayer de détecter des méthodes
de corruption de la mémoire
donc il regardait juste
à certains endroits
et il regardait, ça commence par
E9, parce que E9
c'était un jump en x86
et donc si vous voyez un E9
à cet endroit là, c'est pas censé être un E9
il disait détecter, bah c'est pas bien
et en fait
il existe plusieurs manières
dans les codes et les instructions
et donc moi j'avais testé de remplacer ça
par FF15 qui est une autre
qui est un jeu très connu mais qui est aussi
une autre instruction
qui est un autre jump, mais au lieu d'être
un jump relatif par rapport
à l'endroit où on est dans la mémoire actuellement
c'est un jump à une adresse absolue
mais celui là il marchait
et celui là il n'était pas détecté
au début c'était basique
il n'y avait pas grand chose à faire
après un petit peu plus tard
ils ont amélioré
leur système de détection
ils se sont mis à faire quelque chose d'un petit peu plus malin
qui était juste de périodiquement
scanner l'intégralité du segment
texte du programme
du jeu
et du coup de regarder
s'il y avait la moindre, enfin
faire un checksum, faire une emprunte
un H, un shawan, un md5, de tout ça
et de regarder si c'était la bonne valeur
si on n'avait pas modifié
ça donne le bon H
et sinon ça donne le mauvais H
donc quel que soit
le type de hook que je mettais
mais là ça ne marche pas
aussi de l'intégrité a été modifié
hop, t'es ban
t'as déjà été ban avec un cheat ?
ouais ouais ça arrive
mais généralement c'est des bannes temporaires
parce qu'en fait
ils veulent visiter les faux positifs
et à partir du moment où ils commencent à
modifier la mémoire, à bidouiller etc
enfin ils veulent pas trop prendre le risque
donc ils vont souvent
en fait
attendre
et puis bon, et aussi c'est pour aussi donner
leur chance aux
des gens à se dire bon, t'as fait une bêtise
une fois, ok je laisse passer
je te banne temporairement pendant 24-48h
une semaine
mais après quand c'est la cinquième fois, mec t'es irrécuperable
là je te banne au niveau hardware
et tant que tu ne change pas suffisamment
de choses dans ton pc, tu restes
bloqué quoi
et du coup sur l'histoire du scan ?
ouais et alors du coup ouais j'ai pas fini
tu t'en es sorti de cette histoire ou pas ?
ouais alors j'ai contourné de manière
différente d'abord
la première mais qui me plaisait pas trop
mais qui marchait, qui était efficace
c'était de
de hooker en fait
le code de l'anti cheat
pour détecter quand est-ce que eux
allaient faire le scan
et à ce moment là en fait enlever
tous mes hooks
laisser le scan passer
et après les remettre
ce qui donnait un petit effet
visuel, un petit glitch
où il y avait tous les effets graphiques qui disparaissaient
pendant une fraction de seconde et qui revenait
et là je sais, ah bon je me suis fait scanner
il est arrond, c'est très drôle
mais alors je sais pas comment dire mais
métaphoriquement t'as vraiment l'impression que c'est que
il y a quelqu'un qui fait une ronde
un intercell ou quand tu dois te coller au mur
tout le monde se cache
c'est ça, c'est ça et tout le monde
se la tête en p'tite faite gaffe
bon on peut y retourner
incroyable
mais alors du coup
apparturement on commence à toucher
un peu aux anti cheats
là ils ont pas trop de
enfin ils rigolent plus
c'est là où ils se mettent à ban
hardware ban direct
et du coup en fait j'aimais pas
le code, déjà
il y a des moments où ça a désactivé un petit peu les cheats
et puis c'était pas
élégant comme solution
bon du coup en l'occurrence
sur quake il y avait
une partie de la mémoire
qui pouvait pas check-semer
parce qu'elle était générée
dynamiquement, il y avait
Just in time
à l'époque le jeu avait été fait pour marcher
sur windows linux et mac
et il y avait ce qui s'appelait des QVM
quake virtual machine et un peu
à la manière d'un navigateur internet
qui va compiler le javascript
et
transformer en instructions
pour améliorer les performances et la rapidité
quake faisait ça
et du coup ça c'était aussi
donc ça allait générer
du code
spécifique à la machine sur la quale
il tournait et donc là les anti cheats n'avaient aucun moyen
de connaître la valeur de faire une emprunte
donc je suis allé planquer un bon code
là dedans et puis ça
ça se... T'as trouvé un fourri
en fait ou se cacher
ou les gardes ne passaient pas
cette technique du coup
n'a jamais été détectée par punkbuster
d'ailleurs
encore aujourd'hui
t'as déjà vu des années plus tard
des cheats qui utilisent ce genre de choses aussi
ou...
la technique de l'injection de DLL
dont je parlais avant, vraiment basique
c'est un peu
les building blocks, c'est les choses qui marchent
qui sont utilisées aussi dans d'autres contextes
mais c'est des choses qui marchent toujours
après
c'est des choses qui peuvent se faire détecter
plus ou moins facilement
bébé, fais un tout petit peu ton micro
non, le B c'est plutôt...
en fait, il faut qu'on voit ta... sinon on te voit mon...
parle un petit bout
un deux, un deux
ce que c'est mieux là ?
non, en gros, ça fait une montagne
donc c'est plutôt la... en gros, tu peux le... vas-y vas-y
mais c'est nos micros qui sont un peu bizarres
comme ça ? non
voilà, nickel
merci, désolé
c'est un peu mieux
moi, on a eu un petit pas...
évidemment
sur certains, ce sera encore sur leur fin, sur la technique
mais bon, le but c'est pas non plus de perdre tout le monde
je propose de s'arrêter un peu
sur un autre aspect qui m'intéresse trop
c'est l'économie
qui a une économie dans le jeu vidéo
qu'en est-il
de la triche ?
est-ce qu'il y avait une économie déjà à l'époque, une sorte d'économie parallèle
où on pouvait acheter des cheats par exemple
c'était quoi, un peu les raisons
qui faisaient que
les gens s'intéressaient à ça ? est-ce qu'il y avait déjà de la compétition ?
c'était quoi les enjeux ?
alors, du coup, il y avait effectivement
déjà des compétitions
avec du prize money
et du coup, des compétitions qui étaient
entièrement en ligne
il y avait donc
des gens qui voulaient gagner
que ce soit pour des raisons monétaires
ou juste pour montrer qu'ils étaient les plus forts
et donc il y a des gens qui étaient déjà prêts
à acheter des cheats à l'époque
alors, c'était pas du tout le même business
que c'est maintenant, parce que maintenant
c'est des cheats
des cheats makers qui font ça professionnellement
ils font payer des abonnements
et du coup
dès que le cheat est détecté
ils promettent dans
donner accès à un nouveau
un détecté direct etc
et il y a des histoires
enfin, ça brasse
des centaines
voir des millions d'euros
donc c'est un gros business
à l'époque, c'était pas le cas
mais il y avait quand même quelques pertes
il y avait déjà des gens qui vendaient les cheats
mais c'était plutôt en mode one-off
je te le vends et il est indétecté aujourd'hui
après, est-ce que ça tiendra ?
il n'y a pas de déresse à vivre
parce que ça tiendra deux semaines, deux mois, deux ans, je sais pas
mais en tout cas, si tu en voulais un nouveau
tu repèreras, tu repasseras par la caisse
ça se vendait combien à peu près ?
100, 200 euros
pour des cheats publics
moi j'en ai vendu 500 euros
pour
c'était des cheats privates
donc ça, c'était des cheats que j'ai fait
pour une personne
avec des spécifications
qui m'a demandé
et du coup
c'était un cheat sur mesure
qui n'était pas du tout
distribué publiquement
ou autre et du coup
il y avait beaucoup plus de chance
de durer dans le temps
et de pas être détecté
et toi à l'époque, t'es étudiant ?
oui, moi toute cette activité
c'est quand je suis en école d'ingénieur
en gros
ça m'a payé des vacances au ski
et c'était sur quel jeu ?
sur Quake 3
et c'était un joueur pro ?
oui, alors là dans l'occurrence c'était quelqu'un
qui était dans l'équipe nationale de Suisse
et un autre
équipe nationale française
qui m'ont chacun demandé
des cheats avec des fonctionnalités
vraiment différentes
mais donc c'est des gens qui m'ont identifié
sur les forums de cheat maker
parce que je t'ai actif là dedans
pour échanger
des techniques, ou discuter
avec des personnes qui avaient un peu les mêmes centres d'intérêt avec moi
et donc
il m'ont envoyé un message privé
en me disant
est-ce que tu serais intéressé
pour me faire un cheat custom
avec telle et telle fonctionnalité
combien tu me vendrais ça
c'est trèsable
c'était quoi comme type de cheat ?
est-ce que c'était que des informations
en plus affichées à l'écran ?
ou il y avait aussi du comportement
du joueur, soit des déplacements, des tirs etc
alors de déplacements non ?
alors j'en ai fait 2
comme ça custom
le premier assez classique
il voulait un auto-shoot
donc l'idée
c'était pas d'avoir un namebot
parce que ça c'est
dans ces jeux là on peut facilement être en mode spectateur
et donc voir
les déplacements souris de la personne
et un namebot ça peut être assez risqué
ça se voit à quoi
si ça loque
et que ça vise tout le temps la tête
c'est vraiment trop facile de détecter
par contre un auto-shoot
où on passe la souris
et puis ça va juste
émuler un clic au bon moment
quand on passe juste devant la cible
ça c'est quelque chose qui
peut vous dire à détecter
parce que oui en gros il y a l'aspect
de la visée et du timing
donc là c'est un truc sur le timing
ça fait le timing pour nous
et donc ça c'est quelque chose qui est très efficace
pour là on voit le railgun
donc avec 3
ça c'est le tien
non ça c'est pas le mien
je connais par contre le développeur
qu'il a fait et j'ai pu en faire
mais les mien
étaient plus discrets que ça
parce qu'il faut dire que
quand un cheat est public
forcément il va se faire plus facilement détecter
parce que les discolisions internet que quand il est privé
l'éditeur de solution de détection
il le télécharge, il l'analyse, il le dépiote
et derrière il rajoute du code
de la logique pour le détecter
et est-ce qu'il y a des techniques
pour que justement
on a parlé du fait de pas se faire détecter
par l'anti-cheat
moi je trouve ça intéressant aussi de ne pas se faire détecter
en mode spectateur par les autres
est-ce que tu as dû mettre en place
donc là tu as parlé de l'autochoute qui est plutôt discrète
est-ce que tu as dû mettre en place des logiques particulières
pour justement parce que vu que c'est des joueurs pro
qui vont potentiellement être regardés
pour pas qu'ils se fassent détecter
en mode spectateur
j'ai fait les choses mais pour être
parfaitement honnête c'était assez expérimental
mais
je vois maintenant quand je regarde un petit peu
de temps en temps sur les forums de cheat actuel
des gens qui font
ce genre de choses aussi
mais l'idée est de donner un comportement plus
humain à un aimbot
et du coup de... donc moi ce que j'avais pu faire
en fait c'était de détecter
en fait quand je déplace la souris
je calcul déjà l'endroit de
où il faut viser pour
toucher, potentiellement
anticipant le
durée pour que les projectiles
atteignent la cible
ou est-ce que c'est un it scan
et est-ce que c'est instantané
il va falloir prendre en compte
et il va aussi falloir prendre en compte le lag
le temps de réponse avec le serveur
ça peut aussi
influer
donc on calcule l'endroit où il faut tirer
et à partir de là je regardais
quand je voyais que la souris
bougeait, si la souris bougeait pas
je faisais rien, si la souris
bougeait je regardais
est-ce qu'elle allait dans le bon sens
pour aller vers une cible et si oui
je l'ai décalé un tout petit peu
pour aller
exactement dans le bon sens
et du coup en fait
on déplace la souris sur le côté
et puis en fait si moi je vise pas tout à fait
bien en fait
le cheat arrive à
voir lequel je visais
et du coup MED un petit peu me guide
sur le bon chemin
un peu comme si il y a un effet d'attraction
ouais c'est un aimassiste
mais ce qui est marrant c'est que maintenant
les aimassistes donc
il y a une technologie de cheat
et intégrer de base dans beaucoup de jeux multijoueurs
pour notamment
avantage un petit peu
des joueurs console
par rapport à des joueurs pc quand il y a du crossplay
ou des choses comme ça
c'est vrai que c'est marrant que peut-être les premiers gens qui ont développé un aimassiste
c'était vous en fait
et ça m'a fait marrer
de jouer à Overwatch 2
et de voir qu'il y avait un perso
dont le pouvoir était de voir à travers les murs
je suis là maintenant les fonctionnalités elles sont en standard
c'est plus la triche c'est une fonctionnalité
il y a plus besoin de s'embêter
et ça c'est le premier exemple
pour le lanebot
il y a d'autres trucs de ce genre là
ou pour ne pas être détecté en live
qui existe
même sur le...
des déplacements peut-être
dans une control de ton cheat
je sais que
un cheat public tu veux peut-être avoir une fenêtre
qui se superpose au jeu
ou tu peux littéralement avoir une interface de contrôle
moi j'ai bien mis qu'un point genre pro
il veut pas ça quoi ça va le griller
alors quelque chose que j'ai moi j'avais demandé de faire
il y a
je sais pas si vous avez vu il y a pas très longtemps
il y avait un clavier
un clavier par Logitech qui s'est fait interdire
pour les compétitions pro
de Counter Strike
parce que
il y a des espèces de systèmes de macro
ou de auto-repeat
et là je crois que c'était pour le strafe gauche-droite
quand on appuie sur les deux boutons en même temps
mais là en gros ils avaient mis de la mécanique
à l'intérieur pour détecter qu'on était en train de faire ça
et pour rendre
plus rapide que ce qu'on a avec les vrais réflexes humains
bon et donc du coup
Valve a dit qu'il banait
l'utilisation de ces claviers
en
compétition
et du coup
à moindre mesure il y a des gens
qui faisaient par exemple
binder la molette à l'action de sauter
pour par exemple courir
et aller très très vite
dans des escaliers pour faire...
beaucoup plus vite que si on faisait pas ça
donc moi quelqu'un m'avais demandé
alors c'était vraiment un tout petit tweak
mais assez bas niveau
dans le netcode
de Quake
mais donc j'avais fait en sorte que s'il restait appuyé sur le bouton sauter
et que du coup ça activait une fonctionnalité qui disait une frame sur deux, je passe de sauter à pas sauter, sauter à pas sauter, sauter à pas sauter.
Et donc lui en fait il avait aucun effort à faire, il restait à plier sur son bouton et puis il montait les escaliers le plus vite que personne arrivait à faire.
Et donc ça c'était une fonctionnalité qui du coup d'un point de vue spectateur ne se voit pas, par contre s'il y a quelqu'un qui regarde le PC et qui regarde les mains,
bah là il envoie que tu commences à se faire taillons assez vite alors que tu n'as pu pas plier de fois sur le bouton. Donc ça ça serait visé.
Est-ce que tu sais si les joueurs font question, ça a marché ?
Ouais bah ils n'ont jamais eu de scandale pour cela, ils ne sont pas fait à essayer de se faire de voir.
Là toujours aujourd'hui personne sait que c'est des gens qui ont traché.
C'est drôle, je peux t'assurer que là il y a des enquêtes qui vont démarrer, bon c'est des gens qui sont en fin de carrière a priori.
C'était il y a 15 ans donc je pense que leurs carrières de joueurs pro elles sont déjà finies, de belles lures.
Il y a pas de problème, c'est incroyable et donc je pense qu'ils ont été rentables du coup parce que les 500 balles ils ont juste là en tête.
Parce que quand on y pense 500 balles, c'est pas tant que ça pour ça.
C'est pas beaucoup hein.
Ouais mais surtout que ça a marché pendant 2-3 ans et tu es revenu derrière et moi il n'y a rien.
Vous avez fidélisé les clients tu es en train de dire ?
Bah la qualité du travail, de revenir.
Déjà le sens de la relation client.
Ah c'est beau.
C'est le côté MBS.
Toi à l'époque les raisons qui font que tu fais ça ?
Moi je fais ça pour le fan, je fais ça pour le fan, je fais ça pour apprendre, je fais ça parce que j'ai envie de programmer en C et puis c'est les jeux que je joue.
Et du coup en fait je m'amuse à développer tout un tas de fonctionnalités que au bout du compte je n'utilise même pas.
Bon j'en ai vendu, j'en ai profité mais moi quand je jouais la plupart du temps j'acceptais pas de me faire aider et d'avoir des actions automatisées.
Ce que je faisais quand même c'était afficher des petites infos supplémentaires pour par exemple ne pas avoir fort de calcul mental pour savoir quand est-ce que telle armure va réapparaître etc.
On va avoir le petit display automatique.
Un décompte de 5K.
Et vu que j'avais fait tout le calcul, la prédiction où est-ce qu'il faut viser pour la ballistique.
Donc l'idée c'est qu'il y en a une personne qui va sauter comme ça, loin, j'ai un lance-roquette, en fait il va falloir que je vise pour que ça fasse que la roquette et la personne intersecte.
Le trajectoire est correct.
Tu voyais dans le futur en haut.
Et boom ça explose.
En fait ça affiche où est-ce qu'il faut que tu tires maintenant si tu veux que la personne se prenne le projectif.
C'est trop bien en vrai.
Donc ma justification, mania ou les trucs comme ça, qui sont que basés là-dessus, trop marrant.
Donc la justification c'était juste l'entraînement, c'est pour m'apprendre à être meilleur.
Ouais c'est ça.
Mais non mais promédegré, je sais que typiquement sur Rocket League ça existe des modes qui permettent de calculer, de savoir la milliseconde quand est-ce que ta voiture elle passe d'un état un autre, on peut pas changer dans le time.
Mais c'est un usage aussi, un usage des cheats c'est aussi pour s'entraîner.
Bon dans les feuilles il y a des gens qui vont, dans l'image des cheaters, c'est des gens en aimbot qui pourrissent les partis et donc je peux aussi comprendre que...
C'est un peu la majorité en vrai.
La majorité des gens qui ont tué ça, qui sont là juste pour gagner ou juste pour un espèce de dédiger de domination, écraser les autres.
Et aussi que ça ne peut pas durer longtemps.
Ça ne fait pas du plaisir à juste ruiner le pire des autres.
C'est un peu dommage.
Mais moi je n'arrive pas à comprendre comment ça ça peut durer longtemps parce que c'est comme je me souviens dans tous les jeux, dès qu'il y avait des cheat codes par exemple pour être comme ça, avec des gens illimités, le jeu perd instantanément tout son intérêt.
Et pourtant il y en a, il y en a partout des cheats.
Même encore aujourd'hui mais c'est un truc qui m'intéresse, c'est comment ça se fait que ça existe encore entre guillemets.
C'est à dire qu'il n'y a pas de solution, enfin qu'est-ce qui fait qu'il n'y a pas de solution technique définitive au problème de la triche ?
Alors, au bout du compte, une limite qui ne peut pas être...
Enfin comment dire ?
Ce que le programme client est censé faire, afficher le jeu et récupérer les données du clavier, de la souris pour savoir comment la personne se déplace, quelles actions elle fait dans le jeu, ça c'est quelque chose qui est toujours fait côté client.
Et donc ça en fait, ça c'est quelque chose sur lequel on pourra toujours jouer.
On pourra toujours aider ça, tricher sur ça, sur les déplacements, sur les clics, sur les actions qu'on fait, on pourra toujours automatiser ça.
Ils peuvent rendre ça plus ou moins difficile, ils peuvent détecter quand c'est fait mais au bout du compte, on demande au programme d'envoyer ça au serveur pour dire comment est-ce qu'on se comporte dans le jeu.
Donc ça c'est quelque chose qui ne pourra pas bloquer.
Après en fonction de la manière dont le jeu est programmé, la question c'est à quel point le serveur fait confiance au client ?
Et ça c'est un principe en sécurité informatique, on ne fait jamais confiance aux données clients, on les waitlist, on les filtre, on les nettoie, toutes les problématiques d'injection de code.
C'est la même chose pour un jeu vidéo, c'est-à-dire il ne faut pas faire confiance aux clients, il faut considérer qu'il est hostile et qu'il essaye de tricher, qu'il essaye de faire les choses qui devraient pas faire.
Donc pour donner des exemples, il y a beaucoup de jeux qui par facilité ou par souci de confort de l'expérience utilisateur vont faire confiance aux clients sur sa position dans le monde.
Parce qu'en fait quelque chose qui est très désagréable pour une personne humaine qui est en train de jouer un jeu vidéo, le lag.
Et du coup quand le serveur va dire en fait non, tu as même plus que du lag, tu avais du lag et tu as eu une erreur de prédiction, du coup je te téléporte, je te warpe.
Et donc ça fait un glitch graphique qui n'est pas du tout agréable, ça casse l'immersion, etc.
Donc il y a des jeux qui pour juste pas avoir à gérer ce problème, ils vont dire en fait je fais confiance aux clients pour savoir où il est dans le monde.
Comme ça lui il n'aurait jamais sur le glitch et c'est top.
Mais du coup ce que ça veut dire, ça veut dire qu'en fait on peut se téléporter, on peut voler, on peut bypasser toutes les lois de la physique du jeu des fois.
Et donc ça c'est si le serveur fait confiance aux clients sur ses coordonnées, c'est un problème.
Pour donner un exemple plus récent d'un jeu que j'ai adoré, auquel j'ai beaucoup joué, qui s'appelle Elite Dangerous, on a des vaisseaux dans l'espace,
il y a une simulation de la galaxie à l'échelle, c'est particulièrement techniquement intéressant.
Et un bel exploit technique.
Mais du coup pour des questions de coût, ils ont pour payer moins de serveurs en fait pour que ça leur coûte moins cher, ils ont fait une architecture pire-toupière.
Et du coup en fait il n'y a quasiment pas de serveurs qui est impliqué dans la boucle.
Et du coup toute la gestion des dommages, des boucliers, des dommages sur les vaisseaux, est faite de client à client.
Et donc en fait il y a un message réseau qui va dire je t'ai touché, et puis l'autre qui est censé répondre ok tu m'as touché.
Je te crois.
Et du coup il met à jour ses points de vie, son bouclier, est-ce que son vaisseau prend feu ou pas.
Et du coup il y avait des cheaters dans le jeu, eux ils avaient bouclé et infini, il y avait limité et puis ils pouvaient jamais mourir.
Donc là il fallait s'enfuir.
Donc ça c'était le coup d'une décision d'architecture réseau en fait.
C'est que le client avait autant de...
La source de vérité c'était le client.
Super intéressant. On avait eu...
Comment ça plait ?
Martin.
Non non non.
Il s'appelait aussi Martin.
C'était lui dont j'allais parler.
Colin.
Colin merci.
Je ne sais pas comment il l'a fait pour dominer.
On a eu un gars incroyable qui avait développé un cheat sur...
Ah oui sur Elder Scrolls.
Oui Elder Scrolls 9.
Il expliquait justement sur cette histoire de confiance client-server que la manière dont il avait résolu le problème c'est que le serveur du coup vérifiait si c'était physiquement possible.
Donc il y avait une sorte de vérification qui permettait d'éviter les rollbacks et en même temps avec tout un système de prédiction pour essayer de résoudre...
Pour essayer de vérifier la cohérence des événements du jeu.
Et à ce propos ça me fait penser à un truc qui était intéressant.
Je crois que c'était un des premiers MMORPG Star Wars auquel j'ai pas joué mais je connaissais quelqu'un qui faisait des cheats pour ça.
Et ce qui était intéressant au point de vue de l'architecture c'est que le monde MMORPG était divisé en zones et chaque serveur s'occupait d'une zone.
Donc en fait quand un joueur passait d'une zone à l'autre son fichier de personnage était transvasé d'un serveur à un autre.
En fait du coup il y avait une fenêtre temporelle où on passait d'un serveur à l'autre.
Et où en fait l'idée c'était je commence à rentrer dans cette zone.
Il y a un snapshot de mon personnage qui est pris à ce moment là et qui est envoyé au serveur avec des objets, de l'or, des choses comme ça.
Et en fait après je le drop par terre. Je drop et en fait avant que la migration soit effective.
Et du coup en fait quand on arrive sur l'autre serveur j'ai encore les pièces d'or dans l'inventaire et en même temps il y a l'or qui est par terre.
Et du coup ça pouvait dupliquer des objets.
C'est génial.
C'est génial.
Du coup l'or restait dans l'ancien serveur après il avait plus qu'à l'an.
Après il revenait et l'or est passé par terre.
C'est génial.
Donc ça c'est un bug de duplication c'est ça ?
Oui.
Effectivement et c'est encore une autre catégorie où il y en a plus.
Je me souviens dans Minecraft il y avait des bugs de duplication.
Faire les bonnes versions tu pouvais générer des diamants comme ça de manière limitée.
Souvent c'était avec de la TNT je sais pas pourquoi mais les explosions dans Minecraft c'était un bon moyen de voyousquer.
C'était un goût frappé.

C'était trop intéressant.
Et juste moi j'ai une question justement un peu sur ces différences de métier entre le hacking et le cracking de jeu.
Donc le cracking à savoir faire sauter les licences qui protègent le piratage etc.
Est-ce que c'est les mêmes disciplines ? Est-ce que c'est les mêmes communautés ?
C'est quoi un peu les différences ?
Alors non ça va pas être les mêmes communautés.
Par contre il va y avoir une discipline en commun qui est le reverse engineering.
La rétro-ingénierie.
Le fait de partir de code binaire, de comprendre comment ça fonctionne.
Ça c'est quelque chose qui va y avoir des deux côtés.
Ensuite donc les buts sont pas les mêmes.
Il va y avoir un certain nombre de techniques qui peuvent être similaires mais du coup c'est pas les mêmes buts.
Mais au bout du compte on va modifier un programme binaire dont on n'a pas le code source.
Et pour pouvoir faire ça il faut déjà comprendre comment il fonctionne.
Il faut voir les mécanismes de sécurité qui sont en place.
Portuellement des mécanismes de détection.
Et il va falloir trouver des manières de pas déclencher ça et de réussir à faire ces effets là.
Donc il y a tout un tas de similarités.
Mais ça reste des disciplines.
Je me demande si il n'y a pas aussi à trigimer une...
Je suis curieux de savoir ce que les uns pensent des autres entre guillemets.
Je pense que ce qui est le plus mauvais express doit être les crackers entre guillemets.
À quoi que je sais pas.
Sur le côté roi d'auteur tu vois.
Le cracker, vu de l'éditeur logiciel, c'est l'ennemi numéro 1.
Mais vu de celui qui télécharge un jeu parce qu'il n'a pas l'argent pour se le payer, c'est le Robin des bois.
Enversement le hacker c'est celui qui potentiellement brûle ses expériences de partie.
C'est ça.
C'est vraiment...
Et une autre catégorie de gens qui ressemble un peu en termes de rétro-ingénierie,
en fait c'est les développeurs de Malware.
C'est à dire qu'on n'a pas dit évidemment depuis le début.
C'est que plein de trucs que tu as expliqué sont des comportements genre l'injection, code dans un autre procès etc.
Ce sont des trucs que tu vas retrouver dans les développeurs de Malware.
Pareil les détecteurs de Cheats.
J'imagine des méthodologies qui peuvent ressembler à des analyses antivirus.
Mais justement j'aimerais avoir ta perspective là-dessus.
À quel point ces proches, ces choses-là et à quel point toi ça t'a servi
et ça t'a donné envie après pour ta carrière dans la super sécurité d'être passé par le cheat.
Ok.
Beaucoup de choses dans cette question mais effectivement, comme tu l'as dit, il y a un certain nombre de similarités.
Il y a tout un tas de techniques qui vont être vraiment quasiment identiques.
C'est juste qu'elles n'ont pas le même but.
Il y en a un, ça va être de cacher un comportement malicieux et l'autre, ça va être de concher chaque cacher un comportement malicieux.
Il y a le bon et le mauvais.
Pour donner un exemple un peu plus appliqué,
un Malware, quelle que soit sa finalité, soit un banking trojan,
que ce soit juste un rat pour donner le contrôle à distance sur la machine, plusieurs deux choses,
il va généralement vouloir être invisible, ne pas être visible de l'utilisateur,
après des solutions de sécurité aussi, des antivirus, des ODR, etc.
Mais prenons le cas par exemple de vouloir se cacher d'un utilisateur un petit peu averti.
Déjà il va commencer par ne pas faire de fenêtres, pas faire de craches, de bugs, de plantages,
d'autres choses qui pourraient être visibles.
Mais si on prend un utilisateur un petit peu plus avancé,
il va se dire que j'ai l'impression que mon PC est plus lent en ce moment,
je vais regarder dans mon gestionnaire de processus qu'est-ce qu'il tourne.
Et puis là il voit un truc qui s'appelle EvilMalware.exe.
Donc imaginons un Malware et on a envie de se cacher de ça.
Une des méthodes qui pourrait utiliser, on revient à notre injection de Ndl.
Mais donc là au lieu d'aller injecter du code dans un jeu, il va regarder les processus qu'il tourne.
Il va voir est-ce qu'il y a un gestionnaire de tâches qui tourne.
Et puis si lui il va envoyer une petite DLL dedans et il va détourner des fonctions.
Donc on voit bien, c'est exactement le même schéma que tout à l'heure pour un jeu de Lyon.
– C'est un truc classique ça. – Ouais, ouais.
– C'est marrant, je ne savais même pas.
– Et du coup on va hooker sur Windows NT Query Information System
qui est une des fonctions qui peut être utilisée
pour demander au kernel des informations sur les processus en cours.
Et du coup l'OS va renvoyer une structure de données qui va contenir une liste chainée
avec la liste de tous les processus.
Et du coup en fait si on hook cette fonction, on la laisse passer, on prend le retour.
Et puis là on parcour la liste chainée et on fait « ah, celui-là… »
– J'aimerais bien que tu l'aimes. – « celui-là il ne me plaît pas trop.
Alors je vais prendre Next, le chant suivant et je vais sauter celui-là
et puis le chant précédent de celui de la près. »
Hop, je vais le mettre. Donc c'est un link dans une liste chainée.
Et puis du coup on laisse passer ça.
Et alors ça c'est…
– La conclusion juste pour expliquer c'est que ton malware, il est bien toujours là,
le processus est bien toujours là. – Mais la ligne a disparu.
– Mais dans ton interface de gestion et de tâches, ça a disparu quoi.
Trop smart.
Donc ça, ça fonctionne.
Alors si on regarde un peu plus proche et qu'on regarde un snap-shot de la mémoire,
on va toujours voir les infos dedans.
Là on n'a même pas… enfin c'est grossier comme approche.
Mais bon que ça soit pour du cheat, pour du malware ou autre,
on fait le minimum nécessaire pour ne pas être détecté.
C'est pas très intéressant de déployer tout un tas de nouvelles techniques dans le vide
si on en a pas besoin.
– Et de fait un cheat aurait pas vraiment besoin de faire ça par exemple.
– C'est ça. Bah oui non, parce qu'à priori…
– J'ai une question. – J'ai pensé qu'on le tourne.
– On l'installe. À tout moment je te demande une fonction de la libre Windows.
– Oui ça va faire… ça va faire… ça va faire…
faut qu'on en parle, c'est exceptionnel.
– Tu fais des citations textes.
– Mais non mais oui, en plus tu fais pas d'erreur.
– Je suis en position. – Non, tu as Win32 dans la tête en fait.
– J'ai aussi toutes les fonctions POSIX, Linux, il n'y a pas de souci.
– C'est l'expérience mais effectivement tu as aussi commencé il y a un certain temps.
J'ai en arrivé justement à ton côté carrière.
À quel point tu dirais rétrospectivement que le fait d'avoir comme ça commencé dans le cheat de jeu,
ça t'a aidé à en faire un métier…
pour le coup « etique » ou tu vas aider justement à découvrir de l'immunabilité, etc.
À quel point ça t'a aidé quoi ?
– Bien, de travailler sur les cheats dans le jeu vidéo,
ça m'a permis d'apprendre beaucoup en fait.
Ça m'a permis d'apprendre beaucoup de choses qu'on allait pas m'apprendre à l'école.
À l'époque il y avait beaucoup moins de filières spécialisées en sécurité, quasiment pas.
Et du coup il fallait trouver, il y avait aussi moins d'informations disponibles sur internet,
des routemis, des choses, des challenges, des tutoriels,
il y avait de l'information mais il fallait chercher un peu plus, c'était moins accessible.
Du coup d'avoir des projets persos sur ce sujet m'a permis de me perfectionner en programmation,
en assemblant, en debugging sur la partie networking, aussi, réseau.
– Que des trucs super utiles en fait pour après ?
– Oui, etc.
Et du coup ce qui est marrant c'est que du coup chez Cineactive,
on a des gens qui viennent de plein d'horizon différents,
mais si on prend les gens qui sont là depuis longtemps,
et donc qui comme moi, avaient pas non plus de spécialisation,
de curseuse spécialisée en cyber sécurité,
il y en a qui viennent du monde du cracking,
il y en a qui viennent du hacking, il y en a qui viennent du cheat-making.
Mais du coup en fait on avait besoin d'apprendre ça par nous-mêmes,
et du coup ça c'était une manière parmi d'autres d'être exposés à toutes ces connaissances.
– C'est vrai que c'est effectivement très marrant quand tu découvres un peu le monde de la cyber,
tu te rends compte qu'il y a des communautés qui sont là en fait,
et vraiment tout le monde était sur les mêmes forums en fait,
à un début de 2000.
– Tout le monde entendait un hacker qui s'est fait quand il était plus jeune,
ou il a ce qui traînait, tout le monde très intéressant de savoir d'où il vient,
comment il a appris.
– Mais effectivement peut-être que ça va être un peu moins le cas pour les générations d'après,
ou il y a plus de curseuse.
– Bah ils ont moins besoin parce qu'il y a plus de curseuse, etc.
Mais pour le coup je fais pas mal de recrutements,
alors si j'ai un conseil à donner à Ojan, c'est de le cheat.
– Le cheat.
– Non, pas du tout.
Mais c'est de pratiquer et c'est de pas s'arrêter à ce qu'ils vont voir en cours,
parce que ça va pas suffire.
C'est d'avoir une passion, un axe, quelque chose qui, voilà, un projet perso,
juste une opportunité de mettre en pratique ce qui peut avoir appris et vu en cours,
et surtout d'avoir envie de continuer à creuser, d'apprendre des nouvelles choses,
parce que c'est comme ça qu'on complète,
et qu'on apprend.
– Et dans les faits, quand tu poses dans la civer,
tu es très souvent confronté à une énigme,
ou tu n'as pas un cours qui te donne la théorie de comment tu vas faire.
Et donc c'est exactement ça qui aide aussi quand tu fais du cheat
ou quand tu fais tout ce que tu as expliqué.
T'es dans cette position de, j'ai aucune info,
l'éditeur me donne rien, j'ai pas de code source,
et je dois me démerder quoi.
Et ça ressemble à un challenge.
– Un challenge, ouais.
– Trop intéressant, merci énormément d'être venu nous raconter tout ça, c'est trop cool.
On aimerait te garder évidemment encore longtemps.
– Avec plaisir, merci.
– Mais c'était une d'émissions qui était bien longue.
J'espère que t'es apprécié.
– Ouais, très sympa, merci beaucoup.
– Et bah une prochaine fois peut-être,
de façon on sait qu'on entendra encore parler de vous.
Et donc voilà, à prochaine fois.
– Tu sais que, tu sais, ce sujet, on a fait un appel à expert,
et tu m'avais dit que l'appel a été…
– Relayé en ordre.
– Relayé en interne sous synactives.
– Ce qui est une très bonne chose,
c'est que je trouve heureux,
peut-être qu'on recevra d'autres jours de synactives du coup,
parce qu'on commence à avoir des portes qui se sont ouvertes des deux côtés.
– Trop bien.
– Du coup, trop bien, merci beaucoup à vous.
– Merci d'être venu.
– Bah d'accord, on a un plaisir.
– Et voilà, peut-être à une prochaine fois avec grand plaisir.
Moi je vous souhaite une très bonne soirée,
j'espère que vous avez kiffé ces trois sujets.
Et on se dit à dans deux semaines,
à la fin du 19h, merci Mathieu.
– Bah merci beaucoup à toi.
– Et puis voilà, très bonne soirée à vous.
Tues, au revoir.
...

Episode suivant:

ChatGPT vocal est inutile — Jean‑Louis Quéguiner (Gladia)

Les infos glanées

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

Underscore_

IA, Hacking, Robotique — Des conversations de terrain avec ceux qui construisent. 🥨

Partenariats: underscore@micorp.fr

---

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Card title

Lien du podcast

[{'term': 'IA', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Investissement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Nouvelles Technologies', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Actu tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Cybersécurité', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Développement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Dev', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Entreprenariat tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'IT', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Robotique', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere