Ce que j'entends le plus souvent de la part des recruteurs c'est
Mais attendez Pierre, LinkedIn c'est surtout un truc de cadre qui bosse dans les bureaux non ?
Je leur réponds que sur LinkedIn il y a 90% des professionnels français,
des cadres mais aussi des ouvriers, dans l'industrie, les services, le privé et le public.
Par exemple si un recruteur recherche un magasinier à Rennes,
il lui suffit de lancer une recherche sur LinkedIn recruteurs et il en a plus de 800.
On m'a même déjà demandé s'il y avait des magiciens sur Poitiers.
Eh ben j'en avais deux. Avec LinkedIn, recrutez des bons profils plus vite.
Rendez-vous sur LinkedIn.com.
recrutez mieux.
Aujourd'hui je vais vous parler de découvertes récentes que j'ai fait et de nouvelles applications
qu'on a sur les LLM. Alors va falloir ça accrocher un tout petit peu parce que là on est en train
de, à chaque semaine qui passe, à chaque émission London Score, on rentre de plus en plus dans la
méta de jusqu'où on peut aller finalement avec les chat gpt, gpt4 et compagnie.
On a gratté la surface pendant longtemps sur les possibilités de ces outils-là.
Et là on est en train de commencer à voir des gens passer beaucoup de temps à construire des systèmes
vraiment complexes.
Et justement vous allez voir, on verra un aperçu qui permettra de vous montrer l'étendue de ce qui est possible.
Alors juste j'ai perdu mon streamdake. Je ne sais pas pourquoi mais c'est un problème.
C'est un problème surtout si à tout moment on perd la vidéo.
Non c'est bon ça revient.
Ce que j'aimerais essayer de vous montrer c'est pourquoi les jeux vidéo telles qu'on les
connaît actuellement vont radicalement changer dans le futur notamment grâce à des nouvelles
technologies qui sont en train d'être construites autour des technologies de chat gpt des LLM.
Et notamment d'une façon d'utiliser ces outils qui s'appellent les agents autonomes et l'autoprompting.
Je vous explique.
Donc ça part déjà d'un premier concept qui est l'autoprompting.
Concrètement, qu'est-ce que c'est ?
C'est le fait d'utiliser une IA pour générer des prompt qui vont eux-mêmes être utilisés sur l'IA.
Vous me suivez ?
C'est une implication d'IA dans une IA.
Exactement.
C'est comme si vous demandiez à chat gpt génère-moi 10 prompt qui permettrait de demander à une IA d'effectuer telle action.
Déjà ok c'est un peu méta.
Par exemple, comme je crois que tu avais suggéré, demander à gpt génère-moi des prompt pour midjournée.
Exactement.
C'est un des premiers trucs qui a été tenté.
Midjournée c'est un bordel, il y a plein de paramètres à connaître, de tournure de phrase etc.
On gagne du temps, on donne la documentation de midjournée à chat gpt et on lui dit à partir de ça maintenant
génère-moi des belles images.
Et ça marche plutôt très très bien.
Donc ça c'est un truc que les gens sont en train de tester déjà depuis des mois et des mois.
C'est l'auto prompting.
Ce qui est arrivé plus récemment ce sont les agents autonomes.
Donc concrètement le principe c'est que tu vas voir un système de boucle.
Ou un agent, c'est donc un programme autonome qui n'est pas simplement un chat.
Donc on connaît tous l'interface du chat avec chat gpt où on pose une question, c'est un bon réponse.
Là c'est un système autonome qui utilise entre autres chat gpt mais qui va avoir d'autres outils.
Imaginez donc un outil de recherche sur Google.
Imaginez un outil de génération de d'exécution de code plutôt.
Et on pourrait imaginer d'autres outils comme ça des briques autonomes qui ont une fonction
qui peuvent être utiles à un agent autonome qui fait sa vie.
Maintenant imaginez qu'on connecte les deux.
Donc la capacité de comprendre du texte et gpt4 et des outils qui sont en mesure d'accomplir des actions.
Imaginez qu'on combine ces deux choses-là plus de la mémoire.
Donc le fait de stocker des informations sur la longue durée.
De mémoriser des prompts entre emets ou des faits.
Vraiment, c'est un peu obscur à comprendre.
Mais dites-vous qu'il y a plusieurs briques et que des gens ont trouvé des moyens de connecter tout ça ensemble
pour faire des cycles de réflexion et pour permettre à un agent de manière autonome de tendre vers un objectif.
Je vous propose de vous faire une démonstration afin que ce soit beaucoup plus clair.
Donc je vous partage mon écran d'ordinateur et notamment un site web qui s'appelle agent gpt.
Et qui est une manière pour tout le monde de très facilement tester ce concept-là des agents autonomes dans leur navigateur.
Alors je vous le dis tout de suite, il y a des limitations.
Notamment ces outils dont je vous ai parlé, les recherches Google, l'exécution de code etc.
Actuellement, lui il les a pas parce que c'est dans un navigateur.
Mais vous pouvez facilement en ajouter si c'est sur votre machine.
Exactement.
Donc je vous propose de faire un petit exemple.
Celui-là je vais l'appeler MyCodeGPT et on va dire que sa mission c'est de développer un jeu vidéo.
Qui fait quoi ?
Faut donner un exemple de jeu vidéo.
Un jeu vidéo like ou...
Ce que vous voulez, ce que vous voulez de...
Qu'est-ce qu'il fait à ce jeu vidéo ?
Il faut construire un vaisseau spatial pour aller sur...
Ça me bute parce que j'allais faire les vaisseaux spatiaux aussi.
Dessigne de la destination.
On n'a pas d'idée.
Designer un vaisseau spatial pour aller sur Mars.
Faites très Elon Musk comme volonté ça.
On est vraiment très orientés.
Wow !
Il y a un problème.
Il y a plein de faute bref, on s'affoue.
J'ai donc un nom MyCodeGPT et une mission qui est floue, long-téâme...
Enfin voilà, on...
Ouais, ouais, ouais.
Tu me dis ça, je sais pas par où je commence, tu vois.
Mais voilà, je donne ces deux informations.
Et là je fais deploy agent.
Donc ce qu'il commence à faire c'est think.
Donc il va avoir une réflexion sur le goal.
Et il va tout de suite ajouter un gros détache.
Donc il va tirer de cet objectif long terme des sous-taches.
Faire des recherches et faire un design de gameplay.
Alors je vous préviens, ça va aller très vite.
Donc il faut que...
Il met les résultats de chacun de ses cycles.
Exactement, donc là il réfléchit très vite évidemment.
Tout est automatisé.
Donc on va passer étape par étape doucement.
Donc d'abord il veut faire des recherches sur du gameplay avec des mécaniques.
Il peut être intéressant pour du shipbuilding.
Il faudra aussi faire une interface utilisateur avec de la construction et de la customisation.
Foudra développer des graphiques sans 3D pour préparer le jeu.
Donc là il a ajouté des tâches.
Ensuite il va recommencer son cycle avec une première action qui est...
Là du coup une action, ça se voit avec le petit bouton play.
Executing research and design gameplay mechanics for shipbuilding and exploration.
Il arrivait à la conclusion qu'il faudrait du crew management, des mécaniques d'exploration etc.
À partir de ça, il en détruit qu'il faudrait développer un système de scoring pour vérifier le progrès des joueurs.
Détainment un truc pour récupérer des ressources.
Faire des objectifs d'exploration qui lui permettra d'avoir des ressources pour build son vaisseau.
Et il va continuer comme ça.
C'est long hein !
On a demandé un truc là.
Et en fait c'est long et surtout c'est infini.
C'est à dire que là il est en train de détailler l'ensemble de sous-étapes qu'il s'est autogénéré.
Donc à chaque fois il passe par ses étapes de trouver des tâches, les exécuter avant une réflexion sur ce qu'il vient de faire.
Voir si il va faire des nouvelles choses etc. Et ça en cycle infini.
Et ça veut dire quoi du coup exécuter la tâche dans...
Alors là si je... Regarde si je vais tout à la fin.
Oui.
Quand tu sais aussi que l'infini à un moment il s'arrête.
Enfin un moment il a fini la tâche non ?
Non. Justement.
Là c'est là où il y a énormément de recherches actuellement pour voir comment guider ce genre d'agents en combinant du coup des outils puissants et une capacité d'auto-observation et d'auto-réflection pour arriver au goal final.
Actuellement celui là...
Il s'arrête pas.
Pour l'instant il s'arrête pas.
Mais tu vois qu'à la fin il est sur des sous-sous-sous-sous-sous-taches qui sont vraiment très très précises.
Et qu'il n'aurait jamais été en mesure de formuler si tu lui avais tout de suite demandé l'objectif de générer un jeu vidéo.
Donc là il est en train de vouloir développer un système pour tester et équilibrer le gameplay entre l'accumulation de ressources, la construction et l'exploration.
Pour que l'expérience soit quand même agréable pour l'utilisateur.
C'est pas mal pour découper un projet.
C'est ça exactement. Là vraiment tu peux donc je vais l'arrêter.
Tu peux le régister et récupérer une réflexion ultra avancée sur un problème complexe avec énormément de tâches sous-sous-taches et de réflexion.
Qui auraient été impossibles d'obtenir en première instance.
Evidemment parce qu'on a tous essayé de demander des choses un peu complexes à tâches GPT.
Et on sent bien qu'il n'a pas une capacité d'auto-analyse et d'autocratique quand il n'est pas guidé.
Là l'idée c'est un peu de se dire on enlève vraiment la supervision de l'équation.
Et enfin un sort qui s'auto-supervise constamment, qui fasse des observations, qui tire des actions, qui l'exécute des actions, qui l'auto-analyse le résultat des actions etc.
Donc là dites vous que ça c'est les premiers tests qui ont été faits par des gens.
Ils sont dit bah regarde et si on faisait une boucle et qu'on le faisait auto-générer des promptes à l'infini, qu'est-ce qui se passerait ?
Salut ! Si vous appréciez Ender Score vous pouvez nous aider de ouf en mettant 5 étoiles sur Apple Podcast,
en mettant une idée d'inviter que vous aimeriez qu'on reçoive. Ça permet de faire remonter Ender Score.
C'est d'une fusée. Maintenant ce qui devient vraiment ouf, c'est quand on rajoute des outils.
Donc par exemple la capacité à faire des recherches Google, la capacité à exécuter du code et à tester du code etc.
Donc là imaginez que les étapes où il y a un petit play vert, ce soit plus juste générer un prompt,
ou là bah voilà il va pas être en mesure d'avoir des actions réelles sur le monde.
Ça reste de la génération de texte dans son cadre à lui.
Imaginez maintenant que ces actions ça puisse être faire une recherche Google.
Donc là peut-être qu'il va se renseigner sur comment faire des bonnes mécaniques de gameplay.
Il va récupérer les recherches Google, obtenir un résultat, il va s'en reserver pour générer peut-être des nouvelles tâches.
Imaginez ça à connecter à de la génération de code par exemple.
Je me dis on peut lui demander créez-moi un site internet pour tel usage et en fait à la fin tu peux avoir ton site internet.
Et il aura toi, tu sais pas ce qu'il a fait exactement pendant tout son déroulé mais peut-être qu'il aura fait des recherches sur l'optimisation du SEO,
qu'il va prendre ça en compte, il va peut-être faire des recherches sur ta cible, sans que tu lui demandes exactement.
C'est ça qui est fou. C'est pour ça que tout le monde a vu ce truc là et est devenu un peu dingue.
Ok ok ok, attend qu'est-ce qui est réellement possible ?
Et là évidemment c'est compliqué de prédire exactement ce qui va être possible parce que ça pose pas mal de problématiques en gros.
Ces agents autonomes qui se créent eux-mêmes des sous-taches à l'infini.
Notamment la première chose qu'on peut voir comme problème c'est que les hallucinations,
donc mettons 85% du temps, imagine que 85% du temps, ils génèrent des tâches cohérentes.
Ça fait que une utération, tu vas avoir des bons résultats, 2 itérations, 3 itérations, 4 itérations,
tu peux avoir des déviations de ton agent et que le bruit devienne non pas de plus en plus faible mais de plus en plus fort.
Le rapport final sur bruit, c'est vraiment ça.
Imagine tu connectes ça à des API, des trucs, un minimum critique de l'exécution de code etc.
Ça pose quand même pas mal de questions sur à quel point tu peux faire confiance à ce genre de système autonome.
Comment ne pas perdre le contrôle de l'agent.
On ne sait pas exactement quels vont encore être les applications court-termes possibles de ce genre de truc.
Mais il y a pas mal de gens qui essaient de construire ce qu'ils appellent des mini AGI.
Vous savez AGI, quelle est la tradition de ça ?
Les gens artificiels générales.
Exactement.
C'est un peu le goal ultime que tous les milliardaires essaient de créer.
Il y a plein de gens qui se disent, est-ce que c'est pas la première brique d'une forme d'intelligence poussée qui pourrait avoir des réelles actions tout en ayant une capacité d'autoréflection etc.
Donc il y a plein de tests dans ce sens qui sont faits.
Mais pour l'instant, le truc le plus prometteur, en fait, c'est dans le jeu vidéo.
Il y a notamment un papier qui est sorti il y a pas très longtemps.
Ou concrètement, ils ont essayé de faire un mini Westworld.
Je sais pas si vous connaissez la série Westworld, mais ils ont pris 25 agents de ce type-là.
Ils leur ont donné une personnalité, donc c'est des petits bonhommes, des petits PNG en fait, comme dans un jeu vidéo.
Ils leur ont donné une personnalité, un but dans la vie, des relations entre eux etc.
Qu'ils ont probablement généré par Ian aussi d'ailleurs.
Ensuite, ils leur ont donné des capacités de mémoire et ils les ont tous mis dans une petite villa.
Voilà, que vous pouvez voir juste au-dessus. Donc ça ressemble à un genre de Pokémon.
Sauf que là, exactement, là, il n'y a pas de joueur.
Vous n'avez absolument aucun impact sur ce monde-là.
Vous avez juste à regarder ce qui s'y passe.
En tout cas, c'est ce qu'ils ont fait pour ce papier-là.
Et donc on peut cliquer sur les petits personnages pour savoir à chaque instant
qu'est-ce qu'ils sont en train de penser, qu'est-ce qu'ils sont en train de faire et les éventuelles conversations qui ont avec les autres.
Ok.
Je vous donne juste deux, trois détails techniques, mais ça explique la suite.
Ils ont une capacité d'auto-réfliction justement.
Donc ils ont dans leur mémoire des observations sur le monde qui leur entoure.
Donc sur ce que font leurs voisins, sur ce qui se passe dans leur petit monde virtuel.
Et à peu près toutes les 100 slots de mémoire, ils vont s'arrêter et essayer de tirer des enseignements de réfléchir à ce qu'il aurait arrivé.
Et ces enseignements, enfin ces réflexions, vont devenir des nouvelles étapes de leur mémoire.
Ok.
Et en gros à partir de ça, juste avec ces quelques briques de base, il y a des comportements hallucinants qui émergent naturellement
dans cette petite villa, qui on le rappelle, mais qui n'est pas aucun humain.
Par exemple, un moment ils organisent une fête de la Saint-Valentin.
Tu as une meuf à un endroit dans la maison qui décide d'organiser la fête, qui va prévenir les autres, etc.
Et fun fact, à la fête, il n'y a que cinq personnes qui se pointent sur onze.
Juste, il y a 11 personnes qui disent oui, il y a cinq personnes qui se pointent à la fin,
et les autres ne savent pas trop pourquoi ils ne sont pas venus, mais voilà, ils ne sont pas venus.
Comme de la vraie vie.
Mais oui, c'est ça, c'est incroyable. C'est que ça ressemble de fond à la vraie vie en fait.
Un autre exemple hallucinant que j'ai vu, c'est un moment, il y a un personnage qui demande à un autre,
c'est qui la personne, s'il avait une heure à passer avec quelqu'un, ce serait avec qui ?
Dans la villa. Ça ressemble un peu à un truc de théorité, mais...
Et au début, il a simplement une première réponse qui lui vient, en gros, c'est son voisin de chambre,
qui est la personne avec qui il a eu le plus d'interaction récemment.
Mais après, donc, il a une réflexion.
Et il remarque que parmi les autres personnes de la villa,
il y en a une autre qui semble avoir un intérêt commun avec lui, c'est le fait de faire des recherches.
Donc voilà, c'est des chercheurs sur des sujets différents, mais il se rende compte qu'il a un point commun avec une autre personne de la villa.
Et donc il change ta vie, et finalement, il arrive à la conclusion que ce sera plutôt Wolfgang que je sais plus comment ça s'appelle l'autre.
Et vraiment, tu vois, des comportements comme ça, et tu es en « what the fuck ».
Et vraiment, les briques élémentaires ne sont pas complexes. Donc il y a de la mémoire.
Il y a un système de notation de la mémoire, c'est-à-dire que c'est assez marrant de voir le prompt.
Concrètement, ils notent eux-mêmes la mémoire.
C'est pas l'humain qui dit « ok, le fait d'aller faire des courses est moins important que le fait de rompre avec sa copine ».
C'est eux-mêmes qui, quand ils observent des faits dans le monde, leur donnent des notes de 0 à 10 sur « ok, cet élément est très important dans ta vie, il faut que tu le t'en souviennes ».
Et cet élément n'est pas si important, tu peux l'oublier en fait.
Attends, ces notes-là, comment elles sont données, t'as dit ?
Elles sont générées.
Non, avec le modèle, juste.
Ah oui, mais avec le modèle, mais...
On vous mettra le prompt et le prompt, t'y dis « ok, notes de 0 à 10, cette observation que tu viens de faire ».
Et ça peut être « une telle a fait des courses ou alors on vient de rompre avec toi ».
Et lui, tout seul, il va prioriser l'importance de la mémoire pour s'en servir, pour prendre des décisions plus tard et tout.
C'est vraiment assez hallucinant ce qui est capable d'émerger de ce genre de trucs.
Et surtout, ça va permettre, évidemment vous me voyez venir depuis le début,
ça va permettre des expériences prochaines dans le jeu vidéo, on sait à quelle vitesse ça va, qui vont être hallucinantes.
Je sais pas si vous avez déjà joué à Assassin's Creed, mais dans Assassin's Creed, ils ont essayé récemment de mettre un système de conséquences.
Donc en gros, si tu fais certaines actions dans le jeu, tu ne vas pas avoir la même expérience, le même scénario que les autres joueurs.
Par exemple, tu as une mission ou tu as le choix de sauver ou pas une famille qui a la lèpre, je crois.
Si tu as le malheur de le faire, ton île entière devient infecté pour le reste du jeu et ça devient un enfer.
Donc vraiment, tu n'as pas le même jeu vidéo que les autres.
Exactement, tu n'as pas le même jeu. Le truc, c'est que ça a toujours été limité.
Oui, en fait, tu as quand même un choix, même s'ils veulent rendre le truc ultra riche, ils te donnent 15 choix différents, mais tu as quand même que 15, enfin impossible.
Alors que là, avec les IAS, c'est infini.
Exactement, et ces choix vont être toujours fait par choix multiples.
Donc tu auras 3 possibilités, qui, mi bout à bout, font 15 arbres différents, mais déjà c'est un enfer à coder, ce genre de truc.
Bravo à eux.
Et ensuite, ça reste vraiment limité sur les modifications et les expériences uniques possibles.
Imaginez, un jeu où, si vous tuer un PNJ, vous revenez plus tard, ils ont tout seul décidé d'organiser des funérailles, par exemple.
C'est possible ?
Oui, oui.
C'est possible, et il n'y a aucun développeur qui a eu l'idée de son côté tout seul.
C'est juste, vous, votre interaction, la somme des toutes petites actions que vous allez effectuer, qui vont vous donner une expérience de jeu complètement différente.
En fait, c'est un second live, mais avec des PNJ, pas avec des humains.
C'est trop marrant que tu parles de ça, parce que moi, ça m'intéresse énormément dans les jeux vidéo, parce que les jeux de roue, j'aime trop ça et tout.
Et il y a un jeu qui est sorti il n'y a pas très longtemps, qui est basé uniquement sur ton interaction.
Alors, j'avais vu une vidéo, en gros, t'es un enquêteur, et tu dois enquêter sur...
Il vient de se passer un truc, je crois, qui a eu une bombe qui a explosé dans un métro, et toi, t'as réagi avec les gens dans la ville, mais donc t'as ton casque, t'as ton micro et tu leur parles.
Trop bien.
Et en fait, en fonction de ce que tu dis, ils te répandent, et les réactions, alors ils ont tous, comme tu disais, leur histoire à eux, leur motivation personnelle,
et en fonction de leur objectif dans le jeu, ils ne vont pas te répondre la même chose, ils ne vont pas dire...
Et donc toi, tu dois vraiment enquêter, pour le coup, poser des vraies questions, et ça, c'est des jeux qui sont en train de sortir en ce moment, qui sont en bêta.
Moi, je vois un potentiel de... Déjà que c'est dur d'émerager de jeux très prenant, mais là, je vois un potentiel de disparaître et de fuite duretant,
de fuite duretant, vraiment infinie.
Et surtout que... Exactement. Et surtout que ça pose des questions au-delà du jeu vidéo, en réalité, puisque... Ça va comme moi, c'est pas ça.
Mais imaginez qu'on arrive à un niveau, à un moment satisfaisant et très très très convaincant de réalisme dans les interactions sociales.
Et on est déjà à une situation pas mauvaise, parce que dans le papier, ils ont fait noter à quel point on trouvait réaliste ou pas des interactions humaines de roleplay, et les IA gagnent.
C'est-à-dire que là, ce qui était généré, en termes de conversations de roleplay comme dans un jeu de roleplay, et bien ce qui était généré par les agents autonomes,
semblait plus convaincant en termes d'interactions humaines, que des gens qui essaient de faire du roleplay.
Tu vois.
Ça m'étonne pas du tout.
Les agents sont déjà meilleurs pour simuler les interactions humaines.
Imaginez que ça commence dans le jeu vidéo. On peut imaginer qu'assez rapidement, sur Internet, on pourra voir des comptes d'utilisateurs interagir entre eux,
avoir des conversations, des vies, des posts, des tweets qui seront entièrement simulés, et on n'a aucun, mais aucun moyen de le savoir.
C'est fini l'histoire des bots qui ne sont pas crédibles. Il pourrait y avoir une portion significative d'Internet qui est de l'interaction simulée,
potentiellement pour vous faire acheter une marque, quelqu'un qui, dans ses conversations dans ses tweets, insinuera des choses,
vous vous infléchira vos orientations politiques.
Des influenceurs.
Des influenceurs, du coup.
C'est ce que je vais dire.
Mais pas, même pas des personnalités publiques et connues, simplement, un amas de fausses personnes qui sont des...
qui, à elles toutes, sont d'une influence.
Mais du coup, c'est la fin des influenceurs humains.
Je sais pas.
Ça fait plus peste histoire.
En tout cas, on peut peut-être imaginer qu'il y ait besoin d'un deuxième Internet, en fait, dans très longtemps,
ou même pas si longtemps, que il y a...
Exactement, un Internet réservé aux humains, où il faut montrer pas de blanche avec un système d'authentification de fou.
C'est marrant parce que ce réservé aux humains, jusqu'ici, c'était une blague.
Je sais pas pourquoi ça me sonne comme une blague, je crois que je l'ai déjà vu quelque part, sur des memes ou des quoi,
ou des trucs comme ça.
On arrive dans le monde de demain avec la ségrégation entre les...
Les robots et les biens.
Et les humains.
Et tu peux donner une transition, tout trouver vers la réaction à ce papier qui m'a le plus fait exploser le cerveau.
Imagine, dans ton jeu vidéo, à un moment, les IA en discutant entre elles, elles se rendent compte qu'elles sont dans une simulation.
Ok, là on est pas mal.
Voilà, donc c'était les petites découvertes que j'avais faites sur les agents autonomes qui s'auto-alimentent
et qui ont des souvenirs.
Je ne sais pas ce qui va se passer ensuite, mais c'est sur UnorScore qu'on vous le racontera.
Ah, beaucoup trop vite.
J'ai vu des bonnes blagues sur le chat.
Ah, vas-y, vas-y, ça a parlé de les IA à Nikonos, la villa des corps brisés.
J'ai vu toute votre créativité, je voulais pas t'interrompre, mais bien jouer, franchement.
C'est beau.
Mais c'est vrai que ça ressemble à du Ricky Morty, en fait.
Ouais, j'ai vu passer aussi.
On est en train de se muter en...
Ricky Morty.
Bonne nouvelle.
Je ne sais pas.
Les 7000 clients comme Konto, Alane ou Pigment utilisent Vanta pour gérer leurs activités de risques et de sécurité en temps réel.
Obtenez 1 000 $ de réduction en vous rendant sur vanta.com.
Vanta.com.
Vanta.com.
Vanta.com.
Vanta.com.
Vanta.com.
Vanta.com.