Pourquoi Banque Populaire est la première banque des entreprises ?
Je me posais des questions sur le partage de la valeur pour mes salariés.
Elodie, ma conseillère Banque Populaire, m'a proposé une solution d'épargne salariale sur mesure,
rapide à mettre en place et que je peux piloter en ligne.
C'était simple et surtout ça a fait des heureux.
Accompagner nos clients sur tous les territoires avec des solutions adaptées à leurs besoins,
c'est ça, être la première banque des entreprises, Banque Populaire, la réussite est en voulue.
Étude Quantar PMEP, mid-2023, Quatorze Banques Populaires, Première Banque des PM.
Je vous préviens que vous n'êtes pas prêts.
Quand tu as dit Balaine, je t'ai pas prêt.
Vous n'êtes pas prêts pour ce sujet.
Petit briefing, t'iles, j'ai pas mal, j'ai pas de temps d'y luxer,
mais j'en ai quelques-unes avec des... du son quand même.
Notamment la première, si tu veux la préparer tranquille.
En vrai, je vais pas vous en tirer près.
Je vais te laisser.
Donc, parce que on a fait quand même toute une vidéo en expliquant qu'on allait faire super yaf,
anochronique, etc.
Je me retrouve en position de traiter d'un sujet dont je ne suis pas du tout expert,
mais vraiment pas, s'il y a quand même un lien avec de lier,
à un moment, vous allez voir.
Mais j'espère ne pas dire de bêtises.
Je pourrais potentiellement t'envoyer des perches pour expliquer certains concepts dits.
Du coup, c'est super la loupse si j'arrive pas à aller le catch.
Mais, ça va bien.
Je vais te faire...
Un sandwich par le chat.
On va tout de suite voir la non-expertise au top.
C'est avant tout ici la bienveillance et au pire, on comprend un montage.
Balance-moi sous les roues du camion.
Je vous vois, ne t'inquiète pas, globalement,
globalement, on va parler de plein d'autres choses que d'y a.
C'est juste qu'il y a un petit moment au deux où ça peut être cool.
Je vous l'ai dit, aujourd'hui, on va parler de baleines,
on va parler du règne animal.
Ce n'est même pas une blague.
Mathieu, tu m'as demandé si c'était les baleines dans la crypto.
Mais non, non, je parle bien des vraies baleines.
Et je vous propose de commencer avec un petit enregistrement.
Ce que vous venez d'entendre,
c'est le son que produit une baleine à boss.
Est-ce que je peux guesse ce que tu vas nous raconter ?
Vas-y, essaye.
C'est un guesse.
Ça va être une y a qui essaie de comprendre le langage des baleines ?
Peut-être.
Peut-être que...
Tu es très fort, tu es très fort, tu sais.
L'étude de ces bruits, ça s'appelle la bioacoustique.
Et en fait, c'est l'étude des sons que produisent les espèces non humaines.
Et dans l'objectif de les décrire,
de comprendre mieux leur comportement, leur population,
leur structure de groupe pour ces espèces qui vivent en groupe.
Et c'est un domaine d'études qui est particulièrement intéressant
chez les Cétacés.
Parce qu'on sait qu'ils utilisent les sons dans de très nombreux aspects de leur vie.
Que ce soit pour communiquer, pour chasser, pour se repérer
avec de l'écolocalisation.
Bref, le son se propage en plus très bien dans l'océan.
Donc, à plus de 4 ou 5 fois la vitesse du son dans l'air.
Et on peut le capter comme ça à plusieurs kilomètres voire plusieurs dizaines de kilomètres.
Donc c'est très intéressant d'aller justement étudier ça et comprendre
comment les animaux sous-marins émettent des sons.
Et en fait, on a réalisé dans les années 70 que les baleines émettent des vocalisations
sous forme de phrases.
Dans le sens où il y a un ordre structuré qui est comme ça parfois à répéter plusieurs fois
entre individus et entre groupes.
Ça déjà, c'est un premier indice intéressant.
Et déjà à l'époque, ça a posé plein de questions.
Genre, est-ce qu'il y a des baleines qui influencent les autres ?
Est-ce que tu es une sorte de hiérarchie ?
Par exemple, on a remarqué que tu as des chants de baleines qui buzzent,
donc tu vas voir, elles vont se répandre dans tout le Pacifique
et venir remplacer le chant actuel de certains groupes.
On peut voir des sortes de proto-influence culturelle
sur les sons qui mettent les baleines.
Mais évidemment, à ce stade, on n'a encore aucune idée
de ce qu'elles disent et du contenu de ces phrases.
Ni même si on peut vraiment appeler ça langue.
C'est un mystère complet.
En fait, la recherche a surtout commencé par s'intéresser au dauphin.
Donc c'était dans les années 60.
Il y a notamment l'armée américaine qui, dans un contexte aussi de guerre froide,
lance un programme d'études pour les utiliser peut-être en détecteur de mine.
Vous avez peut-être entendu parler de ça.
Et faire d'autres tâches.
Mais c'est surtout un gars qui va faire beaucoup parler de ce domaine de recherche
qui est devenu depuis un peu tristement célèbre,
parce que c'est John Lili.
C'était un sacré personnage,
parce qu'il avait des résultats normaux,
intéressants dans les dix premières années de sa carrière.
Au début, ils pensaient qu'il serait peut-être possible
de leur apprendre l'anglais au dauphin.
Il avait notamment un programme financé par la NASA,
qui voyait un domaine intéressant aussi
pour comprendre peut-être un jour des langues extraterrestres.
Le fait de s'intéresser à une nouvelle espèce
de partir un petit peu de zéro, pour ceux qui ont vu le premier contact,
il y a un peu ce côté-là qui a probablement motivé la NASA,
notamment avec le programme SETI,
qui s'intéresse à tout ce qui est venu
et potentiel l'existence d'extraterrestres.
Mais au-delà de l'imitation sonore,
qui ont réussi à reproduire dans certaines expériences avec des dauphins,
qui imitaient des mots,
ils n'ont jamais réussi à prouver
et à démontrer qu'ils avaient une compréhension
du sens sous-jacent de ces mots, de ces vocalises.
Et surtout, après, il est parti complètement en vrille.
Je ne sais pas si vous avez déjà entendu parler de ça,
mais moi, j'ai complètement halluciné
juste que l'information de cette histoire ne me soit jamais parvenue.
En fait, c'est lui qui a inventé le principe des caissons
d'isolation sensorielle.
Donc le concept d'être dans une haute température corporelle
et de se priver au maximum de sens.
Donc lui, au début, c'était une sorte de casque tuba
avec un système de couche
pour des faits qui étaient hiérénés, etc.
pour rester vraiment des jours dans le truc.
Et en fait, il était persuadé qu'avec ça,
en prenant du LSD,
avec des dauphins,
ça pourrait avancer, ça recherche, tu vois,
et les aider à communiquer.
Ce n'est pas une blague.
Et surtout, le souci, c'était la partie
sur la masturbation des dauphins.
Wow !
Oui, oui, ceci n'est pas une...
Deux fois qu'on dit bon, c'est...
Ceci n'est pas un lapsus.
En fait, c'est ça qui a déclenché la plus grosse controverse
et qui a fait stopper son programme avec la NASA.
Il était avec une jeune chercheuse
qui l'assistait dans ses recherches
et qui vivait quasiment tout le temps avec le dauphin.
Si certains découvrent cette histoire,
ils vont vraiment péter leur crainte.
Et le truc, c'est que
le seul moyen pour que l'individu en question
s'intéresse à l'expérience
plus qu'à l'expérimentatrice,
c'était de s'occuper
manuellement de ces plus-chose-quoi,
pour qu'il s'aurait intérêt à l'expérience.
Attends, donc tu parles des dauphins, là ?
Je parle du dauphin, sujet de l'expérience,
et de l'assistante, qui apparemment
les dés.
En fait, ça fait un tolet médiatique,
évidemment,
surtout dans des Etats-Unis assez puritains, etc.
Et le programme a fermé,
et de toute manière,
il n'y avait pas d'avancée majeure
qui était faite en fin de parcours.
Mais tout ça est extrêmement documenté
dans les bouquins du gars, etc.
Pour savoir un peu les...
Mais ça donne une ambiance aussi
de la recherche à l'époque
où il y avait beaucoup de tests
avec de l'acide ou de l'ISD.
Quel année ?
Dans les années 60.
Depuis, je vois sûr,
on a fait pas mal de vrais avancés,
très intéressantes,
mais rien encore de révolutionnaires,
mais on a quand même compris certaines choses
par rapport à ces espèces
assez crétacées et à d'autres espèces.
Un premier truc intéressant,
ça s'appelle la loi de Zipf.
Vous avez déjà entendu ça ?
Zipf.
J'ai découvert ça,
récemment, dans une vidéo de Vissau,
et c'est un principe
qui dit que,
dans une langue,
n'importe laquelle,
tu prends n'importe quelle langue humaine,
tu retrouves
un pattern spécifique
sur la distribution des mots.
Donc le premier mot de la langue anglaise,
c'est the
et le second mot
va être utilisé 2 fois moins.
Tu vois.
La moitié du temps.
Et le troisième, un tiers fois moins.
Un tiers de la distribution du premier.
Et tu peux observer cette courbe là,
sur la langue anglaise,
c'est super facile.
Tu prends par exemple au Wikipedia,
le projet Guttin d'air,
tu prends à peu près n'importe quel texte
suffisamment massif pour qu'il y ait un effet statistique
et tu vas retrouver l'exact même distribution
des mots que tu as.
Donc ça, ça vaut pour l'anglais,
mais on s'est rendu compte que ça va aller pour toutes les langues.
Tu prends n'importe quelle langue.
Tu observes la même loi
en français, etc.
Et en fait, c'est cette loi là,
on dit que c'est
une version discrète de la loi de Pareto.
Et en fait, ça se retrouve dans
plein d'autres choses que la langue.
Mais c'est potentiellement
un élément intéressant
pour savoir si
un signal
est une communication
ou pas.
Pour faire très concrets,
on s'est rendu compte notamment que les grandophins,
les orques et les baleines à bosse
ont dans leur phrase
respecte cette loi de ZIP
Exactement.
Et donc ça prouve pas que c'est une langue
qui parle avec une langue.
On sait juste qu'il y a
une propriété statistique
que ces phrases de baleines ont
que nos langues humaines ont aussi.
Voilà, c'est pas...
Exactement, c'est un point commun.
C'est quand même intéressant pour savoir si
c'est vraiment une communication riche
ou pas.
Mais on est encore loin de prouver
que vraiment c'est une langue symbolique.
Comme nous on utilise, il y a des concepts
qui sont mappés à des objets
de la réalité.
On est très loin de prouver ça encore.
Mais si ça map cette loi statistique
et qu'on n'est pas sur
un random complet
ça veut comme...
Un sinu quand même
un sens.
Potentiellement
une logique en tout cas.
Ce qui est sûr c'est qu'il y a un sens
caché, il y a un sens à ses communications.
Mais ce qui intéresse le plus les chercheurs
c'est de savoir si
c'est simplement de limitation
par... Si c'est
simplement une communication par association
genre
que tu vas retrouver avec beaucoup d'animaux
tu vois, ton chien
tu sais que tu peux lui apprendre
des différentes commandes
genre au pied, à si, tourne
et avec ton langage corporel
plus le son
on sait que
dans un sens
la communication de l'humain
vers le chien
elle peut déjà porter du sens
mais c'est
relativement
pour
pauvre comme discussion
et là la question c'est de savoir
est-ce que derrière ce cache vraiment
une langue plus complexe
Est-ce qu'on peut m'appeler du coup
les mots, enfin les sons
qui sont les plus fréquents
en fonction de la
situation dans laquelle
ces phrases sont exprimées
Eh ben justement tu vas voir
c'est
tout le but de la recherche c'est de comprendre un peu mieux
quand est-ce qu'un son est produit
et voilà
c'est le tout début
et là justement on est encore assez tôt dans la recherche
à la fin du siècle dernier
tu vas voir que ça va améliorer
après il y a des trucs intéressants ensuite
et un des éléments
en plus de cette distribution
qui semblait être assez proche
des langues humaines
c'est que si tu prends par exemple les caches à l'eau
c'est quand même un animal qui a un cerveau
qui est 6 fois plus grand
que le cerveau humain tu vois
et qui a des zones vraiment super développées
ce qui
ce qui vous laisse
présager des
potentielles capacités
qui ne sont pas les mêmes que celle
de ton chien
ou de certaines espèces de singes
etc
t'as notamment une équipe de chercheurs d'airwine
qui a fait des enregistrements de caches à l'eau
et qui avait une théorie
qui est
intéressante mais pas forcément très
baquée
du tout en fait
comme quoi ce qu'on appelle les CODA
donc c'est les séquences de cliques
émis par les caches à l'eau
qui font plein de cliques successives
à très très faibles intervalles
ils pourraient en réalité
contenir des
potentiellement des échantillons
de ce que leur sonar capte
ça c'était une première théorie
qui pourrait
donner un indice de
ce qui est contenu
dans les transmissions
de certains c'est assez
comme ils voient déjà le monde avec ce sonar là
et ben
ils pourraient peut-être
être mappés sur
ces communications mais ça honnêtement
c'est carrément de la spéculation à ce stade
un autre truc qu'on sait
c'est que
les dauphins s'appellent
entre eux par leur nom
en fait ils ont un concept de nom
et qui vont l'utiliser
non seulement l'un avec l'autre
mais aussi à la troisième personne
il peut dire
Michael est allé au...
on est capable
de savoir visiblement via la recherche
que c'est un
ils ont un hommage qui n'est pas uniquement
en cas de discussion direct
c'est énorme
une capacité à parler à la troisième personne
il faut mettre des gros guillemets à chaque fois
pareil on sait que les mamans
péroquets
quand elles donnent des noms à leur petit
et qu'elles leur
murent à l'oreille jusqu'à ce qu'ils s'en souviennent
ça c'est un truc
qu'on a réussi à démontrer
qu'il y a un hommage
chez les bébés péroquets
un autre exemple qui est incroyable
c'est une étude sur
des mouvements de population
de cet assais sur les côtes de la Norvège
où ils arrivent à montrer que
t'as un groupe tous les ans
ça se reproduit tous les ans
t'as un groupe de pseudo orcas
c'est des faux orcs
c'est un nom de l'espèce
qui ont une certaine langue
et qui rejoignent
un groupe de dauphins
qui ont eux aussi leur propre langue
faut mettre des guillemets à la langue à chaque fois
et il semble que quand ils se rejoignent
ils créent un groupe de chasse
et qu'ils adoptent une troisième
typologie de phrase
et de son...
On peut se comprendre entre eux
d'une certaine manière
c'est comme si
ils avaient
une soulange commune
un peu comme la lingua franca
des marchands d'Europe
qui avaient une sorte de dialecte
pour se comprendre
malgré le fossé linguistique
de l'espèce
du peuple
pour les hommes
que l'on sait si c'est la même langue
entre guillemets tous les ans
ou en fait si tous les ans ils reconstruisent quelque chose
en commun
ce qu'on sait c'est que
ces paternes là
ces phrases là
elles sont très
immuables
et elles se transmettent même de générations
en génération
et donc d'où l'exemple
que je vous donnais d'influence culturelle
où t'as des musiques par exemple
des chants de baleines qui se
propagent dans le pacifique
t'as vraiment
une transmission
de ces paternes
quoi
il y a même un gars qui
alors c'est un français j'ai oublié le nom
donc je ne vais pas pouvoir remettre l'illustration
mais qui raconte que
justement depuis des années
étudie les caches à l'eau
et ils ont réussi à
identifier certains paternes précis
donc par exemple t'as un paterne à 8 clics
et ils savent le
reconnaître
et ils arrivent à l'associer à un comportement
qui est en gros un câlin
entre deux femelles
ou entre une maman et son enfant ou entre une nounou
et son enfant cachalot
et donc ils sont quasiment sûrs que
dès que t'entends ce son
à 90% tu vas assister à une scène
de câlin qui suit
tu vois
donc on est déjà
avant qu'on commence à parler d'intelligence artificielle etc
on n'est pas du tout au niveau
0 de la recherche
on comprend
on a déjà une intuition que des choses
se cachent derrière ces
dernières séçons évidemment
il y a une autre étude très intéressante
de 1994 de l'université de Hawaii
qui l'apporte sur des dauphins
et en gros ils ont appris
deux gestes aux dauphins
le premier c'est
fait quelque chose que tu n'as jamais fait avant
dans la session courte
donc en gros Innova
fait un mouvement ou un tricks
qui est nouveau
dans la séquence actuelle
ce qui est fou c'est que déjà
le dauphin comprend le concept
très abstrait
de quelque chose de nouveau
c'est à dire il comprend la négation
et il a la mémoire
de tout ce qu'il a fait avant
donc il comprend quelque chose qui n'est pas dans ce qu'il a fait avant
donc déjà en fait
c'est déjà fou cognitifement de se dire
qu'un dauphin est capable de ça
mais ensuite
ils apprennent à ces deux dauphins
un deuxième geste qui est
fait quelque chose ensemble
donc ta
première geste c'est fait quelque chose de nouveau
que tu n'étais jamais fait avant
et deuxième geste qui peut faire à deux dauphins
c'est fait quelque chose ensemble
et donc après il les combine
il leur dise
à ces deux sujets
fait quelque chose de nouveau
ensemble
donc les gestes croissaient ça
et de fait
ce qui a été observé
c'est que les dauphins se retirent
et changent probablement des
informations de
sonique
on ne sait pas
tout ce qu'on sait c'est qu'ils remontent
et ils font le même tour
de façon simultanée
oui
oui
dingue
on l'a dit fait quelque chose de
c'est sûr
ça pose pas une question
parce que du coup
ça veut dire que leur langue
doit être assez complexe pour
signifier et pour décrire du mouvement
je suis sur un truc nouveau
donc en fait
et attend du coup il faut faire super gaffe
parce que c'est pas forcément une preuve
qu'ils utilisent un langage symbolique
mais il y a un côté
où en gros ce qui dit le
président de l'ONG
qui
parlait de ça sur le podcast de Joe Rogan
et ce qu'il explique c'est que
potentiellement ça déplace
la charge de la preuve
ça veut dire qu'il faut maintenant
prouver
quel autre moyen
qu'une langue riche et symbolique
pourrait permettre
d'obtenir
une synchronisation
et pour l'instant
on n'a pas vraiment d'idées
moi je dirais
le rasoir d'ocam
en fait
des fois
sur un problème qui est complexe
parfois
l'explication la plus simple
c'est peut-être la
si on essaie de trouver
une autre façon d'expliquer ça
autre que par le langage
on commence à partir
mais c'est vrai que scientifiquement
il faut essayer
de prouver le truc par la négative
mais c'est compliqué
ça ne prouve rien
mais c'est quand même un élément
très perturbant
et qui demande maintenant
à aller prouver le contraire
quand t'as dit il se retire
on sait
il retourne dans l'eau
du coup c'est pas possible qu'il y en a un
qui montre un mouvement
et du coup l'autre il fait le même
juste après
je pense qu'ils ont des caméras
ils ont enregistré les échanges
sonores
c'est une bonne question
je pense que là on est en 80
94
non pas du tout
donc là l'idée même
d'avoir une interprétation
de ces signaux
ils en sont à des années lumières
ok
ok
ouu
il y a quelque chose qui s'est produit en 2017
quelque chose dont on parle
souvent ici
et qui va changer un truc
assez fondamental dans
le rapport qu'on a avec
les langues et les communications
qui répond notamment à la question
comment traduire une langue
qui n'a pas de pierre de rosette
comment faire une traduction
sans exemple
et bien justement
ça c'était pas possible avant 2017
l'idée même était absurde
mais il y a 2 papiers
à la suite coup pour coup qui ont prouvé la chose suivante
c'est qu'une y a est capable de traduire
n'importe quelle langue humaine dans une autre
sans aucun exemple
de traduction
c'est comme ça qu'on a eu des percées de fous
dans des dialectes ou des trucs comme ça
avec très très peu de données
et pour comprendre ça
faut comprendre le fonctionnement plus profond de ces modèles de langage
qui fascinent tout le monde aujourd'hui
et en gros faut réaliser que
le y a
les y a qu'on utilise aujourd'hui
permettent de transformer des relations
sémantiques en relation géométrique
je sais pas si t'avais vu en fait ces papiers à l'époque
mais
vous avez peut-être vu des représentations
de la langue dans un espace vectoriel
ce qu'on appelle les embeddings
exactement
ça ressemble à ça donc c'est des simulations
alors dites vous que c'est dans un espace
deux dimensions
alors qu'évidemment
alors que la manière
dont on encode
les mots des langues etc
c'est dans des espaces bien bien bien plus grands
donc là c'est juste un moyen
d'avoir une intuition
de comment ça peut fonctionner
et vous avez ici tous les concepts
de la langue positionnés
dans un espace géométrique
donc si on zone dedans on peut voir certains mots
t'as une recherche notamment
donc si tu cherches genre
roi par exemple
il y a des fortes chances
que proche du mot roi
on est des mots comme
reine ou couronne
ou voilà qui ont
sémantiquement
qui sont assez proches
et ce qui est assez fou c'est que
et encore tous les gens qui font de lia
le servent très bien évidemment
c'est que derrière
appliquer des relations mathématiques
à ces notions sémantiques
donc par exemple si tu fais
roi plus femme
littéralement dans l'espace vectoriel
tu fais roi plus femme
tu vas obtenir reine
et tu peux faire des combinaisons
comme ça
ce qui est juste
une autre manière de dire on a encodé
des liens sémantiques
avec des liens géométriques
et donc
est ce que les gens ont réalisé
et ce qui est justement conduit à
à ce truc dingue
qu'on peut faire des traductions sans exemple
c'est qu'il semble
que entre différentes langues
entre différentes nuages de pont
il existe
une sorte de structure fondamentale
là où on pourrait se dire
dans mais là en anglais ou en français
on décrit tous
une réalité complexe avec
un truc aussi créatif
que la langue
il n'y a pas de raison que ça se produise
mais en fait ce qu'on observe
c'est que
cette structure
qui décrit la langue
et la manière dont on décrit le réel
avec une langue
elle a un paterne
qui se ressemble dans toutes les langues
toutes les langues humaines
donc si tu mets les visuels d'après
on peut voir qu'on est capable de
c'est évidemment une illustration
en 2 dimensions pour comprendre le concept
mais qu'on est capable de faire
matcher
différentes langues
et les mots suivant leur position
dans l'espace
sémantique
dans l'espace vectoriel
et donc
pour s'imaginer c'est comme si
on utilisait notre
connaissance de comment
des mots sont positionnés
par rapport à tous les autres mots d'une langue
pour comprendre
une autre langue sans aucun
exemple qui permettrait de faire les ponts
mais juste parce que cette langue aussi
va décrire
va positionner de la même manière
des mots dans son propre espace
si vous pouvez se dire
Salut, si vous appréciez Endorscorp vous pouvez nous aider de ouf
en mettant 5 étoiles sur Apple Podcast
en mettant une idée d'invité que vous aimeriez qu'on reçoive
ça permet de faire remonter Endorscorp
telle une fusée
si vous pouvez rajouter un peu de contexte
parce que c'est super intéressant
à la base quand on entraîne des LLM
il n'y a aucune indication sur ce que veulent
dire les mots, en fait on ne donne pas les définitions
des mots
ce qu'on fait avec un LLM
c'est qu'on lui donne plein d'exemples de comment on
utilise les mots dans un contexte et en fait c'est ça qui est super
intéressant c'est que les mots ne sont pas reliés
à une définition, ils sont
définis par leur usage dans la langue
mathématiquement parlant
et c'est ça la nuance
c'est qu'en fait parfois un mot peut avoir
une définition particulière quand tu regardes
dans un dictionnaire alors qu'en fait
son usage dans la langue
parfois peut changer
par exemple en français
je prends un exemple qui potentiellement
va parler à tout le monde mais le mot « mère »
on l'emploie dans plein de contexte
différent et pas forcément pour parler
d'une mère
vous avez plein d'exemples
qui doivent poper dans votre exprès de comment
on peut utiliser ce mot mais en fait
c'est utilisé parfois dans des contextes très différents
et en fait c'est
l'usage de ces mots dans le contexte
qui crée
la complexité
de notre langage et de la sémantique
de nos langages
et en fait
ce qui se passe dans un LLM quand on arrive
à mapper ces mots dans l'espace
et par que en 3 dimensions
mais dans milliards de dimensions
c'est qu'on arrive
à extraire le sens sémantique
et en fait
on n'a pas besoin d'avoir les définitions
c'est pour ça qu'on peut mapper
différentes langues entre elles
c'est parce que dans le monde
ce qu'il y a de commun
dans notre façon de communiquer
c'est le monde dans lequel on vit
les objets qu'on voit, les interactions
et tout ça et en fait c'est pour ça
que les LLM sont très bons pour faire de la traduction
c'est parce qu'en fait ils traduisent pas
littéralement chat
avec chat ou chien avec chien
c'est qu'ils arrivent à les...
les LLM arrivent à remettre dans leur contexte
et dans leurs usages les mots sémantiquement parlant
et du coup ils comprennent beaucoup plus
que juste la définition des mots en particulier
et donc
si on comprend bien ça
pareil pour un
langage animal
que nous on ne comprend pas du tout
on peut mapper ces mots-là
avec leurs usages
donc en fait on comprend les sons
on peut comprendre les sons
si on arrive à les mapper
sur d'autres langues
c'est super intéressant ce que je m'en fais
en fait même
une manière de s'imaginer le truc
c'est probable que dans n'importe quelle langue
la notion de parentalité
par exemple ou la structure familiale
des trucs culturels
sont universelles
et donc doivent
être retradius
dans cet espace
multidimensionnel
où les poids vont être similaires
alors vous avez vu c'est pas exactement pareil
c'est-à-dire que typiquement tu prends
une langue comme le japonais
qui est particulièrement
éloignée de langue latine
et bien
ça colle pas tout à fait
mais c'est quand même suffisamment proche
c'est ça qui est le plus
étonnant en fait
et ce qui va faire la différence
c'est la culture
entre les différents pays du coup
les usages des mots mais
il y a un truc c'est que
avec les dauphins on a
certaines choses en commun avec eux
par exemple l'exemple de maire
et bien on l'a en commun
avec les dauphins
comme on l'a en commun
avec n'importe qui dans le monde
peu importe la langue qu'on parle
et en fait si ce que tu disais de tout à fait
on peut parler d'un individu
et on peut même en parler à la troisième personne
apparemment dans le langage
des cetacés apparemment
et bien du coup
on pourrait potentiellement mapper le son
qui font en parlant
de quelqu'un
qui a un rapport familial
avec toi et ce serait potentiellement
le même mapping dans les autres
langues que ce soit en français
en anglais en japonais tout ça
et bien c'est exactement l'espoir
des gens qui
sont en train de se poser sur
c'est incroyable
t'as notamment une organisation qui s'appelle
the Earth Species Project
qui est une ONG
dans la city of Cône-de-Vallée
qui sont justement des gens qui viennent avec ce bagage
IA, NLP et voilà l'analyse de la langue
et qui vont en voir tous les chercheurs
dans le domaine de la
compréhension
de la compréhension
des sons mis par les animaux etc
et qui leur proposent de les financer
en échange d'ouvrir leurs données
ce qu'ils expliquent c'est que
pour
pour démontrer que
cette intuition est vraie
et qu'il y a vraiment des potentiels
ponts tout comme on arrive
à traduire du japonais et du français
pour prouver que potentiellement
il y a un pouve entre eux de l'anglais
et des langues animales
il faut
de la donner et il faut en fait
beaucoup beaucoup beaucoup plus que ce qu'on a actuellement
il prenait un exemple c'est que
une des espèces les plus étudiées
c'est les belougas les plus enregistrés
et en fait 97%
des enrichestrements
partent à la poubelle
pourquoi ? parce que
il y a ce qu'ils appellent
le problème de la soirée cocktail
je trouve ça à mourir de rire
mais en gros
dans beaucoup d'enregistrements
il y a non seulement du bruit ambiant
mais t'as surtout beaucoup d'individus
qui parlent en simultané
c'est comme si tu foutais un micro
dans une grosse soirée
tu comprendrais pas du tout ce qui se passe
qui est en train de parler de qui
avec qui sont les individus
ce serait horrible pour étudier ça
on sait que
c'est bien connu en machine learning
à la fin le seul truc qui compte
c'est la donnée
et donc il faut absolument commencer
par résoudre ce problème pour espérer
avoir le moindre résultat
tout comme on a vu
l'explosion de charge EPT
vient du fait qu'on a des trillions de tokens
et des bases de données gigantesques
de l'angu'mène à leur fournir
ici vous imaginez même pas
à quel point on est loin de ça
si t'exemple
avec un enrichissement de belou gauge
justement
en fait là
c'est un beau bordel
il y a beaucoup d'individus
de deux ou trois individus
pour rendre un enrichissement inutile
et que le...
il n'y a pas un moyen de pouvoir
extraire chaque...
j'arrive j'arrive
j'adore parce que tu préchautes
toute ma chronique
la solution que cette ONG a notamment imaginé
c'est un outil de débrouillage
biologique
vous connaissez peut-être les IA
qui permettent d'isoler une voix humaine
sur un enrichissement
c'est très utilisé par exemple actuellement
par les beatmakers
qui veulent faire un remix
d'une chanson mais qui n'ont pas le multipiste
donc ils ont pas la voix isolée
ils adorent ce genre d'IA maintenant
qui marche mais incroyablement bien
pour prendre le son
extraire juste la voix humaine
et ben en fait ils ont fait un outil
qui utilise des principes assez similaires
au niveau technique mais pour des sons animaux
du coup ça s'appelle BIO CPP net
et c'est un outil open source
que vous pouvez utiliser sur github
et qui permet
d'isoler
des sons non pas humains mais animaux
d'un enrichissement
donc si tu as un petit lien youtube
tu peux mettre
avec des animaux domestiques
si je dis plus
ajoute
attend remont au tout début parce qu'en fait on a
je pense qu'on a entendu la version finie
on va voir
ok
c'est cool hein il analyse, il reconnaît la voix
il y avait deux chiens qui étaient en train
d'aboyer en même temps et il est capable
d'identifier les différences individuelles
et d'extraire la partie
du son qui est intéressante
trop bien
et en fait ça c'était
un gros problème faut s'imaginer c'est comme
on était assis sur une mine d'or
de données
desquelles on pouvait rien tirer
jusqu'à
des projets de ce genre
il y a
un autre problème très important
c'est la mesure de performance
pour pouvoir avancer
c'est un truc que le grand public connaît pas forcément
mais on y a pour que un domaine de recherche
progresse il faut absolument un truc
qui s'appelle un benchmark
c'est un outil
donc de mesure qui permet d'évaluer la
performance d'un nouveau modèle
et en fait ça sert un peu d'étoiles polaires
pour les chercheurs
si on n'a pas c'est juste impossible
de faire avancer les choses et d'ailleurs
si je fais un pont avec les modèles type
charge-gpt que tout le monde connaît
et ben on est justement en train
d'atteindre les limites des benchmarks
existants
notamment on arrive plus bien à mesurer
quelles modèles sont plus utiles
que telles modèles
simplement un exemple pour montrer
que vraiment les benchmarks c'est
pas le plus fun
mais c'est hyper important pour savoir
si un nouveau modèle
ou un nouveau papier
va dans le bon sens
plutôt dans le bon sens exactement
et là encore ils ont proposé le premier benchmark
de ce genre pour
des tâches de classification et de détection
donc
concrètement tout ce qui est
prendre un enregistrement et
isoler
la partie
d'un animal intéressant
enfin je viens de confondre
avec le projet d'avant mais tout ce qui est
classifié, quel animal est en train
de produire un son sur un enregistrement
ou à quel endroit
de l'audio il y a quelque chose d'intéressant
et ben tu peux
utiliser ce benchmark pour
tester tes modèles
et en fait
ça peut paraître anodin
les outils dont je viens de parler
surtout qu'on vient de parler de potentiellement
générer
de la langue
d'animaux enfin ça a l'air
créer un chat de botte de balaine
ça a l'air génial et ça fait rêver
comparé à ça
mais en réalité c'est hyper important
parce que c'est notamment
pour passer d'une méthodologie
un peu manuelle
à l'ancienne ou pour
avoir de la donnée des chercheurs
doivent faire des enregistrements audio eux-mêmes
genre passer la journée près de Champanzé
tu vois pour espérer
avoir des extraits
c'est nécessaire d'avoir ça
pour passer
des enregistrements manuels
à déposer un micro
dans un arbre
le faire enregistrer toute l'année
et à la fin
passer des modèles
pour cliner
extraire seulement les morceaux intéressants
plusieurs espèces simultanées en gros
pour massifier la quantité de données
ce qui est un enjeu absolument nécessaire
pour avoir des bons résultats
il faut passer par ça
par des modèles un peu à l'ancienne
qui vont déjà nous permettre
d'augmenter les data sets
ce qui est
assez perturbant
ce qui explique le gars
de l'oenjao question c'est que c'est probable
une fois qu'on va réussir à faire tout ça
et on est bien parti pour
on pourrait se retrouver dans une situation
où on a des modèles
d'IAgénératives
qui sont capables de générer
des paternes de baleines et des choses comme ça
qui serait
parfaitement valide
qui serait interprété en face
par des individus tu vois
moi évidemment je comprends parfaitement
mais dont nous
n'aurions aucune foutue idée
de ce qui signifie
parce que je veux dire
en fait
on sait qu'avec des échantillons suffisants
il y a des fortes chances qu'on soit en mesure
de générer comme ça
des sons
uniques qui ne sont pas simplement
du
du
je sais pas ils ont un nom spécifique les scientifiques pour parler de ça
mais c'est le fait d'enregistrer un son
de Cachalot par exemple et de le
rejouer
en espérant vous
observer des comportements particuliers
etc
là on serait en mesure de
créer des sons
qui seraient compris par les autres
et qui serait parfaitement unique
parce qu'il serait un peu la première version
d'un chatbot de baleines
si on simplifie le truc
sauf que ça veut pas du tout
dire qu'on va comprendre ce qu'on dit
oui enfin
ce sera encore probablement très très loin
ce
ce step là
si il existe un jour
parce qu'en réalité il faut mettre des
pensettes un peu à ce que
fait cet ENG et notamment ce que dit
son confondateur
il y a pas mal de scientifiques
qui pour l'instant restent assez sceptiques
sur la possibilité que se cachent
des langues cachées complexes qu'on ne comprendrait pas
et qui
vont parfois le critiquer
sur le fait
d'anthropomorphiser
des comportements
qui en réalité
ne devrait pas vraiment l'être
et lui faut dire que son job c'est
justement de lever des fonds pour financer
cette recherche là en NIA generative
et donc il a tout intérêt
à mettre le maximum de hype
sur le fait que
ça va fonctionner et qu'on va trouver des choses
etc. mais
comme tu l'as dit
sur le principe en tout cas
ça ressemble à
beaucoup d'autres
découvertes qu'on fait
dans d'autres domaines
on pourrait s'imaginer que NIA generative
va effectivement pouvoir faire avancer
ce champ de recherche là mais la réalité
c'est qu'on ne sait pas.
En fait je pense que
je suis complètement dans une hypothèse
mais ce que je pourrais
voir à peu près
dans ce domaine de recherche c'est que
si on arrive à faire un vecteur embedding
de ces mots
donc on crée token
et on crée
un espèce de mapping
dans l'espace de ces mots-là
on pourrait potentiellement
extraire des
patteurs géographiques
qui pourraient correspondre
à certains patteurs qu'on retrouverait dans des langages
et il y a un truc aussi
c'est qu'on n'a pas
tu vois les CTSC
ils n'ont pas
une expérience du monde comme la nôtre
c'est...
ils n'auront pas de mots
pour voiture ou avion
mais il y a certains concepts qu'on a en commun avec eux
comme par exemple la parentalité
je sais
et je pense que
c'est pas impossible qu'on puisse
extraire du sens
en fonction
de l'endroit où ces tokens
sont placés dans l'espace
on pourrait même comparer
la distance de chaque token par rapport aux autres
et voir si
dans la langue française
ou dans n'importe quelle langue en fait
on n'observerait pas des patteurs équivalents
dans des situations ou des contextes
où ça aurait du sens
par exemple quand tu as un bébé avec sa mère
tu vois on arrive à comprendre certaines choses
comme par exemple le mot câlin
ce que tu disais et si on arrive à
mapper ces tokens-là
dans l'espace
du potentiellement câlin
et qu'on le retrouve
dans notre langue-là
on pourrait déduire le sens d'autres tokens
dans cet espace-là
et ben justement
la réponse c'est peut-être
on ne sait pas peut-être
mais c'est là où il y a le danger de l'anthropomorphisation
à ce stade
on a
toute la logique que t'expliques le fait qu'il y a un rapport
entre les tokens, leur position dans l'espace etc
pourquoi ils existent
parce qu'on a
une langue qui est dit symbolique
qui est
aujourd'hui
le marqueur
de l'espèce humaine
et il y a des questions
des débats justement sur est-ce que potentiellement
certaines espèces pourraient avoir quelque chose qui sont approches
tu vois est-ce que des aliens auraient ça
mais on est encore dans de la pure hypothèse
oui, est-ce qu'ils ont les mêmes concepts que nous
et en fait juste le principe
de mapper des symboles
avec des concepts de la réalité
et de s'échanger les symboles
avec notamment de la récursion
le fait que nous on est capable
d'avoir une phrase dans une phrase
c'est que des caractéristiques super importantes
d'une langue
on n'a aucune foutue idée
qu'on va pouvoir avoir
des résultats
chez des animaux
juste parce que de base si ça se trouve
le socle
les caractéristiques
de la communication
sont en rien à voir
en fait ce qui est super intéressant
c'est que dans plusieurs situations
on pouvait enregistrer des
en fait tu vois il y en a très peu
en gros il y en a très peu
par exemple la chasse
ou la synchronisation
des gestes entre deux dauphins
en fait ça reste quand même
des contextes assez fermés
dans lequel on peut comprendre
une certaine partie de l'interaction
et je pense que c'est à partir
de ces situations-là très spécifiques
moi je fais la vocale d'Isa
mais dans les faits je trouve ça fou
en fait ce serait complètement dingue
trop stylé
et c'est justement ce genre d'exemple
qui nous laisse
penser, qui nous laisse un peu rêver
sur le fait que peut-être
qu'il y a quelque chose
à découvrir et qu'un jour
c'est ça c'est le rêve
de l'ONG en question et de beaucoup de chercheurs
quand tu regarderas un documentaire
de National Geographic
il n'y aura pas besoin de sous-titres
parce que tu sauras directement ce que disent
les animaux
ça c'est évidemment le rêve ultime
dans 30 ans je ne sais pas
mais dans les faits
c'est extrêmement certain mais
absolument passionnant, ça c'est sûr
quand tu dis qu'il n'y aura pas de sous-titres
pour traduire les...
oui oui oui
nous on va comprendre
on va faire Balaine LV3
c'est ça la sens de ta phrase
je ne veux pas bien comprendre
je voulais dire il n'y aura pas de voix off
ah oui d'accord
les voix off un peu crènes je dois...
j'ai faim
je ne dois pas regarder assez National Geographic
il y a un
dernier truc
c'est à la fois
dingue
qui les aient ses préoccupations
et en même temps c'est probablement très sérieux
c'est que
il y a pas mal de gens qui ont
émis
qui ont fait un warning
sur cette recherche en gros
et qui ont dit il faut pas trop jouer avec le feu
notamment
si jamais on arrive effectivement
à générer par exemple des champs de Balaine
ou d'autres communications
de rien
à partir de modèles
de diagénératives
et bah on ne sait pas quelle perturbation
ça pourrait avoir
sur l'écosystème tu vois
on est sur des espèces qui ont
des cultures
et des
des proto-langages
qui sont extrêmement vieux
on a vu qu'il pouvait y avoir des phénomènes
de contamination
de mod avec les champs de Balaine etc
et donc
il y a pas mal de gens qui disent non mais faites pas de conneries en gros
si vous vous mettez à générer
comme ça des communications
de cet assez
et bah
vous pourriez
foutre la merde
foutre d'un énorme bazar on ne sait pas quoi
et donc ce qu'ils ont dit actuellement
c'est qu'ils se limiter à des animaux
élevés en laboratoire
pour éviter
de créer un effet papillon potentiel
qui
aurait des conséquences terribles et il ferait disparaître
par exemple
pour coup d'informations ou il ferait disparaître
des trucs culturels qu'on aurait pu découvrir plus tard
à la fois
c'est logique quand il commence
mais je t'en va dire
le niveau de problèmes
qu'ils ont anticipés
potentiellement et c'est très
vrai au final non mais c'est très bien de
poser la question avant de...
avant que ça n'arrive évidemment
parce que dans le chat ils imaginaient déjà
des cas d'usage ou par exemple on peut
prévenir une population de cet assez ou n'importe quoi d'autre
d'un danger
en générant
potentiellement une phrase
genre à tous les braconniens arrivent
ou inversement
ou inversement exactement
c'est you les copains
venez venez
déjà eu des idées comme ça qu'on peut
ils ne râent pas une
il y a un moment ils se sont dit
ils ont une battle entre le pain au poisson
et la poisson latine
c'était exceptionnel le chat ce soir
après je vais juste rajouter un truc que ça m'a fait penser
à ça ta chronique
c'est un peu éloigné mais il y avait les recherches
de Jane Goodall qui était très intéressant
sur la communication
avec les... je crois que c'était un gorille
ou un chimpanzé chez plus
que j'ai moi dans le chat
si j'ai faux
mais en gros elle a appris le langage
des signes
un primate et en fait
elle arrivait à avoir des conversations
ou en fait
même si
c'est pas un humain
en fait on arrivait à voir qu'il y avait
des concepts
qu'elle arrivait à comprendre
notamment elle comprenait
elle pouvait communiquer sur ce qu'était
la mort
par exemple
elle comprenait que cette personne ne reviendrait pas
ou des choses comme ça
et du coup ce que je trouve très intéressant dans cette recherche
c'est que parfois on a tendance
à penser que les animaux n'ont pas
les mêmes concepts que nous
alors que
les primates et les cétacés
du coup c'est un pas
mais moi je serais plutôt tim
ils ont une compréhension
quand même
profonde
d'une sensibilité en tout cas
par rapport à certains concepts
et
moi je serais plutôt optimiste
en fait étonnée dans ce sens
je serais plutôt optimiste dans ce cadre de la recherche
là qu'on puisse vraiment mapper
des mots avec des concepts
qui sont équivalents aux nôtres
et bah écoute, j'espère que tu as raison
j'aimerais bien, je suis très optimiste
je pense qu'un jour
on pourrait être dur
le jour où on est capable de générer des
tu as trouvé bientôt on aura des sous-titres
sur quand les chiens à boirons, nos chats
j'ai vu des gens sur Reddit qui disaient
en fait si ça se trouve les gens voulaient
que ils veulent pas que leurs chiens puissent parler
oui, très probable
très probable
on arrête la science
c'était pendant 2 minutes
j'ai pas envie de savoir que mon chien ne m'a touché
en fait mon chien ne m'aime pas
en tout cas j'espère que ça vous a intéressé
très cool
j'étais un peu stressé parce que je vous ai dit
c'est un domaine très vaste
et tu auras forcément des experts
de CEDAC pour
les langues d'État
et de URA également des experts
de CEDAC et de linguistique dans les commentaires
j'espère qu'ils seront gentils avec moi