Pourquoi les CAPTCHAs ne servent à rien ?

Durée: 28m10s

Date de sortie: 25/01/2023

En plus d’être rebutant pour l’utilisateur, les CAPTCHA sont inutiles. Ça paraît fou, mais il y a au moins 6 bonnes raisons de le croire. Et pourtant on risque de les subir encore longtemps… Michaël nous explique, et c’est passionnant !

Pensez à mettre 5 étoiles pour soutenir l’émission !

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Pourquoi Banque Populaire est la première banque des entreprises ?
Je me posais des questions sur le partage de la valeur pour mes salariés.
Elodie, ma conseillère Banque Populaire, m'a proposé une solution d'épargne salariale sur mesure,
rapide à mettre en place et que je peux piloter en ligne.
C'était simple et surtout ça a fait des heureux.
Accompagner nos clients sur tous les territoires avec des solutions adaptées à leurs besoins,
c'est ça, être la première banque des entreprises, Banque Populaire, la réussite est en voulue.
Étude Quantar PMEP et Mie de 1023, Quatorze Banques Populaires, Première Banque des PM.
Je vais vous parler de pourquoi les CAPTCHA c'est un peu une grosse arnaque.
On va voir des techniques ultra ingénieuses que j'ai découvert qui permettent de les contourner,
notamment en utilisant de la pornographie.
Oui, vous m'avez bien entendu, vous allez voir ce sont des génie du mal.
Et enfin, on va voir pourquoi c'est à peu près sûr que les CAPTCHA ne marcheront jamais pour toujours.
C'est genre, c'est pas possible.
Alors déjà, est-ce que vous savez ce que ça veut dire un CAPTCHA ?
Wow !
L'acronyme.
J'ai pas revivé du tout moi.
C'est un acronyme.
C'est un acronyme.
Ah c'est un acronyme, je crois que c'est un mot moi.
C'est vrai que c'est pour ça qu'il me met en majuscule.
Bah non, ça veut dire conférence annuelle, prétérite.
Attends, pour tester les connards humains automatisés.
Ça marche.
Attends, attends, ça termine le.
Franchement, ça marche ?
Oui.
Ben c'est bon.
Conférence annuelle pour tester les connards humains de automatisés.
C'est pas mal.
Bon, en fait, ce que veut dire CAPTCHA, c'est completely automated public during tests.
Ah oui.
Et oui, donc ce sont des fameux tests de Turing,
dont l'objectif est de savoir si un interlocuteur est humain ou pas.
Parfois on dit que ce sont des tests de Turing inversés,
parce qu'en fait c'est la machine qui fait le test.
Ben oui c'est humain.
Et pas l'humain qui teste la machine.
Donc on peut dire aussi que c'est un test de Turing inversé.
Mais attends, ça en marche pas l'acronyme Turing test ?
Completely automated public during tests.
Ok, y a le S.
Ouais.
Il y a le C.H.A. à la fin qui ne marche pas.
C'est vrai ?
Attendez, y a un problème ?
On peut peut-être mettre un ou deux journaux.
Ok, non, il manque la fin.
Ah, qu'est-ce que c'est ?
Mais pourquoi il le disse ?
C'est là.
Ok, donc la version 2.
Il y en a en train d'en mettre les sources.
Mais les sources, ouais.
Ça n'a effectivement pas, mais c'est évident, c'est moi qui épaisais un peu long.
L'acronyme complet c'est completely automated public Turing test
to tell computers and humans apart.
Ok.
C'est quand même très long.
C'est quand même très long.
C'est comme...
C'est comme Captcha, c'est bien en fin.
Merci le chat pour la version longue.
Merci, Généphanie aussi pour...
Merci Généphanie.
Je me disais ça finit pas...
Non, c'est un peu bizarre.
Elle a vu les commentaires YouTube à faire.
Eh oh, eh oh.
Donc.
Qu'est-ce que c'est au fond un bon test Captcha ?
En fait, c'est un test qui va utiliser les avantages compétitifs des humains.
Que ce soit en termes de capteurs de nos sens, ou que ce soit en termes de capacité cognitive.
Donc concrètement, de l'identification d'objets ou de lettres dans une image très bordélique.
Ben ça, ça va tirer parti de nos capacités à nous.
Et pour un algo, c'est méga chiant de faire ça.
C'est le principe donc de base d'un bon Captcha.
Donc par exemple, un Captcha moderne basé sur du texte,
va combiner trois compétences.
On va vous montrer normalement un petit schéma.
Première compétence, c'est reconnaître des caractères malgré donc des grosses déformations.
Ça c'est tout ce qu'on connaît.
C'est un peu complexe de repérer par exemple que cette lettre c'est un M moins U.
Deuxième compétence, c'est reconnaître la séparation entre les lettres.
Alors ça, je trouve ça hyper intéressant.
La barre que vous voyez au milieu, à quoi elle sert,
elle sert à empêcher l'algorithme de bien faire la séparation entre les lettres.
De bien savoir segmenter le mot.
Ah oui, d'accord.
Et en fait, c'est pas si simple du tout.
Et la troisième compétence, c'est reconnaître le mot de façon holistique.
Alors c'est un gros mot juste pour dire que t'as besoin du contexte pour bien comprendre le mot.
Tu peux pas comprendre chaque lettre une par une.
Il faut la capter globalement.
Très bien, c'est le mot humble.
La signification.
Exactement. Alors que les lettres indépendantes sont infâmes à comprendre.
Ça prend à peu près 10 secondes pour nous humains de résoudre ce genre de captcha.
Et en fait, mine de rien, déjà ils sont assez controversés.
Déjà parce que niveau expérience utilisateur, c'est insupportable.
Je pense que nous sommes d'accord.
Mais la deuxième raison, c'est que pour l'accessibilité, c'est pas ouf.
Parce que, évidemment, tous les malvoyants, pour utiliser leur ordinateur,
ils vont souvent utiliser de la lecture vocale.
Ouais.
Très que t'actives sans faire exprès là.
Là, ça peut pas lire.
Et objectivement, normalement, ça ne peut pas lire un captcha.
Il n'y a pas une
Et c'est notamment ça, en fait, qui va profiter au scammeur.
Parce que Google et compagnie, ils vont être obligés de fournir une autre méthode.
Tant à parler, c'est un test vocal.
Et là, pour le coup, en intelligence artificielle, on sait beaucoup mieux faire ce genre de choses.
À savoir déclencher la note vocale qui dit des mots,
faire de la reconnaissance auditive et mettre les bons mots dans l'input.
Ah c'est marrant.
Ça veut dire que la reconnaissance auditive est beaucoup plus simple en IA
que la reconnaissance visuelle.
Alors, on ne peut pas le généraliser.
Dans le cas des captchas, les premières très bonnes techniques pour contourner les captchas,
ce sont justement des trucs qui font de la reconnaissance vocale.
Il y a un exemple que vous pouvez tous utiliser chez vous.
C'est une extension pour Chrome qui s'appelle Buster.
Donc on a une petite vidéo qui montre son fonctionnement.
Donc tu installes l'extension sur ton navigateur.
Et concrètement, ça va rajouter une petite icône sur les tests bien bien chiant que...
Solda challenge.

Et il est...
Les recaptchats de Google.
Alors, on a une nouvelle régime ce soir.
Oui, il y a eu des changements de rouleau, c'est normal.
Donc concrètement, tu vois cette interface, donc du captcha de Google.
Et plutôt que d'avoir à cliquer toi sur les images hyper relou,
tu demandes à l'extension de le faire pour toi.
Mais alors, ce que j'ai vu là...
Et ça fonctionne.
C'est de la maginoire.
Parce que...
Ça écoute le son,
ça entends les mots, ça les remplit, et ça valide le temps.
Par contre, tu ne peux pas faire ça à la bibliothèque, ça fait du bruit.
Non, il le fait en tâche de fond.
Ah, ça va grand bien.
Mais je ne suis pas...
Ça se trouve, c'était un truc à manuel,
où ça déclenche le micro.
Pour installer Buster, pour pouvoir voir la petite icône.
Oui, exactement. C'est une extension que tu vas rajouter.
Ça qui a tout le monde qui est en train de taper Buster.
Oui, il y a un lac à l'aliment.
Et en fait, ce qui est hyper drôle, c'est que...
pendant que je faisais ces recherches-là,
je suis tombé sur toutes ces vidéos-là.
Et bizarrement, je ne veux pas dire.
Mais c'est que des accents à dire.
Là, ce que les gens...
Les gens qui veulent globalement contourner les captchas,
et bien, comme tu peux remarquer,
un certain business model très présent dans des pays asiatiques.
C'est à mourir de rien.
Donc là, c'était un exemple, le pas, un mi d'autre.
Donc ça, c'était la première méthode hyper répandue
pour essayer de contourner des captchas.
Je ne sais pas du tout.
La deuxième faille qui existe, c'est tout simplement
l'avancée récente de l'intelligence artificielle
et du diplôme nid.
En gros, tous les captchas que vous avez vus au début,
avec du texte déformé, ce qu'on connaît bien,
cela, ça marchait dans les années 2010.
Maintenant, c'est terminé.
Donc depuis les progrès du deep learning,
en moyenne, on peut totalement les désenguer.
Vous pouvez notamment voir comment ça fonctionnerait
avec une intelligence artificielle
qui analysera ce genre de texte-là.
Il y a plusieurs étapes.
La première étape, c'est donc choper l'image,
ensuite faire du denoising,
donc enlever les artefacts qui peuvent être foutus là,
faire de la segmentation,
reconnaître les caractères et bingo.
Ça, c'est pour du captcha un peu simple, évidemment.
Mais, et ça, on commence à essayer de le faire
depuis les années 2010.
Là, récemment, là, j'ai une étude assez connue
en 2018, par exemple, qui a démontré
qu'ils obtiennent des taux de complétion
en utilisant du deep learning,
qui sont très, très, très, très impressionnants.
Donc là, si on peut avoir toute la...
Ils sont meilleurs que les humains, quoi.
Et c'est ça qui a assez marre.
J'ai l'impression que l'image est un peu cropée.
Normalement, on voit la vidéo...
à partir de droite.
Après, c'est peut-être nous qui, sur notre retour,
on s'est cropés, je sais pas si...
Ah oui.
Ils ont le retour.
Bref, donc cette étude qui est sortie en 2018
a fait énormément de bruit,
parce que, comme vous pouvez le voir,
les intelligences artificielles arrivent parfois mieux
à compléter les capschacles des humains.
Mais on pense pas à ça, mais en fait, nous, parfois,
on y arrive pas.
Genre...
Oui, oui, oui.
En fait, nous, on n'a pas du tout 100% de toutes les sciences.

Et donc, t'as des IAS sur des capschacles
qui ont du 100%.
Et même sur les plus difficiles,
en gros, on atteint toujours dans les 50,
70% de toutes les complexes,
ce qui est quand même vraiment, vraiment bien.
Oui.
Donc le texte, c'est chaud.
Il y a une troisième méthode.
Et qui là, pour le coup,
commence à être moralement, étiquement,
un peu douteuse,
c'est d'utiliser des fermes humaines de clics.
Ah !
Donc ça, c'est sûr que vous en avez entendu parler.
Il y a une flopée de services
qui proposent ce genre de doutils.
Et en fait, à date,
aujourd'hui, ça reste l'option la plus efficace
et économique
pour remplir des capschacs un peu difficiles.
Donc c'est dramatique, mais ces outils-là
sont ultra, ultra populaires.
Genre, ceux de Google avec les images,
pour vous donner une idée, ils sont dans les très difficiles.
Quand on doit sélectionner un feu rouge,
ou un...
Voilà.
Des trucs insupportables.
Ça peut le faire, mais en termes de taux de complétion,
tu vas pas être sur des toits assez satisfaisants.
Et du coup, t'as ces services-là
qui vont proposer de te les faire à ta place.
Et là, pour le coup,
ce n'est pas un robot ou une intelligence artificielle
qui reconnaît l'image et qu'il fait,
c'est vraiment un humain derrière son ordinateur
qui, toute la journée, va remplir des capschacs à l'appel.
Vous pouvez voir combien ça coûte.
Salut !
Si vous appréciez Endorscore,
vous pouvez nous aider de ouf !
En mettant 5 étoiles sur Apple Podcast,
en mettant une idée d'invité que vous aimeriez qu'on reçoive,
ça permet de faire remonter Endorscore.
Voilà. T'es d'une fusée.
Et c'est pas très cher.
Globalement, c'est pas très cher.
Pour vous donner une idée, donc c'est 75 centimes de dollars
pour 1000 complétions pour un captcha normal.
Pour 1000 complétions ?
Ouais, pour 1000 captchas,
tu payes 75 centimes.
Mais ils sont payés combien ces gens ?
Tu vas voir, c'est incroyable.
Mais moi, c'est la vitesse qui me...
Et pour les versions plus difficiles,
genre ceux de Google,
eh bien tu fais un X3,
c'est plutôt dans les 3 dollars, les 1000 captchas.
Donc, il y a une grosse différence.
C'est assez intéressant de voir la différence de complexité.
Et comme tu disais,
sur les temps de complétion...
C'est fou !
C'est fou.
En 13 secondes ?
Exactement.
Donc, toi, ton bot,
tu envoies l'arquête au service.
13 secondes plus tard.
C'est pas juste le temps que la personne le fasse.
C'est le temps que tu l'envoies au service,
qui trouve quelqu'un pour faire ton captcha parmi leur genre de ferme,
avec des orduces.
Ils sont pas forcément au même endroit,
mais je crois qu'il y a aussi des fermes,
vraiment, c'est les rangées dans l'ordinateur.
Le truc est dispatché,
la personne complète le captcha,
11 13 secondes plus tard,
t'as la réponse.
Ou 40 pour le...
C'est...
Google.
C'est...
Terrifiant.
Mais étant donné que, genre,
ce Google,
tu mets déjà toi-même...
Oui !
15, 20 secondes à le faire.
Au moins.
Au moins.
Mais je veux dire un truc un peu cynique,
c'est qu'ils deviennent très bons,
en fait, à les faire à la chaîne,
parce que vous allez voir,
on a réussi à accéder en gros à l'interface
de...
de travail,
de ces employés,
ou qui sont pas employés, évidemment,
qui font ça toute la journée.
Et en gros, ça ressemble à ça.
Ils ont un champ de texte,
où ils doivent remplir le plus vite possible
le résultat du captcha,
qui s'affiche juste en haut,
alors il y a quelques options, etc.
Et dès qu'ils appuient sur Send,
ils ont un autre captcha qui arrive.
Instant à l'heure.
Ah, OK, d'accord.
Et donc, en gros,
t'as ce truc-là de le plus vite possible,
remplir les captchas à la chaîne.
Ça les dispatche en temps réel.
Et tu vois le...
le compteur de combien tu gagnes.
Et c'est un édicule.

Donc là, après 23 captchas,
ici, il a gagné 0,007 centimes de dollars.
Pour vous donner un ordre de grandeur,
ça fait que si tu fais une journée de 11 heures de travail,
en gros, tu vas gagner 1,20 dollars.
Ah, wow !
A peu près.
Donc évidemment, ça peut faire le plus avec...
avec l'interconnexion
entre des acheteurs occidentaux
et des travailleurs.
Oui, c'est...
j'imagine que c'est des pays, genre, en Inde...
C'est toujours comme ça.
C'est vraiment Chine, fin, genre,
je ne connais rien, mais...
Et en termes de répartition,
ceux qui vont remplir ça,
ils ont en gros 4 %
de ce que le client a payé
pour vous donner un ordre d'idée.
Donc déjà, entre...
Mais ça va être plus fous, il y a un amargé...
...un amargé gigantesque.
Et des mille...
96 % pour le frais de fonctionnement du service.
Exactement.
Même Uberis, c'est pas ça.

Et en fait...
Y a pas de respect, quoi.
Ce service n'est pas illégal.
Parce que, bah, les clients, eux,
ils font probablement des trucs louches et illégaux.
Alors, pas que.
Tu peux faire du scrapping,
ou des trucs comme ça,
mais il y a plus l'indusage
de contour de mand des captchas
qui sont illégaux.
Mais ce service-là,
bah, à part que Google et compagnie,
ils sont pas contents
et ils les aiment pas,
ben ils peuvent pas faire grand-chose
contre en réalité.
Oui, parce que, au final,
c'est vraiment un humain
derrière qui répond donc.
Exactement.
Pour rien faire.
C'est un contrat.
Une quatrième méthode
qui permet de contourner les captchas,
c'est de ne pas en déclencher.
Ça peut paraître hyper bête,
mais en réalité...
Je vous appris pour un con là.
Non, mais j'ai reconnu.
J'ai reconnu un tonnage.
Vous allez comprendre.
En gros,
un site web n'a pas du tout intérêt
à montrer toujours un captcha
dès le premier coup.
Parce que, en fait,
en termes d'expérience utilisateur,
c'est une cata.
Et du coup, ça leur fait perdre
beaucoup d'argent.
C'est-à-dire que si
tu te mets à augmenter
le nombre de filtres anti-spam,
anti-bot sur ton site,
si tu fais du e-commerce
ou des choses comme ça,
et bien tu vas littéralement
perdre énormément en conversion
et donc en chiffre d'affaires
parce que les gens,
ils ont pas 30 secondes
à t'accorder dans leur vie.
Et donc, il y a ce truc
où si tu te mets à redevient,
tu peux arriver à faire croire au site
que c'est toujours ta première connexion.
En gros, le captcha,
il apparaît que si tu fais trop de choses,
trop d'actions, de puis, par exemple,
la même adresse IP.
Et donc,
les spammers et les gens
qui font du scrapping,
ils vont, par exemple,
utiliser des proxies.
Et ils vont pouvoir, comme ça,
envoyer genre un million de requêtes.
Sauf que le site pensera que c'est
un million de gens qui viennent
pour la première fois.
Et pas un bot qui fait des trucs en chètre.
Ça, c'est assez intéressant.
C'est un article d'un service, justement,
de proxy qui donne tous les petits tips
pour contourner les captchas
et éviter qu'ils apparaissent.
Donc, effectivement, en fait,
tu peux souvent, sur certains sites,
carrément ne pas avoir
utilisé de techniques
de contournement de captcha
parce que tu te démènes
pour qu'ils apparaissent jamais.
Une cinquième étape.
Non, je vais pas.
Oh ouais, là.
Pour un tout le plus.
Surtout en montant fun.
C'est-à-dire qu'au début,
ce n'était pas très marrant.
Là, vous allez voir
qu'on commence à arriver
sur des techniques très drôles.
Juste pour rebondir,
j'avais vu des commentaires
sur la vidéo
qu'on avait parlé de Google Docs.
En fait, quand tu fais des Google Docs,
c'est vite qu'un captcha arrive
parce qu'il a peur
que tu sois un robot
et que tu scrapes Google
en entier.
Et en fait, les gens étaient étonnés
en mode, c'est bizarre et tout machin.
En fait, ils détectent
quand vous faites des requêtes
un peu chelous.
Là, il s'est dit,
OK, là, on va commencer
à pas lui faire confiance.
Et je vous couvre très rapidement
quand tu fais du docs
toute la journée
avec la même IP.
Tu as des captchas.
Oui, parce que nous,
on a fait du doc.
Mais aussi, vous, vous l'avez testé.
Pour préparer.
Exactement.
Donc la cinquième méthode
qui permet de contourner
certains captchas,
c'est un truc
dont j'ai pas vu beaucoup
de gens parler,
mais j'ai oublié tout à l'heure
je vais voir comment il tient.
Je me suis dit,
il y a certains captchas
un peu à l'ancienne
où en fait, c'est des phrases
de texte.
C'est vraiment une question
prédéterminée
qui attend une réponse.
Il y a pas mal ça
sur certains forums
genre des trucs un peu
underground, de hacking et tout.
Par exemple,
une question c'est
combien font 4 plus 12 ?
Et c'est le truc qui est écrit
en toute lettre
et se fait exprès
pour...
Pour pas qu'ils puissent faire
l'opération.
Pour qu'un robot
soit compliqué à automatiser.
Ils ont plein de questions
comme ça qui sont prédéterminées
et un humain,
c'est faire la part des choses.
Avec un robot,
c'est pas impossible,
mais c'est coûteux en fait.
Tu vois, tu veux analyser
une par une chaque question.
Sauf que,
je sais pas si vous avez remarqué,
mais depuis l'avènement
de ces forums,
il y a un truc
qui répond plutôt bien aux questions
et donc si tu donnes
cette question à
GPT3,
oui ben...
Alors moi,
évidemment,
j'invoque la triche.
Mais,
ça veut dire que
ça signifie la fin
de cette technique
pour tous les petits forums.
C'est fini.
Parce que c'était hyper pratique,
en fait, ça marchait bien.
C'était pas très cher.
C'était pas très chiant
pour les utilisateurs.
Présumement gratos, ouais.
Terminé.
J'ai une question.
Est-ce que tu as testé?
Parce que, là,
on imagine que le CAPTCHA,
il est écrit en toute lettre,
en texte.
Mais peut-être qu'il pourrait
faire une image, tu vois.
Est-ce que si tu fais une capture
d'écran que tu l'envoies
à châte GPT,
il arrive à analyser?
Il y a moyen, hein.
Tu fais de la reconnaissance
de caractère,
après tu l'envoies à châte GPT.
GPT,
il n'a pas encore
de la reconnaissance
de caractère?
Je ne crois pas.
Enfin, non, c'est bien.
Mais en fait,
il ne fait pas besoin.
Pour beau, par contre,
Tiffany, il faut faire bosser,
quand même.
Parce qu'on veut ça.
Non, parce que je travaille
en IA, je travaille en IA,
mais on ne peut pas.
Et Mathieu,
dans sa tête,
ton travail,
c'est genre,
parler à des IA.
Tu es en tout de la journée.
Vas-y, maintenant,
fais ça.
Je les fâme.
Pardon, je suis bien de te roustre,
en fait.
Non, mais c'est bon,
c'est encore le mois
de mon anniversaire,
tu peux.
Et alors,

la sixième technique.
Ah non, mais il y a de la septième, là.
Non, non, non, mais la sixième.
Oui, c'est...
Oui.
La technique
qui comparait à ça
et god tiers.
Vraiment,
c'est genre le truc le plus fou
que j'ai découvert
très récemment.
C'est que
les scammeurs,
ils ont trouvé un système
pour contourner
l'ensemble des captchas
totalement gratuitement
et rapidement.
Ça ressemble
à une blague,
à une pub,
et en réalité,
non, c'est possible.
Comment ils font?
Je vous...
Ils créent des sites gratuits
de pornographie.
Et au moment de cliquer
sur une vidéo,
en fait, ils demandent
aux visiteurs
de remplir un captcha.
Et du coup,
voilà,
c'est littéralement tout
puisqu'après,
ils n'ont plus qu'à faire
du routage entre leurs scripts,
entre leurs robots
de fraud
ou de scammeurs.
Ah, ils font pro!
Ils le connectent
aux sites de pornographie
et les utilisateurs
très pressés souvent,
et bah,
leur permettent
de gratuitement
faire passer leurs bots partout.
Et du coup,
c'est du génie.
Non mais, ils auraient pu faire ça
avec un autre site.
Oui.
Non, parce qu'ils...
Dive, que je sais.
Je pense que, comme Mickaël dit,
ils voulaient des gens pressés.
Ils se posent pas à transquestion.
Ouais, c'est en même temps
atroce et du génie,
je suis vraiment entre les deux.
J'ai découvert ça,
je me suis dit,
mais le brain,
le brain,
l'inventivité
de certains...
Mais ça veut dire qu'ils...
Ouais, ils se sont fait chier,
à monter un site
de pornographie.
C'est chiant.
Si ils l'ont fait, c'est excellent.
À mon avis.
Je pense que c'est, en fait, assez rentable.
Moi, c'est du gongénia.
Mais non, mais attends,
il faut...
Il faut les héberger, les vidéos.
Non, parce que tu voles.
Enfin, voilà, tu...
Non, non, non, non, non.
Ils se sont dit ça
dans une détente.
Mais non, enfin,
tu voles.
Au point où ils en sont,
ils n'ont pas besoin d'héberger,
quoi que c'est ça.
Il faut créer une sur...
Non, mais je...
Enfin, voilà, bref.
Je suis naïf.
Donc, conclusion,
il y a...
Enfin, il y a pas de doute,
les captchas, c'est flinguer.
Alors pourquoi
est-ce qu'on les utilise encore ?
À quoi ça sert ?
Pourquoi on est bloqués avec ce truc ?
Alors, d'abord,
c'est parce que, en fait,
ça rapporte pas mal d'argent.
Le système des captchas
est, en fait, assez juteux.
Puisque, comme vous le savez,
par exemple,
les captchas que fournissent Google,
donc avec le re-captcha,
ils ne servent pas du tout
juste à empêcher la fraude.
Ils ont plein d'autres usages
que vous connaissez sûrement,
notamment tous les premiers,
on servit à numériser
les articles du New York Times,
par exemple,
où la librairie Google Books
a été entièrement numérisée
par vous qui galérez
derrière votre clavier.
Maintenant,
c'est passé sur d'autres choses,
sur des images.
Quand vous sélectionnez des images,
en fait, ça entraîne
des IA de Google
pour des voitures autonomes.
Donc, de base,
c'est du travail gratuit.
C'est-à-dire que le captcha,
selon Google,
c'est l'entièreté de la planète,
travail gratuitement,
pour éviter la fraude,
mais on ne saura jamais vraiment
à quel point ça permet
d'éviter la fraude.
Et ce qui est intéressant,
d'ailleurs,
sur ces histoires de mots numérosiers,
tous les articles de New York Times, etc.,
c'est que le captcha fonctionnait,
c'est qu'il y a vraiment
un premier mot qui est fait
pour tester si tu es un robot ou pas.
Et en fait,
c'était à l'époque,
c'était sur le deuxième mot,
où, en fait,
après,
il le donnait à plein utilisateur,
il faut une moyenne
et t'as le bon mot,
mais du coup,
c'est vraiment du travail gratuit.
Et le système s'entretient automatiquement.
Je suppose que pour les images,
c'est pareil, parfois,
t'as deux pages.
La première page,
c'est pour tester la deuxième...
Alors, t'as une image,
je pense que tu peux avoir
une image dans les neufs,
qui est vraiment détectée par y a.
Si tu la choppas,
Google te dira,
attention,
mais parfois,
si t'en oublies une,
et bien, il te dira rien,
parce que c'était...
il y a une image d'apprentissage.
Je pense que c'est ça.
Ce qui me rend pour les mots,
c'est que pour le deuxième mot,
tu pouvais répondre n'importe quoi,
ça marche du coup.
Si t'avais bon au premier,
c'était bon.
Tu pouvais protester contre Google.

si tu fais que tu te dis que
y a où Google à ce moment-là,
mais ouais...
Oui, c'est un bon prank,
en vrai.
Bah ouais.
Il faut être beaucoup à le faire,
mais tu peux remplacer un mot
par un autre complètement.
Et je pense qu'en vrai,
c'est compliqué parce que...
Je sais pas si
il y a beaucoup de gens
qu'on perd du toll.
Je suis pas sûr.
Je suis pas sûr.
Mais en fait,
il y a une deuxième raison.
C'est que, en réalité,
le fait que les captchats
soient un jour cassables
est totalement prévu.
C'est-à-dire qu'on le sait,
tout le monde le sait,
et c'est normal.
Et en fait,
c'est pas moi qui le dis.
Ce sont des chercheurs
du Centre de recherche d'IBM
qui notamment conçoivent des captchats
qui disent ça dans un article.
C'est pas une blague.
Ils ont fait un article scientifique
hyper intéressant au début
des années 2000,
où ils prédisent,
plus ou moins,
que les captchats risquent d'être
cassés,
mais qu'en fait,
c'est prévu
et c'est cool.
Pourquoi ?
Parce que l'idée,
c'est que,
soit les captchats
concrets sont
cassés,
incassables,
et du coup,
c'est cool,
on a un bon système
qui permet de savoir
si les gens sont des robots
ou pas.
Soit,
quelqu'un arrive à les casser,
mais du coup,
comme c'est les problèmes
très difficiles,
ils ont eu besoin
de faire largement avancer
la recherche
en intelligence artificielle.
En gros,
c'est gagnant,
gagnant.
Soit,
on n'a plus de spam,
soit on a des superzias.
Donc là,
on est dans la branche
des superzias ?
Et en fait,
vous dites peut-être que
c'est tiré par les cheveux.
Genre,
voilà,
ça fait chelou.
Sauf qu'en fait,
c'est exactement
ce qui s'est passé
pour les mots de passe.
Ou la cryptographie en général,
c'est que
les acteurs et les chercheurs
en sécurité,
à force de
se casser les dents
sur les nouveaux systèmes
de chiffrement,
ils ont indirectement
fait progresser
les mathématiques,
notamment
les algos de factorisation,
etc.
à une vitesse incroyable.
Parce qu'il y avait
une motivation
qui était,
ça servait à
contourner des systèmes
de sécurité.
Bah les capte-jasses,
c'est la même chose.
On fait des trucs.
Une carotte en fait.
Exactement.
En fait,
c'est une carotte.
Et donc,
bon,
bah si,
la carotte
n'est pas
atteinte,
c'est pas grave
parce qu'on,
dans tout le cas,
on est contents d'avoir
un bon outil
pour filtrer le spam.
Si elle est atteinte,
on est aussi contents
parce que toute la recherche
en intelligence artificielle
a levé le p.
Et du coup,
dans le cas où
on trouve
quelque chose,
ils ont un plan B,
ils imaginent.
Et bien,
ils continuent.
C'est-à-dire que
on sait que
un type de captcha
sera probablement
cassé un jour.
Par exemple,
la sélection d'image
de Google,
probablement qu'on va
réussir un jour.
Et,
voilà, c'est cool.
Mais là,
les voitures autonomes
à tournabal sur la captcha
de Google,
à chaque fois,
c'est des passages
piétonnes,
c'est des feux rouges,
c'est des stops.
Et peut-être,
ce sera pété un jour,
probablement même.
Ce sera le cas.
Et ils passeront
au problème d'intelligence artificielle
supérieure que la communauté scientifique
trouve, à date,
très difficile.
Il y aura toujours des captchas.
Et voilà.
Probablement,
il y aura toujours des captchas,
mais probablement,
ils seront toujours pétés.
Ça doit être super intéressant
quand tu dois penser
à un nouveau captcha
en mode,
qu'est-ce qu'on trouve
très difficile
à se momenter
et imaginent
dans 10 ans,
on l'a résolu.
Mais il parle de ça,
notamment dans l'article,
je vous invite
à aller le lire.
C'est pas ce n'est pas le cas.
Et il fait un peu le parallèle
avec la cryptographie
ou ça la même chose, en fait.
La question, c'est,
dans le champ des...
en cryptographie,
dans le champ des mathématiques,
quels sont les problèmes
très, très, très, très durs
ou très, très, très, très coûteux
à résoudre.
Et comment on peut
utiliser ça pour faire de la cryptographie,
là, c'est la même chose,
mais avec des captchas
dans le domaine de LIA.
Donc,
au fond...
Incroyable.
Ce qui fait que
chaque technique de captcha
ne marchera jamais
indéfiniment,
c'est qu'en fait,
ils sont faits
des gens humains
et qui n'est rien d'autre
qu'un très gros ordinateur, en fait.
Et donc toutes les prochaines
fois où vous allez remplir
un captcha,
dites-vous que,
en quelque sorte,
vous participez à la vedembre
des IACONSciortes.
C'est bon, non ?
Tu peux te refaire un peu.
Vraiment, ce qui va faire rire,
c'est que
j'ai sentu cette fin.
La fin.
Oui, je vous t'aime.
Tu l'avais préparé,
comme jamais.
Si je t'ai pas vu
avant 18h30 aujourd'hui,
c'est vraiment
5h00 de refaire.

C'est vraiment une formulation
de cette conclusion.
Mais honnêtement...
Et là, la vidéo YouTube
peut s'arrêter.
Ah ouais, mais là,
ça,
on peut dire n'importe quoi.
Ça n'est pas dans le montage.
Évidemment.
Non, mais...
Tu peux en être fier.
Objetivement, c'est vrai.
Objetivement, c'est vrai.
Indirectement,
tous les captchas qui sont remplis
font par effet domino,
font progresser le LIA
grâce au scammer.
C'est trop drôle.
C'est trop drôle.
Cette phrase,
ça te rend drôle.
On dirait un peu
l'équilibre d'efforts,
c'est à chaque fois, il y a...
Enfin, un...
Oui, c'est ça.
C'est...
Tu crées des...
C'est comme un jeu à somme non nul
où, littéralement,
toutes les options sont bonnes.
Toutes les fins sont bonnes.
Voilà.
C'est plutôt cool.
C'est marrant,
parce que ça,
c'est des chercheurs,
en même temps,
c'est des sociétés privées
qui en ont besoin.
Enfin,
tout le monde,
c'est des scammer.
Tout le monde est courant que...
Tout les captchas vont péter,
mais c'est pas grave.
Et c'est un statut con,
et tout le monde est leur mode.
C'est OK.
C'est normal.
Alors,
on peut mettre des petites astérises,
quand même,
avant de passer au sujet suivant,
c'est qu'il y a quand même beaucoup,
beaucoup de gens qui posent la question de...
entre ce que tu perds
en accessibilité, justement,
et en expérience utilisateur,
est-ce que le gain
en...
en filtrage de spam et de fraude
est suffisant.
Et franchement,
c'est un débat qui est compliqué.
Vraiment, c'est compliqué,
parce que,
comme je vous l'ai dit,
il y a plein de bonnes techniques
pour contourner les...
les captchas,
ça peut déclencher des industries,
euh...
enfin, ça peut financer
des industries ultra louches.
Globalement,
la décision est pas simple.
Et en même temps,
d'un autre côté,
c'est utile pour lui,
lui, t'es contre la fraude à des endroits.
En même temps,
ça pour dire que, malgré...
Jamais aussi maniquer un compte.
Exactement.
Malgré cette tableau-là,
c'est pas si évident.
Des outils de match
de performance
Des outils de match
Des outils de match
Des outils de match

Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match

Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match

Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match
Des outils de match

Episode suivant:

L'activité de ce vendeur de DVD sur le darkweb

Les infos glanées

Michaël

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

Underscore_

IA, Hacking, Robotique — Des conversations de terrain avec ceux qui construisent. 🥨

Partenariats: underscore@micorp.fr

---

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Card title

Lien du podcast

[{'term': 'IA', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Investissement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Nouvelles Technologies', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Actu tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Cybersécurité', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Développement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Dev', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Entreprenariat tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'IT', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Robotique', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere