Ce qu'il a découvert sur les sponso NordVPN (en analysant les datas)

Durée: 44m31s

Date de sortie: 19/10/2022

Quel est le sponsor le plus cité dans les vidéos de Squeezie depuis la création de sa chaîne ? Nicolas Bouchaïb, Data Analyst a analysé les descriptions de plus de 700 000 vidéos sur youtube, et nous révèle ce qu’il a appris ! Entre galères et révélations sur les marques les plus présentes sur youtube, il nous raconte son épopée pour arriver à ces résultats.

Animé par Micode, avec Nicolas Bouchaïb & Tiffany Souterre !



Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Pourquoi Banque Populaire est la première banque des entreprises ?
Je me posais des questions sur le partage de la valeur pour mes salariés.
Elodie, ma conseillère Banque Populaire, m'a proposé une solution d'épargne salariale sur mesure,
rapide à mettre en place et que je peux piloter en ligne.
C'était simple et surtout ça a fait des heureux.
Accompagner nos clients sur tous les territoires avec des solutions adaptées à leurs besoins,
c'est ça, être la première banque des entreprises, Banque Populaire, la réussite est en voulue.
Étude Quantar PMEP, mid-2023, Quatorze Banques Populaires, Première Banque des PM.
Nicolas, tu es notre data scientist préféré, n'est-ce pas ?
Cette fois-ci, on t'a demandé si tu pouvais enquêter sur les sponsors YouTube.
Vaste et passionnant sujet.
Quel YouTubeur en fait le plus qui bosse avec des questions comme ça.
On va voir ce qu'on a réussi à trouver.
Je sais qu'il y a des trucs intéressants.
Tu m'as apprécié mais voilà.
Moi, je n'ai pas encore vu.
Mais d'abord, je pense qu'une info importante quand même à dire,
c'est qu'à priori, on est les tout premiers à bosser sur cette question.
C'est-à-dire qu'à un point de vue technique, ça va poser certains enjeux.
Moi, je suis curieux en tant que nom data scientist.
Tu fais quoi quand, justement, tu es dans une situation comme ça,
où tu n'as pas trois data sets tout près à l'emploi ?
Tu commences ou en fait ?
C'est ça.
Alors, ça va être une histoire de drame, de larmes,
de temps passé des écrans à couleur bleue.
Ça va être tout un chemin initiatique, j'espère pour vous.
En fait, la question comme tu dis, c'est qu'il y a des personnes,
dont c'est le métier, d'analyser justement le marketing et la publicité sur les plateformes.
Mais il ne constitue pas un data set en une semaine pour l'analyser la semaine d'après
et préparer une chronique trois jours après.
En fait, souvent, c'était plutôt sur...
En fait, je reviendrai plus tard dans la technique,
mais quand tu constitues un data set, il y a de meilleurs de le faire.
Soit tu retournes dans le passé et tu te le constitues en reprenant ce qui a déjà été fait.
Ou soit tu te mets en gros sur le tuyau et tu prends au passage.
Et t'attends.
Et c'est plus facile de te manger sur le tuyau et de prendre ce qui vient au passage,
parce que, ou tu prends le flux tel qu'il vient, tu construis ta base de données, tout ça.
Là, on a dû nous prendre la petite machine à remonter dans le temps
et revenir même jusqu'au prémis de YouTube.
Alors, quand tu...
Je résume notre problème.
On est curieux d'essayer de comprendre des choses sur la gestion des sponsors sur YouTube.
J'imagine que d'un point de vue technique, déjà, première, une première question toute bête, c'est
comment, techniquement, tu sais, qu'allez une vidéo sponsorisée ou qu'allez une vidéo non sponsorisée ?
Alors, ça, c'est justement tout le problème, parce que, malheureusement,
il n'y a pas cette petite colonne dans la paix YouTube qui m'aurait gagné dans le moment de temps,
où j'aurais pu dire, dis-moi quelle vidéo sponsorisée et donne-moi la marque de la sponsor.
Si j'avais vu ça, on aurait été tranquilles et ça aurait été fait très vite.
En fait, comment ça s'est passé ? C'est qu'au début, on s'est dit,
il faut qu'on voudrait avoir un espèce de panorama de comment se passe la publicité sur YouTube,
donc les sponsors, les affiliations, etc.
Pas les pubs qui coupent la vidéo, c'était pas ça le sujet.
C'était plutôt quand c'est de choisir par partenariat avec les créateurs.
Et donc, en fait, on est partis sur cette question sans avoir d'idées de ce qu'on cherchait au final.
Ce qui est en fait une démarche qui est plutôt intéressante, qui est souvent pas celle qui est la plus opérationnelle,
parce que souvent on se dit, on veut essayer de montrer ça, si c'est vrai ou pas, par exemple, tu vois,
ou exemple, la chronique sur la pixeloire, c'était plutôt, on veut voir si il y a eu de la triche.
Et donc, la réponse, là, c'est oui ou non. Et tu vois, t'as ton hypothèse, tu vas.
Là, c'était plutôt, hum, on va...
Qu'est-ce qu'on peut apprendre sur les sponsorisations ?
Qu'est-ce qu'on peut trouver ? Ça se trouve, et ça se trouve le résultat, tu vois, c'était,
il pouvait nous apparaître au final. Donc comment je m'y suis pris ?
Est-ce que tu avais des hypothèses avant de commencer ? T'avais des hypothèses un peu sur ce que tu devais trouver ?
Ben, alors moi, c'est assez particulier, parce que du coup, c'est plus ou moins mon métier de faire ça.
Donc, j'ai déjà beaucoup d'hypothèses qui sont de l'ordre de, je sais à peu près, qui...
Comment faire des plus avec qui, quand ça fonctionne ?
Mais, j'avais pas de vraies hypothèses posées, parce qu'on était un peu de l'ordre du sentiment, tu vois.
Donc, c'est... En fait, j'ai vraiment dû prendre notre sujet, essayer de le décortiquer, d'y aller en...
D'y aller en mode, on va dire, au feeling.
Ouais, c'est un peu au feeling, c'est le terme.
Donc, en fait, la première chose que je me dis, c'est, il me faut de la data.
Ça, c'est la première chose. Ça peut être souvent la partie la plus compliquée.
Parce que des fois, on dit, ouais, tu avais appliqué ton modèle sur ta donnée, tu vas la...
Et la donnée, il faut de la donnée, et ensuite on parle, tu vois.
Et donc, comment je fais pour récupérer la donnée ?
Je me dis, bon, comment je définis mon corpus, comment je définis mon scope ?
Je vais essayer d'avoir les top YouTube.
On va essayer de se faire un échantillon, on va pas prendre toutes les chaînes YouTube françaises, ni du monde.
Déjà, on va se prendre un petit top.
Et je cherche sur Google, et figurez-vous que c'est une information qu'on ne trouve pas.
Il n'y a pas un endroit, par exemple, sur YouTube où tu peux cliquer et dire,
c'est quoi les plus grandes chaînes YouTube avec plus d'abonnés ?
Bah, tu as très peu d'endroits où tu peux avoir cette info.
Sérieux ?
Même dans l'API, tu vois, il y a un moment...
Ouais, j'allais dire, il n'y a pas une API qui te permet de...
En fait, là, j'ai quasiment tout fait avec l'API de YouTube.
Et donc, tu peux pas avoir tops en France.
J'ai essayé avec certains trucs, tu vois, tu as lancé une recherche vide dans l'API,
et de dire, je lance une recherche avec rien dedans,
et tu me mets, par exemple, les chaînes par ordre des croissants de viewers,
enfin, pas de viewers, on parle mais de abonnés,
et bah, c'est un ordre d'endemn, ça marche pas.
C'était plutôt l'algôte de recommendation qui a interprété le vide, comme il pouvait.
Et donc, j'ai envie de te dire, étant dans la sphère YouTube et tout,
je sais que nous, on a des outils qu'on aime bien utiliser,
analytics et tout genre, social blade,
qui permettent d'avoir justement des stats comme ça sur YouTube.
C'est ça, donc, du coup, je me suis orienté vers quelque chose de plus tiers,
et donc social blade, qui est justement une entreprise
qui récolte à grande échelle de la donnée YouTube,
et ensuite vient te faire des tops, vient te donner plein d'insights,
ce que souvent, ce qui est bien que social web, social blade,
c'est qu'il te permet aussi de retourner dans le passé,
tu vas devoir, par exemple, le Squeezie, il avait combien d'abonnés en 2018, etc.
Donc ça peut être intéressant.
Donc ça a été ma première porte d'entrée,
bah ils savent pas qu'ils sont pas cons social blade,
parce qu'ils ont une API qui coûte un certain prix,
et si tu passes pas par leur API, tu peux pas avoir trop d'infos.
Et au début, je me suis dit, bon, on va se scraper.
J'ai le choix entre payer l'API ou sortir les outils scrapping.
Bon, pour expliquer, API, c'est la manière propre de faire.
Scraping, c'est récupérer en masse des pages et extraire les infos au bon endroit.
API, on la met à disposition pour un bot,
et scrapping, c'est tu prends la mise à disposition pour les humains,
donc les sux, celui, et tu viens récupérer l'info dedans.
Donc c'est pas fait pour, tu vas y aller,
et même souvent les sites, tu dis un peu pirate.
Je n'aime pas du tout, qui est pas ça.
Et donc j'ai scraper social blade,
ce qui a été étonnamment simple, quand tu vois,
enfin je veux dire, tu mets une API payante,
et au final, tu peux la scraper,
genre, sans déconner, j'ai mis 15 lignes de code, et c'est bon.
Et donc du coup, je me suis dit, ok.
Maintenant, ils sont quand même un peu malins,
parce que tu n'as pas accès à des requêtes très avancées,
si tu n'as pas le tout de premium.
Donc là, tu te dis, bon, ils te laissent scraper,
enfin, il n'y a pas de système qui te bloque,
dans les scrapping de manière hardcore,
mais d'un autre côté,
tu n'as pas non plus de requêtes premium,
tu ne peux pas par exemple filtrer par catégorie.
Et le problème, c'est que du coup,
dans les premières chaînes, j'avais METROOGIMS, VEVO,
et plein de trucs qui n'étaient pas forcément intéressants pour notre recherche.
Oui, parce que nous, d'avoir les chaînes de musique
qui ont énormément d'abonnés,
et qui du coup venaient casser les tops,
et après, si je devais faire un traitement et tout ça,
c'était compliqué.
Donc j'ai trouvé un autre site qui s'appelle Channelcroller.
Channelcroller, qui fait la même chose.
En gros, et lui, par contre,
il te permet de faire des recherches avancées.
Donc là, let's go, j'ai repris à peu près le même bout de code,
voilà, c'est exactement ça.
Donc en fait, j'avais juste à générer la page avec le top,
et ensuite, une fois que j'avais ça,
j'avais fait mon petit script d'une quinzaine de lignes,
et puis let's go.
Faut savoir que, à votre avis, ça coûte combien,
si tu veux que le site, plutôt que d'avoir le scraper,
il te génère un CSV avec toutes les infos.
Parce que là, quand tu fais une recherche,
tu peux cliquer, exporter en CSV,
il te dit, ok, si tu payes cette somme-là, je te sors le CSV.
Sur toutes les chaînes françaises, du coup.
Non, je vais dire, l'équivalent d'un top 150,
pour une catégorie, par exemple,
je vais avoir le top 150 des chaînes de tech en France.
Combien y t'a eu-t-il le fond payé, Channelcroller ?
Je parle d'Ibal.
Tu l'as compris ?
On n'est plus proche des 50.
Ils te le font payer en fonction de ta requête
entre 40 et 70 balles le CSV.
Le CSV, c'est pas le CSV.
Je crois que c'était l'abonnement.
Non, le CSV.
Il y a un petit truc exporté en bas à droite,
exporté en CSV, et il te met une facture, c'est en dollars.
Donc c'est plutôt, après le l'euro s'effondrait,
donc on y est.
Mais en gros, quand j'ai vu le truc,
la première facture qui m'ont mis, c'est 70 dollars.
Au début, j'ai vu le truc télécharger,
je me suis dit, c'est gratuit.
C'est fou, et je clique.
Ok.
J'aurais pu te demander de lâcher la CV,
mais je me suis dit, c'est pas dans mon éthique de travail.
C'est beau, ça.
On va payer des économies.
Et c'est comme ça qu'on a un beau plateau.
Tout ce qui n'est pas un plan,
on les entend rire, ça réagit.
Mais tout ce qui n'est pas dépensé,
justement, en données,
et dépensé en caméra.
Dans le converte.
C'est pour ça qu'on a des plantes vertes.
C'est parce que c'est l'argent qui est passé là.
Du coup, je récupère ces données-là.
Donc, je récupère les chaînes,
et je monte,
en gros, je récupère l'équivalent de 6 top 100
dans 6 catégories différents.
D'accord.
Ça va de humour, entertainment, sport, etc.
Donc, en fait, j'ai pas vraiment...
Au final, ça me fait un top 900,
parce que dans mon scrapping,
des fois, j'en ai 100,
des fois, j'en ai un peu plus.
Donc, j'ai les 900 plus grandes chaînes
avec certaines catégories filtrées, en gros.
D'accord.
C'est mon premier point de départ,
mon corpus, je connais.
Et t'as fait quoi de ces chaînes YouTube ?
Et de ces chaînes YouTube,
ensuite, ça devient mon point d'entrée
pour aller récupérer les vidéos,
parce que moi, à la base,
je voulais aller récupérer les vidéos du top.
Mais je pensais pas,
déjà, que la partie récupérer le top
allait être aussi...
C'est compliqué.
Ouais, c'est compliqué.
C'est que ça...
Surtout que ça a pris du temps.
En fait, c'était mes...
Donc, maintenant, j'ai...
On va dire mes 1000 chaînes YouTube.
Je me dis,
il faut que je récupère les vidéos.
Et là, j'ai pas fait dans la dentelle.
C'est-à-dire que j'ai récupéré
toutes les vidéos de ces chaînes
depuis leur création.
Donc, c'est-à-dire que pour Squeezie,
j'ai aussi récupéré ces vidéos de...

Ouais, même avant,
il y en a certains,
j'ai des vidéos de 2014, tu vois.
Et donc, j'ai tout récupéré.
Si je vous dis,
le top 900 YouTube,
combien de vidéos
ils ont sorti
depuis la création de chaînes ?
En gros,
900 YouTubeurs,
ça représente combien de vidéos
si on prend le top 1000 FR, du coup ?
Ah ouais, mais ça dépend
quand est-ce qu'ils ont commencé, tout.
Bah, il y en a qu'on peut.
À la louche.
À la louche,
moi, je vais dire...
Attends, m'influence pas.
Euh, je...
10 000.
10 000 vidéos ?
Non, c'est pas assez du tout.
Attend, attend, attend.
10 000 vidéos, ça veut dire
qu'ils ont tous posté 10.
Moi, je veux dire 90 000.
Ouais, mais il y en a avec grand nombre pas.
Ah, mais non, c'est les top 1000.
Je veux dire 90 000.
90 000, donc ça fait 100 ans.
Oui, c'est ça, 100 ?
100 par chaîne.
100 par chaîne.
Fecteur 10, hein.
Bah ouais, non, mais voilà,
mais je suis influencé.
Je vois du coup.
Vas-y.
J'ai récupéré la bagatelle
de 780 000 vidéos.
What ?
780 000 vidéos.
Euh, donc...
J'y suis, en fait...
Vous êtes prolifiques, hein.
Ouais, mais en fait,
il faut savoir que justement,
je vous ai dit, c'est un peu mon métier,
et il se trouvait que j'avais un outil
à tester et que je voulais un peu
stress-test mes outils d'extraction.
Donc, je me suis dit, vas-y,
tu lances sur tout,
tu récupères tout,
et puis après, on discute.
Je me suis dit, à moi-même,
si ça bloque ou quoi, on discute.
Donc, tu t'attendais à peut-être
que ça plante au bout d'un certain temps.
Mais non.
En fait, si il me bloquait au bout d'un moment,
bah j'aurais dit, je prends toutes les vidéos
de ces chaînes-là, et on remonte jusqu'à
2018-2019 en fonction de quand il m'aurait...
Ou alors, on fait l'extraction
sur une semaine, voilà, le temps de
laisser respirer un peu.
C'est ça, où j'aurais mis
des time-outs, ou quoi.
Et non, j'ai tout récupéré.
Voilà, donc là, j'aimais
750 000 vidéos YouTube.
C'est un giga-hemis de données,
parce que c'est dans un tableur,
dans un data frame.
Donc, j'ai un giga-hemis de données,
750 000...
Enfin, c'est entre 740 000 et 780 000.
Je les fais de plusieurs fois.
Et donc là, voilà, je récupère
toutes les infos.
Il faut savoir que, en plus,
l'extraction des 750 000 vidéos,
je les fais deux fois.
Donc, techniquement, j'ai envoyé
un million et demi de requêtes
à l'API.
Parce qu'en fait,
avec un endpoint, j'ai les vidéos,
avec l'autre endpoint, j'ai les stats.
Et alors, comme je voulais les deux,
t'appuies combien ?
Zéro !
Mais non !
On fait de la magie noire.
Dans ma boîte, on fait de la magie noire.
On a développé des techniques
de sourcils suprêmes.
Et donc du coup...
Pour que les gens se rendent compte, vraiment,
payer des...
Enfin, les APIs,
à ces échelles-là,
ça peut coûter des fortunes.
Et l'API YouTube est connu pour être
dans les plus chers.
Alors, c'est quand même...
Ça a été parmi les premières APIs des GAFAM, en fait,
à comprendre que, plutôt que de bloquer
l'accès aux données, ils pouvaient les monétiser.
Donc, en fait,
acheter des tokens API sur YouTube,
tu le fais en 2-2, quand tu deves.
C'est pas obscur ou quoi.
C'est même fait pour.
Il te donne un certain taux de token,
et puis ensuite, il te dit,
« Bon, bah, t'as dépassé,
ne t'inquiète pas, on veut bien te les donner,
mais il faut allonger. »
Et merci pour les économies.
Ouais, voilà, c'est ça.
Donc, du coup,
c'est vrai que je devrais faire une simulation
de...
Si j'avais pas eu vissement...
Mais ça devrait être...
Si j'avais fait mon sortilège, quoi...
C'est quoi le sortilège, on veut savoir ?
Le sortilège, malheureusement,
il est labellisé FirstLink, mon agence.
Ah !
Donc si vous voulez,
vous pouvez prendre un rendez-vous.
Le lien à Lid magnet, ça dit,
en fait, ce live,
il est sponsorisé par la société.
Et donc voilà, j'ai mis 750 000 vidéos.
Et maintenant,
au qu'il en a la donnée,
mais...
Qu'est-ce qu'on en fait ?
On en fait quoi ?
On en fait quoi ?
T'as déjà tout tableur ?
Là, ça va, ça,
ça s'ouvre encore dans Excel.
Il faut savoir que la limite d' Excel,
elle a 800 000 lignes environ.
Donc lui, il rentre encore.
Souvent, mes dataphomes ne rentrent plus.
Comme il a été fait,
il rentre encore dans Excel.
Mais après, je l'ai jamais ouvert dans Excel,
mais ça a été à 800 000 lignes.
Donc, on veut des informations
sur les sponsors qui sont sur ces vidéos.
C'est ça.
Et en fait,
du coup, là, tu te dis,
dans une vidéo,
où est-ce qu'il y a de l'info ?
Où est-ce que je peux choper
ce genre d'info dans la vidéo ?
Il aurait pu avoir différentes méthodes
avec le scrapping,
aller chercher des trucs visuels
dans les fenêtres.
Moi, en fait,
on avait pris,
on en avait discuté,
on s'était dit,
cette info-là,
on pourrait la choper directement
dans les descriptions.
Parce qu'en fait,
pour tout vous dire avant,
on avait pensé à passer
par une petite extension
qui s'appelle SponsorBlock,
qui est en fait
une extension qui te permet
de faire comme un adblock,
mais qui te passe des sponsors
dans les vidéos.
C'est un truc communautaire,
et ils partagent leur données.
Moi, c'est moi qui t'avais parlé
de ce truc-là,
et effectivement,
de notre connaissance,
si jamais il y avait un endroit
où il fallait trouver
un dataset qui correspond
à trouver l'ensemble
des sponsors de YouTube,
c'est quand même une info bizarre,
et bien,
moi, mon meilleur paris,
c'était SponsorBlock,
qui te fournissait un,
vraiment, comme tu dis,
un fichier de base de données
avec un maximum de vidéos
et de timecodes,
où tu as vraiment début
par un sponsor,
type de sponsor,
est-ce que c'est quelqu'un
qui fait son autopromo,
est-ce que c'est un sponsor
partenaire de tout ça ?
Si c'est de musique,
l'intro, ou trop, etc.
Et donc, ça n'a pas été utile, ça ?
En fait, la base de données
en soi est vraiment bien,
et en fait,
comme c'est communautaire,
ça a même des systèmes de vote,
où tu peux voir, du coup,
si un segment,
il a été publicité par la commu,
ou pas,
le problème, c'est qu'il était
trop restrictif,
parce que sur les 700 000
vidéos et calques,
il m'en restait,
même pas 7000,
le final de filtrés.
Et donc, directement,
je me suis dit,
c'est déjà pas mal,
mais
une sponsor sur 100,
c'était trop,
et en fait,
après, j'ai pu croiser
des sources et tout ça,
regarder un peu ce qui s'était fait,
et je me suis rendu compte
qu'on était quasiment
du simple au double,
à rapport à ce qu'il y avait
en niveau de sponsor.
Et alors,
en fait,
dans un monde idéal,
sponsor block,
aurait eu toutes les infos,
et on aurait pu, du coup,
différencier sponsor,
affiliation, etc.
parce que c'est très précis
sur sponsor block,
c'est vraiment tout.
On n'en a pu compter
quelle durée moyenne
durant une sponsor et tout,
mais
c'était trop restrictif.
C'était trop restrictif
et je me suis dit,
le problème, c'est que,
génial, tu as récupéré
758 vidéos,
il y en a 5000 pertinentes,
tu sais qu'il te manque la moitié.
Tu ne sais pas,
en plus, la moitié quitte manque,
il y a sûrement
un facteur discriminant.
C'est-à-dire que c'est pas
le dataset au hasard
qui en a perdu la moitié.
C'est forcément,
par exemple,
des créateurs qui passent
à la trappe,
ou une période,
ou un certain type de vidéo.
Et donc, en fait,
quand tu fais ça,
parce que tu pourris
un peu ton enquête.
Tu pourris ton échantillon,
parce que, du coup,
mes tops,
où j'ai récupéré
des tops assez égaux,
les autres, pas pour d'autres,
tu ne sais pas,
ça se trouve,
la catégorie tech,
les gens utilisent beaucoup
ce truc-là,
donc, t'auras beaucoup de vidéos
de tech,
et au contraire,
dans le gaming,
par exemple,
elles n'y seront pas.
C'est probable.
Non, mais c'est probable.
C'est que les gens un peu
t'éco,
s'utilisent plus
ce genre d'extension.
Ou que le lifestyle
et tout ça.
Donc, en fait,
le problème,
c'est que c'est trop orienté.
En fait,
tu peux accepter d'avoir
moins de précision,
si tu sais que c'est
un peu prémogène.
C'est comme quand tu fais
un sondage,
tu acceptes de ne pas avoir
l'entierté de la population,
parce que tu fais
un truc représentatif.
Donc, ça,
on met de côté.
Maintenant que j'ai ça,
je me dis,
on va vraiment
faire de la foule description,
mais on met un peu
de côté l'idée
qu'on va pouvoir
viser que les sponsors.
En fait,
je me suis dit,
on va regarder
tous les liens
de toutes les descriptions
qui sont contenus dans les descriptions
de quoi ça parle.
Et en fait,
en faisant ça,
je me dis,
bon,
il y aura des liens YouTube,
il y aura des liens Twitch,
il y aura des liens Spotify, etc.
Mais il y aura aussi
des liens d'autres de marque.
Et donc,
comme ça, eux, je les identifie
et c'est sûr que je bosse
ensuite.
Donc,
j'ai plutôt travaillé comme ça.
Donc, en gros,
tu as fait,
si j'ai bien compris,
tu as scrapé
toutes les descriptions
de ces vidéos-là.
Et dedans,
tu as regardé,
tu as extrait
tous les liens HTTP.
Et j'imagine qu'avec ça,
tu as dû en voir
parce que les gens en description
vont mettre leurs liens,
leurs Twitter,
de leur Twitch,
ou des trucs comme ça.
Donc,
cela,
tu peux faire une blocliste,
par exemple,
je ne peux pas les voir.
Par exemple,
en fait,
il y a vraiment une dizaine de liens
qui étaient énormément
devant les autres.
Parce que c'était Snapchat,
Facebook, Twitter, etc.
Et donc,
cela,
tu peux les nettoyer
tracément.

je le fais à la main.
Je les nettoyais à la main.
Et donc,
c'était...
Qu'est-ce qu'il reste alors ?
Mais en fait,
ce qu'il reste,
ensuite,
il y a quand même beaucoup de travail.
Il y a un truc qui est très compliqué
auquel j'avais pas pensé,
c'est les Bitly et les liens courts.
Parce qu'en fait,
j'ai récupéré tous les liens.
Ça a pris plaisir, oui.
Et j'ai des outils
qui sont très puissants
pour récupérer les liens
dans les descriptions.
Donc,
ça n'a pas de soucis
de récupérer tous les liens.
Pour convertir un lien
en son nom de domaine,
tu vois,
parce que ça ne m'intéresse pas
d'avoir une marque,
slash,
Squeezie,
une marque,
slash,
Cyprien,
une, etc.
Récupérer juste le nom de domaine,
sans faire le lien.
Ça va.
Mais quand c'est des liens
qui sont chertes,

Là,
il y a un souci.
Parce que du coup,
je perds potentiellement
aussi beaucoup d'infos.
Ça se trouve,
ton programme,
allez nous sortir.
Alors,
le plus gros sponsor
des YouTube,
c'est Bitly.
En fait,
c'était plus ou moins ça.
Donc,
là,
ça a été la phase la plus longue.
C'est que j'ai dû résoudre
tous les liens.
En fait,
j'avais un détecteur
de liens raccourcis.
D'accord.
Et ce détecteur-là
m'a mis dans une liste
tous les liens raccourcis.

ensuite j'ai dû danser
90 000,
90 000 résolutions de liens.
Et c'était très lent.
Parce qu'en fait,
il y a beaucoup de ces trucs-là
qui sont périmés.
Donc,
en fait,
t'as quand même accès
aux liens qu'il était censé renvoyer.
Mais du coup,
ils sont lents, en fait.
Ils doivent être,
je ne sais pas du tout comment ça marche.
Mais je ne sais pas,
alors ça se trouve,
j'ai une débétise là-dessus.
Mais c'est peut-être qu'ils sont
indexés en tout nom genre.
Mais ces liens-là,
souvent,
ils étaient très lents.
Mais j'arrivais quand même à retrouver là
où ils étaient tombés
avec le petit que j'avais fait.
Et donc,
ça a pris un temps, mais fou.
J'ai partagé un moment sur Twitter.
Je mets une petite barre de chargement
sur mes scripts.
Et ça m'était...
C'est fini dans 479 heures.
C'était hier.
Ça a été ?
C'est vraiment ce que le temps
que ça a pris, du coup.
Oui, du coup,
j'ai dû ruser.
Mais le truc,
j'ai vraiment une...
La barre de chargement qui dit
bravo, tu as fait 0%.
Il te reste 479 heures.
Et c'était au moment
où vous avez annoncé la chronique.
Et donc, du coup, j'aurais bien...
Oui, vous inquiétez pas, tout se passe bien.
Nickel, on est cool.
Mais donc, j'ai un peu bidouillé.
J'ai mis des systèmes
un peu comme un cache
qui permet de détecter les URL
et de pas forcément refetch
ce que l'on a déjà été fait
et où tu peux détecter dedans
vers où ils vont mener.
D'accord, d'accord.
Ok, j'ai compris.
On a dû...
on a dû ruser un petit peu, etc.
Donc, de là,
tu passes à tes domaines
plus ou moins filtrés,
à ton truc final
où tu as tous les vrais domaines
qui ne sont pas des réseaux sociaux.
J'ai une liste de noms de domaines
pour chacune des vidéos.
Par exemple, j'ai eu une vidéo,
je reprends l'exemple de Squeezie
parce que souvent, c'est lui
sur lequel je faisais des tests
parce que c'est le premier
qui s'est revenu avant.
Et par contre, j'avais Squeezie,
sa vidéo, puis j'avais une case
où c'était marqué
Facebook, Twitter, Twitch,
Yoko, ça, ça marque de l'autrement.
Et puis, il y avait, par exemple,
après, je sais pas,
moi, un sponsor, tu vois.
Et puis, j'avais ça.
Il fallait que je nettoie les premiers
et que je récupère ce qu'il y avait ensuite.
Bon, aussi pour vous donner un peu
des insights,
il faut savoir qu'au moment où ça
est arrivé, je me disais
que c'est une bonne idée
de pimper un petit peu ma bécanne,
d'avoir un peu plus de puissance,
de calcul.
Donc, je me suis acheté de la RAM
qui est arrivée corrompue.
Donc, j'ai eu des écrans bleus
pendant une semaine.
Ah non.
Donc, ça aussi, il faut savoir
que ça a été un moment aussi
très compliqué de...
Bon, allez, je me rajoute de la RAM.
Comme ça, je vais pouvoir aller plus vite,
je vais pouvoir faire plus de multiscript.
Ah, mais...
Il y a tout ça et plus de puissance.
Parce que tu fais tout en local, du coup ?
Oui, en fait, je fais ça en local
parce que, en gros, c'est des scripts
que je développe à la volée
et qui ensuite, je lance sur ma...
En fait, je le lance sur ma machine
et j'ai pas d'environnement virtuel
dans lequel je mets.
J'utilise des environnements virtuels
quand je fais mes cartographies Twitch
parce que là, j'ai une limite
de matériel très concrète
de Bightfault 644 RAM.
Donc...
Mais là, en fait, c'est des trucs
que je peux mettre sur ma tour.
C'est pas assez gourmand que ça.
Ok, j'aurais cru que...
Non, c'est pas assez gourmand que ça.
En fait, c'est gourmand
plus en complexité de l'algorithme.
En gros, il vaut mieux
que ce soit bien codé.
Mais sinon, après,
je fais je les usurais.
Les usurais à la chaîne.
En fait, tu les fais à la chaîne
et tu peux pas...
En fait, je ne pouvais pas trop
en plus en lancer trop simultanément
parce que finalement,
ce n'était pas...
Vu que j'avais mon système de cache,
si j'avais une machine super puissante
et que je dansais tout d'un coup,
je perdais cet effet-là
et donc, c'était quand même
plus rapide de restreindre les trucs.
Donc t'achètes de la RAM, tu l'as mets,
écran bleu.
Écran bleu,
puis j'en ai eu des différences
et un moment, ma carte mère bipée
pour me dire que ma carte graphique
avait grillé.
Mais en fait, du coup, j'ai appris
une panique.
J'étais tout seul dans mon appart
en train de tourner de...
Putain, j'ai à force de vouloir
mettre la RAM, de brancher,
de débrancher mon ordi
parce que ça ne marchait pas.
Mais en fait, il y a un moment,
l'ordi est juste par partie
et ça faisait bip,
bip, bip.
Du coup, je tape...
Tu te dis à la gueule, ça veut dire...
un bip-lon de bip-lon.
Je tape ça dans Google
et tu sais, tu as des trucs...
Tu sais, de debug, là,
et les gens, tu sais,
ou tu as ces espèces de forums
et il y a un mec qui dit
à ça, quand c'est un long de course,
la carte graphique est grillée
et le truc, genre,
1000 pouces vers le haut.
Là, je suis...
Oh merde.
Ok.
J'ai vécu à une grillée ma carte graphique.
J'étais dégoûté, j'ai cru
que j'allais pleurer.
Qui est potentiellement le composant
le plus cher de cette loi.
Définitivement, ma tour
n'est pas exceptionnelle,
mais il y a une RT-70 dedans.
Ça fait un budget.
Ça fait chier.
Et...
Salut.
Si vous appréciez Ender Score,
vous pouvez nous aider
de ouf en mettant 5 étoiles
sur Apple Podcast,
en mettant une idée
d'inviter que vous aimeriez
qu'on reçoive.
Ça permet de faire remonter
Ender Score.
T'es d'une fusée.
En fait, j'ai appris...
J'ai des choses...
En fait,
c'est jamais des échecs,
c'est toujours des moyens
d'apprendre.
Exactement.
Il faut le voir ça comme ça.
C'est ça.
Et en fait, j'ai appris
que si ton ordi
avait des problèmes de RAM,
eh ben ça...
En gros,
la carte graphique
se boute pas.
Et donc,
plutôt que d'y dire,
il y a des problèmes de RAM,
il dit il y a des problèmes
de carte graphique.
Pratique.
Alors, si votre carte graphique
est cassée,
sachez que c'est peut-être
la RAM.
D'abord,
à la RAM,
j'avais des gros indices
qui pointaient vers la RAM.
Parce qu'en plus,
surtout que c'était...
Pour vérifier ça,
débrancher votre carte graphique
et tenter là sur un autre PC.
Oui, évidemment.
J'ai 4 PC à la maison.
Je vais venir tester ça.
Le coup du bip,
bip, bip,

bip,
bip,






bip,
bip,
bip,
bip,
bip,
bip,
bip,


bip,
J'ai passé une soirée dans mon bios et puis s'il y en a qui sont là, merci aux gens qui me
se surtwitch parce que je lance... En fait le seul moyen que j'avais de voir si ma
RAM fonctionnait c'était de lancer un stream parce que c'était suffisamment gourmand
pour justement pousser la RAM et que ça plante. Et donc je disais sur mon discord
je vais lancer un stream, ça va planter mais on va voir à quel moment ça plante et comment.
Et du coup ils étaient là on me dit oui on t'entend, non on t'entend pas c'était vraiment un live de guignol.
Oui on t'entend puis d'un coup je leur dis attention je vais cliquer sur un truc on va...
Fini.
Je suis fini donc ça a été une soirée très compliqué.
Bon plus de peur que de mal donc ta tour fonctionne.
Je suis revenu sur ma config de départ.
T'es revenu.
C'est vraiment du temps pour rien parce que je suis revenu à ma config de départ.
Et tu reviens à ton enquête.
Et donc je reviens mon enquête je relance tout ça et donc là j'ai ma liste des domaines
et donc vous savez j'ai dégainé mon outil favori.
J'ai fait une petite carte aux avec Géphi parce qu'en fait je me suis dit la première
chose que je voulais voir c'est est ce qu'il y a des marques qui sont plus reliées
avec les autres, plus reliées les unes avec les autres.
Qu'est ce qu'on peut la voir ?
Alors normalement vous avez même une vidéo de...
Alors ça c'est à quoi elle ressemble au final mais vous avez même normalement une
petite vidéo je sais pas si Gabin pourra la choper où on voit qu'on est en train de
se faire spatialiser parce que j'ai trouvé ça assez sympa je sais pas.
Ok.
Je me suis dit oh tiens c'est joli.
Donc je vous ai fait une petite capture je sais pas.
Donc voilà voilà, voilà, oui.
Oh trop joli.
Ça c'est ce que j'avais sous les yeux du coup.
Mais attends qu'est ce qu'on regarde là du coup ?
C'est la naissance de l'univers.
La naissance de l'univers.
Alors c'est déjà un peu nettoyé mais c'est tous les liens dans les descriptions du
YouTube français et du top 900 YouTube français.
Mais donc ça te sort un truc bon là tu vois même du coup le résultat que j'avais
au départ tu vois ça me sort un truc comme ça.
Ok c'est tous les liens mais du coup les liens...
Là donc les points c'est des liens.
Alors en fait c'est ce qu'on appelle une cartographie bipartite c'est à dire qu'il
y a deux types de données dedans.
Il y a à la fois les chênes donc tu as un point squeezie, un point joycain, un point
mixem et tu as aussi des points pour les marques.
Et ensuite ils sont reliés entre eux quand par exemple squeezie a fait une op avec
Rhinoshield, boom un lien vers Rhinoshield, il a fait une op avec Nord VPN, boom un lien
avec Nord VPN etc etc.
Ok hyper stylé.
Alors si on voit le résultat final donc tout ce travail après un peu de clean up
et tout j'imagine.
Mais en fait la cartographie n'a pas été la finalité ici, elle m'a aidé à passer
à l'étape suivante.
D'accord.
Parce qu'en fait la cartographie souvent moi ici je suis souvent venu la présenter comme
étant l'outil final parce qu'elle peut servir mais en fait la cartographie sert beaucoup
à faire de l'analyse exploratoire.
D'accord d'accord.
J'ai quoi comme donner sous les yeux comment, là de comment je comprends.
Et en fait est-ce qu'il y a des trucs, déjà tu as remarqué des trucs marrant sur cette
carte-là ?
Ouais bah les premiers trucs qu'on voit en fait c'est que d'un point de vue très bête
c'est que ça m'a permis de voir quelles sont les liens qui ressortent le plus et un
peu comment c'est structuré.
Et quelles sont les plus gros sponsors de la plateforme ?
Alors ouais on voit certains sponsors, alors on voit déjà tout à gauche en bleu et un
peu en rose, on a U-Type, Tipeee et tous les trucs de Tipeee, tu as une question ?
Ouais, enfin je les ai vendés, les couleurs du coup ça représente des clusters de tout
Ouais c'est un cluster en gros j'ai lancé en fait de je lance un algorithme, c'est
l'algorithme de Louvain qui est juste à partir des données de la carte fait en sorte de maximiser
les points pour que s'ils soient de la même couleur ils ont un maximum de liens entre
eux et un minimum de liens avec les autres.
D'accord donc c'est des espèces de clusters logiques ?
C'est des clusters, c'est tout simplement ça.
Alors et ce qui est intéressant de voir c'est qu'effectivement là on efface à une synthèse
des liens en description ce qui veut dire qu'on va voir plein de sponsors et il y a
aussi plein d'autres choses.
Ouais il y a du Tipeee et du U-Type, j'ai nettoyé les réseaux sociaux.
Il y a Rockstar Games à mon avis, c'est pas des sponsors Rockstar ça doit être des
gens qui partagent leurs liens de jeu ou des serveurs.
J'ai vu Github aussi.
Ouais il y a Github qui est en plein centre, c'est hyper marrant.
Github, Githlab au dessus.
Ouais c'est pas mal du coup, ça veut dire que du coup les gens partagent leurs épaules.
T'as plein de trucs, si tu dézoomes même et si tu dézoomes je crois que c'est tout
à gauche alors là le problème c'est que j'ai pas fait les liens assez fort mais tout à
gauche vas-y tu vois c'est un peu rose là ça c'est les citations, tout à gauche là
c'est les citations donc là tu as du Google mais si tu vas encore plus à gauche tu as
New York Times, BBC, les sources.
En fait tu as tous les gens qui citent leurs sources, tu as du gouvernement vas-y si tu
peux dézoomer les gabins et monter un petit peu.
On dirait...
Mais là tu vois tous les petits points que tu vois ils sont tout petits parce que souvent
ils sont utilisés qu'une fois.
Oui mais parce que tiens ils ont cité un truc du gouvernement, un Wikipédia, là on
voit par exemple Wikipédia il est là tu vois et ça c'est la partie citation de source.
C'est marrant.
Et elle est un peu à part du reste parce qu'en fait tous les youtubers ne citent pas leurs
sources parce que...
Mais il y a très peu de YouTubeurs qui doivent citer beaucoup de sources parce que...
C'est ça parce que c'est ceux qui font de la vulga qui citent des sources les autres.
C'est hyper marrant.
Donc voilà ça j'ai ça et ça me permet, on voit de Nord VPN.
Bah vas-y tu peux aller en plein centre, le plein centre c'est ce qui est utilisé par
tout le monde en gros.
En fait ce que la carteographie m'a permis de me rendre compte moi au début je l'avais
imaginé en me disant je vais voir des clusters de par exemple on va voir les trucs de VPN
ensemble, puis un peu plus loin on va voir le gaming et un peu plus loin on va voir les
autres trucs.
Mais en fait non c'est tout mélangé d'accord.
En fait tout est mélangé et vas-y tu vas en plein centre.
C'est-à-dire que telle industrie ne cible pas nécessairement tel YouTuber.
Bah ça on va le voir après mais non en fait pas vraiment.
C'est le premier truc alors ça c'était la première idée que je me t'ai dit je me
t'ai dit on va peut-être pouvoir voir vraiment des clusters de gens qui ont la même strate
et en fait non.
D'accord.
Je vois pas Nord VPN.
Alors Nord VPN où est-ce qu'il est ? où est-ce qu'il est ?
Normalement il était, je l'avais vu il est au centre normalement mais je saurais pas
le retour ici.
One football ils font beaucoup de sponsors aussi.
Allô paradise.
Faudrait chercher, ils y sont quelque part, il y a même tout celles que vous connaissez.
Ils sont souvent dans un petit cluster ensemble mais je saurais plus te dire là et puis je
vais pas te faire chercher à Gabin comme lui.
Kirsus, tu vois quand même un petit cluster par exemple.
Peut-être au-dessus là.
Kirsus, Elgato, il y a un petit...
Même là Kinguin qui est un truc de jeu qui est avec la Fnac un peu puis tu as level
down et instant gaming.
J'ai deux A qui sont les reventes de clés.
Oui, les clés de jeu.
Et tu les vois à côté de Play Happy Club.
Il y a quand même, tu vois des...
Il y a quand même une logique, Zerator.com qui est à côté d'Eclipsia.
Donc pour voir à quel point c'est vieux.
Eclipsia c'est là où streamer Zerator à ses débuts.
Ce que c'est YouTube depuis...
Je veux dire là j'ai récupéré Zerator et là j'étais impressionné je crois qu'il
a 7000 vidéos sur ta chaîne YouTube et donc ça remonte.
Ah tu as remonté jusqu'au début de ta chaîne.
J'ai sa première vidéo c'est-à-dire que là ici il y a potentiellement des marques
qui ressortent qu'on ne pas fait d'OP depuis deux ans.
Ils ont dû faire des op bref.com.
Ou il doit y avoir...
Ou ça ?
Ou alors ils ont un lien d'affilée.
Juste à côté de Zerator, tu as bref.com donc c'est un navigateur.
Ouais bref, bref, Zerator a dû faire beaucoup de bref.
Soit c'est des op, soit c'est un lien d'affiliation.

C'est trop marrant.
Et donc voilà, voilà, tu as plein de choses, tu as Reddit évidemment.
Il y a un gros Minecraft en haut c'est marrant.
Ouais c'est sûrement pour les serveurs.
Ouais les serveurs.
C'est quand ils se partagent.
Ah oui effectivement, et jeux vidéo.
T'estimes aussi.
Quand tu es...
Quand ils faisaient des jeux indés, souvent ils partageaient le lien du jeu si tu voulais
les jouer aussi.
Ouais donc la taille des bulles pour expliquer c'est en fonction d'une nombre de liens
qu'ils ont donc plus la bulle est grosse, plus ils en fait de Sponzo en gros.
Ouais c'est ça, là ce que j'ai utilisé si je dis pas de bêtises c'est ce qu'on appelle
le degré entrant donc en gros c'est plus le point est gros et plus il a été cité
par des personnes différentes.
Ah oui, en fait.
Et cité en description, je l'ai pas précisé, parfois c'est de la du Sponzo, parfois c'est
autre chose.
Oui ça peut être plein de choses, j'ai choisi ça, c'est aussi j'ai utilisé une échelle
logarithmiique pour lisser parce qu'on a beaucoup de points gros parce que sinon on en aurait
deux qui serait énormes et puis tous les autres sont lissés.
J'ai lissé ça avec un logarithm, ok.
Et une fois que tu as fait cette cartographie, qu'est ce que tu fais ensuite ?
Une fois que j'ai vu ça, je me suis dit en fait, le truc le plus ambitieux ça aurait
été d'attaquer la data set de front et de lui faire ressortir les insights.
Là je me suis dit je suis plutôt parti à un Analyse Exploratoire pour dire ok, quels
vont être les marques qui vont m'intéresser, quelles vont être les liens qui vont m'intéresser
et je vais plutôt aller voir par marque comment ça ressort parce que dans la cartographie
au final ici, il n'y avait pas de gros insights qui a ressorti, je me suis dit je vais cibler.
Et donc évidemment il y a des marques qui sont ressorties, à votre avis quelle marque
ressortes on en a parlé déjà ? C'est quoi les marques qui bombardent le web, bombardent
Youtube de pub ?
Une VPN ?
Ouais une VPN, Rhinophile, exactement, qui d'autres.
Et ciblates ?
Tu t'as fait mon top 3.
Allez.
Alors c'est pas le top 3 des plus utilisés mais c'est le top 3 sur lequel j'ai décidé
de focus parce qu'ils ont des caractéristiques différentes.
Red Shadow Legends on dit dans le chat.
Ouais alors Red Shadow Legends est tout ce qui est application, je l'ai pas pris en compte
pour une raison très simple c'est qu'en fait ils mettent les liens des Play Store et des
App Store et donc en fait c'était trop galère.
C'est un peu trop infiltré.
C'était beaucoup trop galère parce que du coup il y avait un énorme point Apple, il
était gigantesque mais ça pouvait aller de l'application perso à Red Shadow Legends,
à d'autres trucs les sites d'encontre etc donc tout ce qui est application a été
viré.
Pour ça, peut-être qu'on pourra revenir sur sur...
Si vous voulez, si vous avez eu un besoin particulier, techniquement c'est faisable.
C'est faisable en fait, on a les données, maintenant il faut du temps de traitement,
il faut, il y a beaucoup de choses qu'il faut faire à la main, si la data ne se fait pas
tout automatiquement, il y a des trucs qu'il faut voir à la main.
Donc voilà et là ensuite du coup j'ai filtré mon data frame à chaque fois pour me garder
que ceux qui contenaient un lien en particulier.
Donc en fait par exemple j'ai fait un zoom sur NordVPN et j'ai regardé toutes les vidéos
qui contenaient le lien NordVPN.
Donc il y a à la fois de l'affiliation et il y a à la fois de la sponsor et par exemple
en fait j'ai regardé quelles sont les catégories de stream, les catégories de vidéo qui sont
les plus utilisées par NordVPN ou il a fait le plus de choses.
Donc là par exemple c'est en termes de quantité NordVPN, ils font beaucoup de vidéos avec
des gens qui sont dans la catégorie Sciences et Technologie, puis comédies, puis entertainment,
puis sport, puis enfin on voit que c'est très divers mais que là où il y a un peu de

Si vous arrivez à zoomer pour qu'on voit les types de catégories.
J'ai écrit un peu petit de temps je suis désolé.
Non mais peut-être il va faire pas.
Je sais pas s'il va pouvoir vraiment zoomer parce que c'est de l'HTML interactif.
Quand tu zooms il s'en va à une autre.
C'est assez équitablement réparti.
Ouais carrément.
Je pensais que ce serait plus grand dans la Sciences et Tech.
Et moi le final j'avais même pas pensé à la base quand j'ai vu Sciences et Tech, j'ai été surpris.
Je me suis dit bah oui c'est vrai que c'est de la Tech la base NordVPN mais comme on les voit
surtout sur...
C'est ça ouais c'est vrai.
Ils ont autant de comédies, de...
Comédies, entertainment en vrai c'est les vrais premiers parce que tu peux les fusionner.
En fait c'est deux termes qui veulent un peu dire la même chose.
En fait la vidéo tu peux dire est-ce que je fais de la comédie ou de l'entertainement.
La frontière est pas évidente.
Très intéressant ok.
T'as regardé quoi d'autre ?
En fait ensuite j'ai la même chose en termes de vues.
C'est-à-dire que là ça dépend d'une...
J'ai mis une répartition du nombre de...
...d'hôtes de barois.
En fait de stream, ou enfin de vidéo j'ai retrouvé le lien.

Et là maintenant c'est...
Si on met en termes de vues.
Pareil, pas le plus étonnant.
Mais là on voit que c'est en fait la comédie et l'entertainement ils font beaucoup plus de vues.
Et ça va presque plus le coup au final alors.
Après c'est pas combien ils payent.
C'est pas combien ils payent et aussi il faut se dire qu'il y a aussi une histoire d'audience qualifiée.
Exactement.
C'est-à-dire que quand tu parles d'un VPN sur une chaîne de tech,
c'est que le public que tu touches a plus de chance d'être intéressé par un VPN.
Oui bien sûr.
Tu fais un truc qui a rien à voir.
Mais en fait...
Mais en fait on a un bon 3 quarts divertissement.
Ouais.
Et après science gaming en termes de vues.
C'est ça et tu vois que par exemple là où il y avait beaucoup de vidéos sport et moins de gaming,
bah là le gaming fait plus de vues au final que sport.
En fait pour les marques il y a deux strats,
il y a la strat de combien de streams,
enfin de chaîne du coup on touche,
les deux vidéos on touche,
mais aussi combien de vues au final on veut faire.
Et c'est aussi ça où il faut faire l'équilibre.
Et donc en fait après j'ai fait des petits trucs.
Par exemple tu peux voir le classement de ceux qui ont le plus fait de doper.
Alors peut-être que tu peux montrer RinoShield pour changer par exemple.
Ou c'est plus un diagramme en bâton
qui montre par exemple les youtubers qui ont dans VPN.
Le plus fait de deals avec RinoShield c'est ça ?
Ouais alors ça par exemple ça c'est le nombre de vidéos qui ont un lien RinoShield au cours du temps.
Au cours du temps.
Ah c'est trop drôle.
Boom !
C'est incroyable !
C'est septembre 2021, ils se sont dit,
et les gars, et YouTube ça marche.
On y va !
Tu vas voir qu'ils testent la strat entre 2017 et 2020 là.
Ils ont été d'un coup.
Et après ils se sont dit bon allez let's go,
on va lancer.
T'as la même avec NordVPN normalement,
Gabin.
T'as la même timeline, on va rester sur les timelines
puis après on reviendra sur les autres.
Mais tu vois NordVPN, eux ça a été un peu plus progressif,
mais tu vois aussi une augmentation au fil du temps.
Alors il faut savoir.
Alors les gens demandent,
les piques c'est Noël,
et là t'avais une vue qui était en...
Alors ça c'est cumulatif, peut-être que cumulatif c'est...
Très lycée en fait NordVPN.
Ouais, en fait ça va, tu vois qu'il y a une augmentation,
mais l'augmentation elle est pas,
c'est plus progressif, c'est pas RinoShield,
ou voilà, là tu la vois là.
Tu vois c'est quand même, t'as quand même un pic aussi
à peu près à la même moment,
mais c'est pas...
Donc là oui on voit Noël quand même,
Noël de 2018.
Et tu vois l'été aussi des fois qui a tendance
plutôt à retomber,
tu vois genre le mois d'août et tout.
Il y a moins de gens sur la plateforme,
moins de sponsors aussi, les gens sur la classe.
Et oui c'est assez fascinant.
Et c'est marrant de voir aussi la potentielle retombée.
J'ai l'impression qu'on peut aussi corrérer certaines de ces courbes
avec la période Covid,
où tu vois qu'il y a un all-in
sur les plateformes web,
et là que ce soit NordVPN ou RinoShield,
j'ai l'impression qu'on voit un petit peu une redescente en mode
ok alors c'est un peu une récession et tout,
on se calme quoi.
Alors là pour le coup je pense pas,
alors je sais pas si je leur ai envoyé la data vise,
mais j'ai aussi fait par curiosité un calcul
du nombre de vues sur la plateforme.
En fait j'ai accrédit toutes les vues et j'ai fait une timeline comme ça.
Et en fait on voit que le nombre de vidéos
il y en a de plus en plus au fil du temps,
et qu'en fait le nombre de vues il augmente de manière proportionnelle,
mais que sur la dernière année il chute un peu.

Et donc en fait tu vois que Youtube fait moins de vues
en moyenne depuis un an
que ce qu'il y avait avant.
Donc ça aussi c'est un autre truc que j'ai...
J'aurais pas cru.
Tu veux dire après le Covid ou...
Ouais grosso modo à partir de la reprise du Covid
il y a eu une chute des vues
alors qu'il y a une hausse du contenu.
Et la hausse elle est lissée.
Donc ça continue à augmenter petit à petit.
Il y a de plus en plus de contenu sur Youtube.
Enfin c'est même pas qu'il y a plus en plus de contenu,
mais c'est que il y a plus en plus de création de contenu.
Et mais par contre
les vues elles se sont empruntées.

C'est un peu baissé et c'est le cas sur Twitch aussi
j'avais fait une analyse où j'avais vu que
dès qu'ils ont tout rouvert avec le Covid
Twitch avait fait moins de vues qu'avant.
Et qu'il y avait des baisse.
Et les gens reprennent une vie normale.
Est-ce qu'il y a d'autres trucs
que tu as découvert dans ton merveilleux dataset ?
Ouais en fait j'ai vu qu'il y avait aussi des petites
strates qui pouvaient être différentes.
Par exemple, j'ai vu que...
Rhinoshield
vous avez peut-être pas vu l'axe
des Y sur les timelines qu'il y a avant
mais Rhinoshield on en est un pic
à un moment à 350 liens
en 2 mois
du coup ils ont
350 vidéos sur 2 mois
où il y a leur lien dedans.
C'est-à-dire qu'ils ont une strate où c'est beaucoup.
C'est là où un Nord VPN, leur pics
on est apparu dans 70 vidéos
sur le même laps de temps.
Donc en fait Rhinoshield
ils ont une...
très très agressif. En fait c'est beaucoup de...
tu vois là ça monte jusqu'à 350 le pic
et je crois que c'est sur octobre, décembre
donc c'est-à-dire que si tu prends toutes les vidéos
du top 900
entre octobre et décembre
bah t'as 350 vidéos
qui ont le lien Rhinoshield dedans.
Donc c'est beaucoup, beaucoup. Alors que si tu retournes sur Nord VPN
c'est pas autant.
Mais maintenant
moi je me suis posé la question
qu'est-ce qui fait qu'il y a certaines marques
on a l'impression de les voir partout tout le temps.
Et en fait c'est plutôt qu'il y en a certaines on les voit partout
et d'autres on les voit tout le temps.
Parce qu'en fait Rhinoshield du coup
monte des fois à 350 vidéos
mais en tout
j'ai repéré que 91
chaînes uniques
où ils apparaissent. Donc ça va parce que
ça va parce que par exemple Nord VPN
ils ont collaboré avec 141 streamers.
Donc c'est... ça compte pour
YouTube à reprendre donc je vais beaucoup faire l'erreur parce que sinon j'en travaille sur Twitch.
Tu peux répéter donc
Rhinoshield ils ont fait combien de partenaires ?
Ils ont fait des partenaires avec
91 chaînes différentes
sur... depuis
sur tout le monde data frame. Mais
sur leurs 91 partenariats
il y en a beaucoup plus
que Nord VPN. Alors que Nord VPN
eux ils ont fait avec 141 différents
mais ils en ont beaucoup moins
que Rhinoshield. Donc en fait Rhinoshield
tu te rappelles le nombre de...
Ils font plus de l'audience qualifient en fait. Rhinoshield ils vont plus cibler
en fait Rhinoshield tu les vois tout le temps
et Nord VPN tu les vois partout.
Tu vois le truc c'est que
Rhinoshield en gros ils vont avoir...
Tu as eu 900 chaînes à l'origine ? 900 chaînes
top
par category. Ça fait
plus de 15%
des créateurs qui ont été
sponsorisés. Et encore Rhinoshield
je pense que tu peux enlever un peu de... Non pas Nord VPN
Tu peux peut-être
enlever plein de chaînes qui sont arrêtées pas
des vraies chaînes de youtubeurs. Oui des chaînes secondaires
ou des chaînes de... Donc
en réalité ça doit être bien plus que ça c'est facile.
De toute façon un truc à dire c'est que
pour toutes mes stats que je vous sors là ça reste des approximations.
Parce que c'est une méthode qui en fait
cherche à montrer... Enfin on a pas la donnée
de base donc c'est un peu des moyens des tournées
donc c'est des approximations mais
de manière générale on a des tendances qui ressortent.
Ouais j'allais dire ça montre une tendance de tous les cas
ça montre une tendance de voir que Rhinoshield
ont moins
de partenaires mais par contre
les partenaires qui ont produit beaucoup de contenus
là où Nord VPN a moins
de contenus mais a beaucoup plus
un plus grand portefeuille et va attaper un peu plus
un droit à gauche et on l'avait vu
je pense que si on montre le camembert
de répartition de Rhinoshield par rapport aux catégories
justement c'est aussi un phénomène qu'on va pouvoir voir
de répartition de Nord VPN
ils ont beaucoup d'entertainement
beaucoup de...
voilà ça par exemple ça c'est Rhinoshield
c'est les vues ça ou c'est...
non c'est les mentions c'est bien ça
énormément de youtubers de gaming
ça c'est les vues
voilà ça c'est les vues donc
encore une fois l'entertainement fait plus de vues
mais si tu peux revenir sur celle d'avant
Gabin
voilà sur celle là
en fait c'est logique que Rhinoshield apparaît
sur beaucoup plus de vidéos parce que souvent le gaming
il publie plus
en fait de vidéos parce qu'ils vont plus
switcher sur les jeux faire des rediff etc
là où quand tu fais de la science et technologie
de l'entertainement etc souvent c'est des rythmes de publication
qui sont moins sous-pens que sur du gaming tu vois
donc voilà Rhinoshield ils sont
à plus de 50% de gaming
évidemment un peu de tech, un peu d'entertainement etc
et donc voilà pour
une petite découverte
d'autres, est-ce que tu as d'autres
d'autres petits trucs
juste pour finir à votre avis
si, j'ai voulu faire un petit focus sur Squeezie
ça s'est fait naturellement comme celle top 1 mais du coup
je voulais juste vous faire la petite devinette la dernière
à votre avis c'est quoi le lien
de Marc qui apparaît le plus souvent
dans une description, dans les descriptions des vidéos Squeezie
donc techniquement la Marc
qui a sponsorisé le plus de vidéos
ou il a eu le plus de partenariat ou qu'il a mis le plus en avant
techniquement, pas en termes de vues
mais en termes de nombre de vidéos
je suis con
je vous aide, on en a pas parlé
c'est pas dans VPN
ni Rhinoshield ni Displate
et dans le chat vous tentez Yoko
mais ça ne compte pas, c'est vrai
non Yoko ne compte pas, sinon Yoko
sa BD etc ressortent beaucoup
mais il y en a un qui ressort beaucoup mais qui est aussi un petit peu
qui montre aussi un petit peu comment on faisait
à l'époque, enfin comment on
faisait des descriptions aussi à l'époque
c'est une manière de faire des descriptions
qui n'existent plus mais qu'on fait peut-être un peu moins
je sais
c'était pas forcément des OP
c'est en fait un truc
qui brille d'entre eux une OP
une affiliation, un partenariat, on va dire
en gros s'il n'était pas en lien avec eux, ils n'avaient jamais mis leur lien
mais dans d'autres côtés
c'est un Steam
non c'est pas Steam, Steam apparaît beaucoup aussi
mais je sais qu'il faisait beaucoup
de vraiment jeux vidéo
c'est vraiment une marque
c'est pas non plus une plateforme ou quoi
c'est une marque
Razor, Logitech
pourquoi je l'ai dit ?
First try
c'est Razor
qui apparaît dans énormément
de vidéos de télévision
là tu m'as coupé l'air de se filer
j'allais donner des indices et tout
c'est Razor parce qu'en fait aussi il y a une époque où tu mettes ton setup
dans la description, certains le font encore
mais il y a eu beaucoup aussi de partenariat avec Razor
mais il y avait toujours
si tu veux trouver mon casque
en fait aussi il y avait aussi
des produits, etc
il disait tu veux retrouver mon casque, tu veux retrouver ma souris
tu peux la trouver sur Razor
c'est la marque que tu retrouves le plus
si demain tu veux te faire un marathon squizzy
ou tu re-regards toutes ces vidéos, tu lis toutes ces descriptions
bah t'aurais peut-être envie de t'acheter un tapis de souris Razor
à force
comme dans les vidéos setup ou la trim sa
c'est ça, trop intéressant
merci Nicolas pour cette petite enquête
tout ce travail
de faut se rendre content
agréger cette taille de data set
800 000 vidéos à peu près
en tout ça t'as dit combien de temps tout ce projet
on va dire je suis sérieusement
dessus depuis 15 jours
je pense que c'est à peu près ça
ça fait un moment qu'on a décidé du sujet
ça fait 7 étés
on a discuté cet été mais je me suis vraiment
mis dessus depuis 2 semaines
et ce qui est cool c'est que maintenant
tu as fait data set donc
t'en as extrait de l'information mais c'est pas fini
c'est que le début on va faire
des webinaires sur LinkedIn
je vais faire des points
là cette enquête pas je vais capitaliser
je vais manger sur cette chronique
franchement on est curieux
d'avoir de savoir ce que tu vas retrouver
puis même si des gens ont des idées
parce que dedans je me dis il y a
tellement de... en fait j'ai tous les likes
j'ai toutes les vulges
les commentaires je pourrais les récupérer aussi
mais en fait j'ai tellement d'informations différentes
que même si vous avez des idées
n'hésitez pas à me les partager parce que il y a des fois il y a quelqu'un qui me dit
tiens j'ai pensé à ça et c'est genre l'idée du siècle
et je me dis t'as bien fait de m'en parler parce que comme ça on en discute
c'est clair toi t'as donné les gens les idées
en parlant de discuter ensemble
travailler ensemble
trop trop cool et ben franchement
d'avoir des news de ce petit
projet
d'être indemnisé si t'es arrêté
ok ben t'as butuel de demain
bon ben ben ça revient aujourd'hui en fait
parce que là Béclio il comprend rien à ce que je dis
être obligé de travailler quand on est arrêté
c'est du passé
avec Aézio Mutuel les professionnels bénéficient
de garanties santé ou prévoyance
adaptés à leur statut comme l'indemnisation
perte de revenu en cas d'arrêt de travail
Aézio Mutuel c'est ça la Mutuel d'aujourd'hui

Les infos glanées

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

Underscore_

IA, Hacking, Robotique — Des conversations de terrain avec ceux qui construisent. 🥨


Partenariats: underscore@micorp.fr


---


Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Tags
Card title

Lien du podcast

[{'term': 'IA', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Investissement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Nouvelles Technologies', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Actu tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Cybersécurité', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Développement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Dev', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Entreprenariat tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'IT', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Robotique', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere