En fait, les LLMs ne stagnent pas du tout — Grégoire Mialon (Meta) & Clémentine Fourrier (HuggingFace)

Durée: 36m11s

Date de sortie: 03/07/2025

Deux chercheurs présentent GAIA, un benchmark qui évalue la capacité des IA à mener des recherches complexes et à raisonner étape par étape. On explore ce que les “thinking models” et l’usage d’outils (web, PDF, images) changent vraiment, et pourquoi cela débloque des résultats concrets. Ils détaillent aussi la “sauce secrète” derrière Deep Research d’OpenAI et comparent ces approches aux autres méthodes du marché.


Sources

En plateau

  • Michaël de Marliave — animateur
  • Grégoire Mialon — invité
  • Clémentine Fourrier — invité

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

erreur

Les infos glanées

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

Underscore_

IA, Hacking, Robotique — Des conversations de terrain avec ceux qui construisent. 🥨


Partenariats: underscore@micorp.fr


---


Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Tags
Card title

Lien du podcast

[{'term': 'IA', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Investissement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Nouvelles Technologies', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Actu tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Cybersécurité', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Développement', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Dev', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Entreprenariat tech', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'IT', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Robotique', 'label': None, 'scheme': 'http://www.itunes.com/'}, {'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere