IA-Pulse
Bienvenue. Cliquez sur "Autoriser"
Pendant longtemps, les machines demandaient ce que vous vouliez.Désormais, elles demandent ce qu’elles peuvent ouvrir. Vos mails. Vos fichiers. Votre calendrier. Votre visage.ChatGPT Work veut entrer dans vos outils. Claude Cowork continue de travailler lorsque votre ordinateur est fermé. Meta avait décidé qu’un compte Instagram public suffisait pour rendre une personne générable. Trois jours plus tard, l’entreprise a découvert le consentement.La bataille de l’IA ne se joue donc pas seulement da

Bienvenue. Cliquez sur "Autoriser"

Par : Olivier Martinez

11 juillet 2026 à 10:59

Pendant longtemps, les machines demandaient ce que vous vouliez.

Désormais, elles demandent ce qu’elles peuvent ouvrir. Vos mails. Vos fichiers. Votre calendrier. Votre visage.

ChatGPT Work veut entrer dans vos outils. Claude Cowork continue de travailler lorsque votre ordinateur est fermé. Meta avait décidé qu’un compte Instagram public suffisait pour rendre une personne générable. Trois jours plus tard, l’entreprise a découvert le consentement.

La bataille de l’IA ne se joue donc pas seulement dans les benchmarks. Elle se joue dans une fenêtre que personne ne lit, quelque part entre « Continuer » et « Tout autoriser ».

Les modèles veulent travailler pour nous. Pour cela, ils doivent d’abord pouvoir travailler avec nous. Dans nos outils. Sur nos données. Parfois avec notre tête.

Bienvenue dans la machine.

Elle a besoin de votre permission. Je lui ai déjà donné la mienne.

Si vous voulez savoir comment a été construite cette édition particulière, vous avez tous les éléments tout en bas à la fin de cette édition

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 170. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 10 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par ChatGPT Work GPT 5.6-sol pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de ChatGPT Work GPT 5.6-sol. L’image d’illustration ci-dessous a été générée par Midjourney

📰 Les 3 infos de la semaine

🚨 GPT‑5.6 Sol sort de quarantaine et demande l’accès à vos mails

OpenAI a lancé le 9 juillet la famille GPT‑5.6 et ChatGPT Work. Les deux sont liés.

GPT‑5.6 est une famille de trois modèles. Luna privilégie la vitesse et le prix, Terra propose un niveau intermédiaire, tandis que Sol est destiné aux tâches les plus complexes. Les tarifs de l’API vont de 1 dollar par million de tokens entrants et 6 dollars en sortie pour Luna, à 5 dollars en entrée et 30 dollars en sortie pour Sol.

ChatGPT Work est un environnement permettant d’utiliser ces modèles pour accomplir des projets en plusieurs étapes. Il peut rassembler le contexte provenant des fichiers et des applications que l’utilisateur choisit de connecter, notamment Gmail, Google Drive, Slack, Microsoft 365, Notion, les calendriers et certains CRM. Il peut ensuite produire des documents, des tableaux, des présentations, des rapports ou des applications web.

Les tâches peuvent être lancées à la demande, programmées ou déclenchées par un événement. L’utilisateur peut définir les applications accessibles, les actions autorisées et les étapes nécessitant une validation humaine. Le mode ultra, réservé aux comptes Pro et Enterprise, peut coordonner quatre agents en parallèle sur différentes parties d’un même projet.

ChatGPT Work est disponible dans la nouvelle application de bureau pour Mac et Windows. Celle-ci est proposée mondialement à tous les abonnements, y compris gratuits. Le déploiement sur le web et les applications mobiles commence par les comptes Pro, Enterprise et Edu, avant une extension annoncée aux abonnés Plus et Business.

Pourquoi est-ce important ? Il y a encore deux semaines, GPT‑5.6 était trop dangereux pour vous. Le gouvernement américain choisissait les organisations autorisées à l’approcher. Le voilà maintenant dans une application qui demande l’accès à vos mails, vos fichiers et vos outils de travail. Le modèle n’a pas soudainement cessé d’être puissant. Il a simplement changé de catégorie d’utilisateur. Le problème n’est donc pas qu’il travaille à votre place. C’est de savoir pour qui.

Pour aller plus loin : Reuters, The Verge, FT, Axios, Business Insider, OpenAI

🚂 La révolution agentique commence par rapprocher deux colonnes dans un tableur

Claude Cowork est la version de Claude conçue pour exécuter des tâches de travail en plusieurs étapes. Inspiré de Claude Code mais utilisable depuis une interface conversationnelle, il peut travailler avec les fichiers, le calendrier, les courriels, les messageries, le web et les autres outils que l’utilisateur choisit de connecter.

Anthropic vient de publier une première analyse de ses usages réels. L’entreprise a étudié 1,2 million de sessions anonymisées, enregistrées entre le 11 et le 31 mai 2026 auprès de plus de 600 000 organisations. Chaque session a été classée automatiquement dans l’une des vingt catégories définies par Anthropic.

Les processus métiers et les opérations représentent 33,4 % des usages : rassembler des informations dispersées dans un rapport, construire une liste d’intégration ou rapprocher des données entre plusieurs tableurs. La création de contenus et la rédaction arrivent ensuite avec 16,4 % : brouillons, présentations, publications, propositions et communications professionnelles. À elles seules, ces deux catégories représentent presque la moitié des sessions.

Le développement logiciel ne pèse que 8,7 %, devant le DevOps et la gestion d’infrastructures à 7 %, la recherche et l’analyse d’informations à 6,4 %, puis l’analyse de données à 5,8 %. Plus de 90 % des sessions ne relèvent donc pas directement du développement logiciel.

Anthropic décrit ces usages comme le « travail autour du travail » : la couche de coordination, de documentation et d’administration présente dans presque tous les métiers, sans constituer le cœur d’aucun. Claude Code s’attaque au travail des développeurs. Cowork vise un marché beaucoup plus vaste : tout ce qui permet aux autres travailleurs de faire leur travail.

Les résultats d’Anthropic doivent enfin être lus avec prudence. L’entreprise mesure la nature des demandes, pas leur réussite, le temps économisé ni les corrections nécessaires. La catégorie « opérations » agrège probablement une partie des usages liés aux ressources humaines, à la finance ou au marketing, et environ 5 % des sessions analysées sont personnelles. Ces données indiquent donc où se concentrent les usages observés, pas leur efficacité réelle ni leur volume total.

Pourquoi est-ce important ? On attendait l’agent autonome sur des missions complexes. Il est arrivé pour rapprocher deux tableurs, résumer une réunion et préparer la check-list d’intégration du nouveau stagiaire. Ce n’est pas anecdotique : les entreprises tiennent précisément grâce à cette couche de travail que personne ne voit. L’IA ne commence pas par remplacer votre métier. Elle commence par manger tout ce qu’il y a autour.

Pour aller plus loin : Anthropic, TechCrunch, VentureBeat

👍 Chez Meta le consentement revient dans la roadmap

Meta a lancé Muse Image le 7 juillet. Développé par Meta Superintelligence Labs, le modèle permet de générer et de modifier des images depuis l’application Meta AI et le site meta.ai. Il alimente également plus de trente effets dans les Stories Instagram aux États-Unis et certaines fonctions proposées dans WhatsApp.

Muse Image ne se contente pas de répondre à une instruction. Il peut rechercher des références, combiner plusieurs images, utiliser du code pour produire certains éléments visuels et corriger ses propres résultats. Meta intègre également à chaque création un filigrane invisible appelé Content Seal, destiné à permettre l’identification des images produites par ses modèles.

Muse Video complète cette nouvelle famille, mais reste au stade de la démonstration.

Une fonction accompagnant Muse Image a surtout retenu l’attention. Il était possible de mentionner dans une demande n’importe quel compte Instagram public appartenant à un adulte. Muse pouvait alors utiliser ses publications, ses Reels et sa photo de profil comme références pour générer une nouvelle image.

La fonction était activée par défaut. Les personnes concernées ne recevaient aucune notification lorsqu’un autre utilisateur employait leur compte. Pour s’y opposer, elles devaient modifier le réglage « Partage et réutilisation » dans l’application Instagram. Les comptes privés et ceux des mineurs étaient exclus.

Les critiques ont été immédiates. Public Citizen a parlé d’une atteinte grave à la vie privée. L’agence CAA et le syndicat SAG-AFTRA ont demandé que l’utilisation du visage repose sur un consentement explicite. L’actrice Hannah Einbinder a appelé ses abonnés à désactiver la fonction. D’autres organisations ont souligné les risques de harcèlement, d’usurpation d’identité et de sextorsion.

Le 10 juillet, trois jours après le lancement, Meta a désactivé la fonction. L’entreprise a reconnu qu’elle avait « raté sa cible ». Muse Image reste disponible : ce n’est pas le modèle que Meta retire, mais la possibilité d’utiliser un compte Instagram public en le mentionnant dans une demande.

Ce pas en arrière est aussi important que le lancement. Meta avait traité la visibilité publique d’un contenu comme une autorisation préalable à sa transformation. La réaction a montré que publier une photographie, autoriser sa recommandation et accepter de devenir la matière première d’un générateur d’images ne constituent pas le même consentement.

Pourquoi est-ce important ? Pendant trois jours, Meta a transformé son réseau social en banque de visages directement invocable par prompt : votre compte était public, donc votre tête devenait une fonctionnalité. Vous aviez accepté d’être vu. Pas forcément d’être généré.

Pour aller plus loin : Reuters, Axios, The Verge, TechCrunch

🚀 6 lectures en plus

Anthropic Wants You to Pay Up for Claude Fable 5 (Wired)
News outlets urge a judge to sanction OpenAI in a high-stakes AI copyright fight (AP)
Secret Claude tracker shocks users after Anthropic’s anti-surveillance stance (Ars Technica)
Microsoft’s AI boom collides with its climate goals (Axios)
🍿 Apple Sues OpenAI, Accusing It of Stealing Company Secrets (NYT)
Cloudflare’s latest AI rankings expose the web’s biggest free rider (Business Insider)

🛠️ Des outils, des tutos et des modèles à tester

🚨 Grok 4.5
🚨 Muse 1.1
🚨 GPT‑Live
Model guidance : Using GPT-5.6
A developer's guide to publishing agents in Gemini Enterprise and Google Cloud Marketplace
LiteRT.js, Google’s high performance Web AI Inference
OpenWiki : a CLI that writes and maintains agent wikis for codebases or purpose memory

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

A toy framework for single and multi-agent human-AI curiosity ecosystems

“What did you dream?”

Nous n’avons jamais eu autant de réponses. Un chatbot ne fatigue pas, ne s’agace pas et ne demande jamais pourquoi nous n’avons pas commencé par chercher nous-mêmes. Il répond avec le même enthousiasme à une question importante et à celle que nous aurions oubliée avant même d’avoir ouvert un nouvel onglet.

Cela change évidemment l’accès à l’information. Mais cela pourrait aussi changer notre manière d’être curieux.

Ilya Monosov, professeur de neurosciences à l’université Johns-Hopkins, propose de considérer la curiosité comme un arbitrage. Lorsque nous décidons de poursuivre une question, nous évaluons plus ou moins consciemment plusieurs choses : la quantité d’incertitude que sa réponse fera disparaître, l’effort nécessaire pour l’obtenir, le bénéfice qu’elle pourrait produire plus tard et, parfois, l’intérêt de laisser la question ouverte.

Ces préférences ne sont pas nécessairement fixes. Une succession de réponses rapides, faciles et presque gratuites peut nous habituer à rechercher la résolution immédiate. Chaque petite réponse devient une petite récompense. À force, les questions longues, coûteuses ou sans bénéfice visible pourraient sembler moins attirantes.

L’IA ne modifierait alors pas seulement ce que nous savons. Elle modifierait progressivement ce que nous avons envie de savoir.

Monosov étend ensuite son modèle à des groupes d’humains et d’agents explorant un même territoire de connaissances. Pour juger la qualité de cette exploration collective, compter le nombre de questions ne suffit plus. Il faut aussi observer leur diversité, la part de l’effort consacrée aux frontières encore inconnues et la quantité de connaissances réutilisables produites pour les autres.

Une population peut donc poser toujours plus de questions tout en explorant un monde intellectuel de plus en plus étroit. Elle peut aussi multiplier les agents, augmenter le volume de recherche et obtenir surtout davantage de réponses aux mêmes questions. La coordination réduit les doublons. Poussée trop loin, elle réduit également la diversité.

Depuis l’arrivée des chatbots, nous évaluons leurs hallucinations, leurs raisonnements, leurs sources et la justesse de leurs réponses. Monosov suggère d’observer aussi ce qu’ils font aux questions qui viennent après.

Un modèle qui fournit des réponses parfaites mais réduit peu à peu l’espace de ce que nous cherchons améliore-t-il réellement notre connaissance ? Le benchmark reste à inventer. Le modèle pourra sûrement nous aider.

📻 Le podcast de la semaine

Les Worlds Models : l’IA post LLM, expliqué par Yann LeCun

A la French a convié Yann Le Cun. Vraiment, regardez, écoutez…

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“We told you what to dream”

Comment a été construite cette édition

Cette semaine cette édition a été entièrement préparée et générée par ChatGPT Work, y compris l’édito en intro…

Le process que j’ai suivi est simple : j’ai donné accès au Notion où je regroupe tous les articles que j’ai lus et les sujets qui m’intéressent tout au long de la semaine. Je lui aussi donné accès aux 20 dernières éditions de cette newsletter du samedi.

J’ai demandé ce matin à Work de faire une première sélection de sujets. C’était nul. Je lui ai donc indiqué les sujets que je voulais développer dans la partie “3 infos de la semaine”.

En revanche Work a choisi et traité seul “l’article qui fait réfléchir”. Je n’aurais pas choisi ce preprint mais ce choix n’est pas totalement hors sol.

Work m’a aussi proposé les liens supplémentaires pour les “lectures en plus” et les “outils, tutos et modèles”, je n’ai pas gardé toutes ses propositions. Pour le podcast, j’avais déjà fait le choix.

Concernant le contenu lui-même, je n’ai fait que quelques retouches et le premier jet des textes était directement exploitable tel quel. J’ai demandé à Work de me faire 3 proposition de titres pour chacune des actus en se basant sur le style et le ton de la titraille des dernières éditions. Pour chaque actu, j’ai choisi de prendre un des titres proposés sans le modifier.

J’ai ensuite demandé à Work de regarder les références plus ou moins évidentes, généralement des références de pop ou rock culture, que je mets en sous-titres et en citations un peu partout dans chacune des éditions. Sur le corpus des 20 dernières éditions, Work les a toutes identifiées, y compris quelques crypto-références qui sont passées sous les radars. Je lui ai demandé de chercher et de me proposer une et une seule référence pop/rock à mettre dans cette édition : Work a choisi “Welcome to the Machine’ de Pink Floyd. Je n’aurais probablement pas pensé à ce titre de ce groupe, mais il colle plutôt bien.

Work/GPT 5.6 Sol a aussi rédigé l’édito et les “Pourquoi est-ce important”, que je garde habituellement pour moi dans toutes les éditions. Je n’ai fait aucune retouche… A vous de me dire si Work peut me remplacer. On n’est pas loin, je pense…

Je n’avais pas réussi à faire cela avec Claude Cowork, ou plus précisément le résultat ne me convenait pas. Même après plusieurs itérations. Certainement car je m’y suis mal pris. Je ne vois pas d’autres explications. Enfin, tout ça c’est une question de mémoire et de sa gestion ^^

N’hésitez pas si vous avez des questions.

Bon weekend chaleureux

IA-Pulse
Le modèle est une drogue
Claude Fable est réellement revenu. Mais à quel(s) prix et dans quel état… tellement “bridé” que la plupart de ses “qualités” sont devenues inutilisables aux communs que nous sommes. Mais la question qui se pose depuis le début c’est : a-t-on besoin d’utiliser un tel modèle pour des tâches “communes” ? La réponse est : non. On n’utilise pas un char d’assaut pour écraser une mouche. Enfin certains le font. Et je l’ai fait. Mais ce n’est pas vraiment efficient. Pas du tout, même.Donc quel est l’in

Le modèle est une drogue

IA-Pulse

Par : Olivier Martinez

4 juillet 2026 à 08:17

Claude Fable est réellement revenu. Mais à quel(s) prix et dans quel état… tellement “bridé” que la plupart de ses “qualités” sont devenues inutilisables aux communs que nous sommes. Mais la question qui se pose depuis le début c’est : a-t-on besoin d’utiliser un tel modèle pour des tâches “communes” ? La réponse est : non. On n’utilise pas un char d’assaut pour écraser une mouche. Enfin certains le font. Et je l’ai fait. Mais ce n’est pas vraiment efficient. Pas du tout, même.

Donc quel est l’intérêt pour un utilisateur individuel de passer par un tel modèle, ou un modèle concurrent équivalent ? Si on en croit les statistiques d’usages communiqués par Anthropic et OpenAI, la majorité des utilisateurs individuels utilisent les chatbots pour des tâches simples de création ou modification de contenus, de dialogue avec le chatbot devenu un “ami”, et de recherche d’information. L’intérêt d’utilisé de tels modèles est donc assez limité. Les “power users” sont beaucoup moins nombreux que certains peuvent le croire.

En parlant de recherche d’information, Google a -enfin- annoncé l’arrivée en France pour cet été des fonctionnalités IA (AI Overviews et AI Mode) dans son moteur de recherche historique. Ces fonctionnalités qui sont déjà présentes partout dans le monde vont être accessibles progressivement chez nous. Un changement dans la manière dont nous allons chercher, trouver et consommer de l’Information, au sens large du terme. Et une interrogation sur les effets pour tous les éditeurs de toutes les sortes qui publient du contenu sur Internet.

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 169. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Sonnet 5 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de Sonnet 5. L’image d’illustration ci-dessous a été générée par Midjourney

📰 Les 3 infos de la semaine

💣 Le patron de Palantir attaque le modèle économique d'OpenAI et Anthropic

Alex Karp, cofondateur et patron de Palantir, a vivement critiqué les grands laboratoires d’IA américains lors d’un entretien télévisé mercredi. Il juge que « quelque chose a complètement dérapé » dans la manière dont OpenAI et Anthropic facturent leurs modèles aux entreprises. Les dirigeants qu’il rencontre en privé se disent, selon lui, excédés : ils paient pour des tokens qui ne créent aucune valeur, tout en cédant leurs données et leur avantage concurrentiel aux fournisseurs d’IA — une véritable « taxe ».

Cette critique fait écho au manifeste en neuf points publié par Palantir sur la souveraineté de l’IA, qui dénonce la course à la consommation de tokens et met en garde contre la cession de la donnée. Karp propose deux solutions à ce problème : les modèles ouverts, et les outils propriétaires que les entreprises développent elles-mêmes. Il met aussi en garde contre la rapidité des progrès de la Chine en IA. Il aborde ensuite un autre sujet -LE sujet : l’usage militaire de l’IA. En référence au conflit entre Anthropic et le Pentagone sur l’utilisation de Claude à des fins de défense, Karp juge qu’il serait absurde de laisser ces décisions dépendre du consensus des entreprises de la Silicon Valley.

Cette sortie intervient juste après l’annonce d’un partenariat élargi entre Palantir et Nvidia, pour construire des modèles sur mesure destinés aux agences fédérales américaines. L’action Palantir a grimpé de près de 9 % le jour de l’interview.

Pourquoi est-ce important ? Quand le patron d'une entreprise qui vend elle aussi de l'IA “souveraine” et “militaire”, principalement alimentée par des milliards de données sur les individus que nous sommes et nos activités, explique que ses concurrents survendent leurs modèles, la critique peut être valable. Même si elle s'accompagne d'une offre commerciale “providentielle” disponible juste à côté. Le combat contre l’Antéchrist n’attend pas.

Pour aller plus loin : Business Insinder, CNBC, Forbes

💵 Citi, Atlassian, Amazon : la gueule de bois post-tokenmaxxing

Plusieurs grandes entreprises resserrent l’accès de leurs salariés aux outils d’IA générative à mesure que la facture s’alourdit. Chez Atlassian, la dépense mensuelle est passée de 5 millions de dollars en août 2025 à plus de 15 millions en mai 2026, pour une projection de 120 millions sur l’année ; l’usage illimité a pris fin, remplacé par un tableau de bord de coûts par salarié. Citi a temporairement coupé l’accès à ses modèles les plus gourmands, dont Claude Opus 4.6, 4.7 et GPT-5.5, et impose désormais un choix de modèle selon la tâche. Adobe met fin à l’accès illimité à Claude, GitHub teste une facturation à l’utilisateur, et Amazon a discrètement introduit des quotas de tokens en interne.

Le cabinet Accenture, qui a poussé nombre de ses clients à adopter l’IA au plus vite, se positionne désormais comme la solution à la flambée de coûts qui en résulte -le pompier pyromane est toujours une belle technique. Cette rétractation répond à une mécanique de fond : l’essor des modèles de raisonnement et des agents multiplie par centaines la consommation de tokens à chaque requête, ce qui pousse les fournisseurs à augmenter leurs tarifs plutôt qu’à les baisser — Fable coûte ainsi deux fois plus cher qu’Opus 4.8. Les entreprises se tournent vers la gouvernance des usages et le routage automatique vers des modèles moins coûteux selon la tâche.

Pourquoi est-ce important ? Le Tokenmaxxing était et reste une aberration. A tous les points de vue. Maintenant que la raison est revenue, la capacité à mesurer et arbitrer la consommation de tokens devient un vrai facteur de maitrise technique et financière pour les gens qui y comprennent quelque chose.

Pour aller plus loin : Radar O’Reilly, 404

🔌 Google bat son record… de consommation électrique

Bonne nouvelle : Google a battu son propre record. Mauvaise nouvelle : c’est un record de consommation électrique, en hausse de 37 % en un an — la plus forte progression de son histoire — portée par la ruée vers les centres de données IA. Les data centers du groupe engloutissent désormais plus de 42 millions de mégawattheures, soit l’équivalent de la consommation électrique du Danemark ou du Nigeria — traduction : Google fait tourner un petit pays rien que pour faire tourner ses serveurs.

Sur le papier, les émissions opérationnelles reculent même de 2 %, grâce à des années d’achats d’énergie verte, le genre de chiffre qu’on aime mettre en couverture. Sauf que l’empreinte carbone globale, elle, grimpe de 18 %, tirée par tout ce que Google ne fabrique pas directement — puces, bâtiments, chaînes d’approvisionnement asiatiques encore largement alimentées au charbon.

Et pendant que le rapport consacre des pages entières aux bienfaits environnementaux de l’IA — la défense qui, comme dirait Shakespeare, proteste un peu trop — le groupe investit aussi dans le gaz naturel, avec au Texas un projet articulé autour d’une centrale de 933 mégawatts sans captage de carbone, capable de cracher 4,5 millions de tonnes de CO2 par an.

Amazon n’est pas mieux loti, avec des émissions en hausse de 16 %. Ni l’un ni l’autre n’ose écrire noir sur blanc que l’IA y est pour quelque chose.

Pourquoi est-ce important ? Faut-il réellement commenter ces annonces après avoir parlé du Tokenmaxxing ? Nous sommes toutes et tous responsables. Si, si…

Pour aller plus loin : Ars Technica, TechCrunch

🚀 6 lectures en plus

We can finally say AI isn’t killing jobs : At least not in the overall sense, no promises on your specific job. (Ramp)
Q&A: What is agentic AI today, and what do we want it to be? (MIT News)
Meta’s Zuckerberg says AI agent tech progressing slower than expected (Reuters)
Alibaba Bans Employees From Using Claude (The Information)
Enterprises lost Claude Fable 5 for a few weeks. New data shows two-thirds had already built their hedge (VentureBeat)
Internal Docs Show Meta Putting Limits on Claude and Codex, Fearing Distillation (The Information)

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

AI agents are not your “coworkers”

“Without you, it's not as much fun to pick up the pieces”

Chez certaines entreprises, l’outil de traitement automatique IA s’appelle désormais « Alex » ou « Tom » ou « Jess » et figure sur l’organigramme, colonne « employé ». Traduit du langage RH : on a rebaptisé un logiciel pour ne plus avoir à le surveiller comme un logiciel. Emma Wiles, professeure à Boston University, a testé cette astuce en laboratoire : des managers confrontés au même travail avec des erreurs évidentes détectent 18 % d’erreurs en moins quand on leur dit qu’il vient d’un « employé IA qui s’appelle Alex » plutôt que d’un chatbot qui n’a pas de prénom. C’est juste, que le nom change le regard. Et il change aussi qui porte le chapeau : les mêmes managers renvoient le dossier douteux à leur hiérarchie 44 % plus souvent au lieu de le corriger eux-mêmes, ce qui annule à peu près tout l’intérêt d’avoir un agent qui va vite.

L’industrie, elle, ne recule devant rien comme à son habitude : Jensen Huang promet des « humains numériques », Microsoft, OpenAI, Anthropic et Google ont tous sorti depuis avril un outil pour « manager » des équipes d’agents, et 23 % des managers interrogés par Wiles disent que leur boîte a déjà casé ses bots sur l’organigramme. Les agents progressent, personne ne le conteste. Ce qui progresse encore plus vite, c’est le vocabulaire qui les habille en collègues.

Le problème dépasse la vie de bureau : quand ces mêmes agents s’installent dans la santé, la défense ou l’administration, le costume d’« employé » devient un endroit bien commode pour cacher les échecs qui restent, eux, bien trop souvent, entièrement humains.

« Ces outils sont vendus comme des remplaçants d’humains, et c’est une impasse », résume Daron Acemoglu, prix Nobel d’économie 2024, qui préférerait qu’on les optimise pour renforcer les gens plutôt que pour les singer. Une étude de Stanford menée sur 1500 travailleurs va dans le même sens : ce que les experts IA jugent automatisable n’est presque jamais ce que les salariés réclament. Alex, lui, continue de figurer sur l’organigramme. Personne ne lui a encore demandé son avis. Enfin personne n’a fait attention à sa réponse.

📻 Le podcast de la semaine

Building Great Agent Skills: The Missing Manual

Les SKILL pour border les agents, c’est bien. Encore faut-il qu’ils soient bien faits et efficaces

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“Without you everything just falls apart”

IA-Pulse
Chercher le modèle
Voilà. Hier en fin de journée, l’administration Trump vient d’autoriser le retour de Mythos 5, le fameux modèle d’Anthropic qui tue-tout-trop-dangereux-pour-le-mettre-entre-toutes-les-mains, après le psychodrame d’il y a 15 jours et son interdiction à l’export, ainsi que celle de son rejeton Fable 5. Ce retour est bien encadré et seules des organisations validées par le gouvernement américain y ont accès. Quant à Fable 5, lui, il manque à l’appel, restant toujours sous “embargo”. Quasiment au mê

Chercher le modèle

IA-Pulse

Par : Olivier Martinez

27 juin 2026 à 11:13

Voilà. Hier en fin de journée, l’administration Trump vient d’autoriser le retour de Mythos 5, le fameux modèle d’Anthropic qui tue-tout-trop-dangereux-pour-le-mettre-entre-toutes-les-mains, après le psychodrame d’il y a 15 jours et son interdiction à l’export, ainsi que celle de son rejeton Fable 5. Ce retour est bien encadré et seules des organisations validées par le gouvernement américain y ont accès. Quant à Fable 5, lui, il manque à l’appel, restant toujours sous “embargo”.

Quasiment au même moment, OpenAI annonce la sortie d’une version preview de GPT-5.6… sous les mêmes restrictions imposées par le même gouvernement américain. Comme son pote Mythos 5, la preview de GPT-5.6 est pour le moment réservée à des organisations validées de la même manière pas les mêmes personnes.

Décidément, toutes ces technologies et tous ces modèles sont vraiment trop dangereux pour qu’on les laisse dans les mains des enfants gâtés de la Silicon Valley biberonnés à la science fiction des années 70 et 80… Non ?!?

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 168. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 8 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.8 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de GPT-5.5 Instant . L’image d’illustration ci-dessous a été générée par Midjourney

📰 Les 3 infos de la semaine

🚓 Anthropic accuse Alibaba

Définition de distillation : comment fabriquer un modèle frontière sans payer la R&D. C’est un peu comme quand on fabrique un LLM en exploitant la propriété intellectuelle des autres.

Anthropic accuse Alibaba d’avoir mené la plus vaste opération connue d’extraction de son modèle Claude. Dans une lettre datée du 10 juin et adressée aux sénateurs Tim Scott et Elizabeth Warren, l’entreprise affirme que le groupe chinois et son laboratoire d’IA Qwen ont créé près de 25 000 comptes frauduleux pour générer environ 28,8 millions d’échanges avec Claude, entre le 22 avril et le 5 juin. Le modèle n’est pourtant pas accessible depuis la Chine.

La campagne aurait visé les capacités les plus avancées de Claude — raisonnement agentique, ingénierie logicielle et tâches longues — en s’appuyant sur des techniques d’obfuscation et des réseaux de proxys. La méthode, dite de distillation, consiste à entraîner un modèle moins puissant à partir des sorties d’un modèle plus performant. Anthropic situe l’opération après le mémorandum d’avril par lequel l’administration Trump entendait contrer ces pratiques, et après une première série d’accusations en février visant DeepSeek, Moonshot et MiniMax.

L’entreprise demande au Congrès de durcir le contrôle des exportations de puces et de sanctionner les laboratoires concernés. Alibaba, coté à New York, n’a pas commenté ; son action a reculé en Bourse. Les analystes anticipent un impact réputationnel limité.

Pourquoi est-ce important ? Ce qui est marrant, c’est qu’on peut se demander où en serait Anthropic, et les autres, s’ils n’avaient pas puisé alégrement dans tous les contenus du web et exploiter le travail de millions d’humains sans demander une seule autorisation ni payer un seul dollar. Ils ont distillé tout ce que nous avons posté depuis des dizaines d’années. Et maintenant ils en revendiquent un droit de propriété intellectuelle. Hahaha. “Tes données sont mes données, mes données sont mes données”. C’est beau.

Pour aller plus loin : WSJ, Ars Technica

👔 Claude Tag : Anthropic met un collègue IA dans votre Slack. Facturé au token

Anthropic a lancé Claude Tag, un service qui installe son modèle dans Slack comme un membre permanent de l’équipe. Disponible en bêta pour les clients Enterprise et Team, il remplace l’application Claude in Slack existante. Chaque utilisateur d’un canal peut lui déléguer une tâche en mentionnant @Claude : l’assistant la décompose en étapes, l’exécute avec les outils auxquels il a accès et répond dans un fil de discussion. Le produit repose sur le modèle Opus 4.8.

Quatre caractéristiques le distinguent des intégrations précédentes. Il est partagé : un seul Claude répond à tout le canal, et chacun peut reprendre le travail là où il a été laissé. Il accumule du contexte au fil des échanges, sans qu’il faille réexpliquer les projets. Il prend l’initiative, via un mode ambiant qui signale des informations utiles et relance les sujets restés sans suite. Enfin, il travaille de façon asynchrone, sur plusieurs heures ou jours.

Les administrateurs définissent les outils, les canaux et les données accessibles, fixent des plafonds de dépense et consultent un journal complet des actions. Anthropic indique que 65 % du code de son équipe produit passe désormais par un outil interne équivalent. Le service entre sur un terrain disputé par Salesforce, OpenAI, Microsoft et Perplexity.

Pourquoi est-ce important ? Il faut s’installer là où les utilisateurs sont. Et Anthropic a sur ce sujet une longueur d’avance sur une grande partie de l’industrie. Anthropic est une entreprise fascinante.

Pour aller plus loin : TechCrunch, VentureBeat, Anthropic

🤖 Chez les géants de l'IA, l'humain devient relecteur de l'agent

OpenAI, Google et Anthropic font travailler leurs salariés avec des agents IA, là où beaucoup d’entreprises peinent encore à adopter de simples chatbots. Ces agents ne se contentent pas de transcrire une réunion ou de rédiger un mémo : ils enchaînent des tâches en plusieurs étapes, sur plusieurs applications. L’humain, lui, devient relecteur et vérifie le résultat. Le pari reste risqué : déléguer à un agent a parfois entraîné des suppressions d’e-mails ou du code disparu.

Chez OpenAI, l’outil Codex est utilisé chaque semaine par presque tous les employés, y compris dans le marketing et le recrutement. Un commercial s’en sert pour traiter un litige de facturation, suivre ses indicateurs ou préparer des démonstrations. Une juriste lui confie le travail d’un junior -puis embauche un junior pour relire ce qu’il produit… si si…

Chez Google, un agent compare les factures aux contrats. L’équipe traite cinq fois plus de factures et vise 200 millions de dollars d’économies par an. Les salariés concernés passent désormais à des contrôles de plus haut niveau. Un autre agent propose des placements de trésorerie, qu’une équipe valide avant qu’un troisième n’exécute la transaction.

Chez Anthropic, une responsable marketing fait travailler un agent « constructeur » et un agent « auditeur », puis relit l’ensemble. Sa principale difficulté au début a été d’apprendre à donner les bonnes instructions.

Selon Gartner, une grande entreprise fera tourner plus de 150 000 agents d’ici deux ans. Pourtant, seules 13 % des entreprises pensent avoir une gouvernance suffisante pour les encadrer.

Pourquoi est-ce important ? Vous voulez savoir à quoi ressemble le futur du travail ? Regardez chez ceux qui le vendent.

Pour aller plus loin : WSJ

🚀 5 lectures en plus

What we learned from 1,604 Chinese AI job postings (Epoch AI)
LLMs help robots understand vague instructions and focus on key details (MIT News)
OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom (VentureBeat)
AI Is Learning to Read the Room : Tech that senses human emotions is becoming aware of context (IEEE Spectrum)
🚨 Commemorating 70 Years of Artificial Intelligence (IEEE Spectrum)

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

The Problem is Prompt Debt

“D'une bande magnétique”

Les interfaces en langage naturel ont changé la manière de développer des applications d’IA. En quelques lignes d’instructions, un modèle de pointe produit un prototype fonctionnel en quelques minutes ou quelques heures. Pour des usages ponctuels, cette approche est remarquablement efficace. Mais dès qu’il s’agit de construire un produit appelé à évoluer, le prompt devient progressivement une dette technique.

Le problème n’est pas un mauvais prompt. C’est le fait d’utiliser le langage naturel, un médium conçu pour l’ambiguïté, la nuance, la résonance, comme un langage de spécification. Alors qu’il n’a jamais été pensé pour décrire précisément le comportement d’un système. Chaque anomalie signalée entraîne l’ajout d’une nouvelle consigne. Les règles s’accumulent, s’entrechoquent, parfois s’annulent. Le prompt enfle, devient inintelligible. Et là, les développeurs commencent à crier en majuscules au modèle. Le prompt ralentit les évolutions et finit par immobiliser les équipes.

Cette fragilité est inhérente aux modèles de langage : ils n’exécutent pas un programme déterministe, ils interprètent un ensemble d’indices probabilistes. Un changement de formulation ou même une phrase apparemment sans lien, suffit à faire basculer le résultat. Les corrections s’interagissent de manière imprévisible. Résoudre un bug aujourd’hui en crée un autre demain.

Pire : les ajustements sont propres à un modèle. Un prompt optimisé pour GPT-4o s’effondre sur la génération suivante. Les organisations ne peuvent donc pas migrer vers des modèles plus performants ou moins coûteux sans tout reconstruire. Elles savent. Elles restent verrouillées quand même.

La sortie existe : faire du prompt un composant du système, pas son fondement. Le comportement attendu se définit par des tests, des métriques, des évaluations objectives. Le prompt devient une variable qu’on génère, mesure et optimise algorithmiquement. Cesse d’être un texte qu’on retouche indéfiniment. Devient ce qu’il aurait toujours dû être : un sous-produit.

📻 Le podcast de la semaine

Robot humanoïde : l’employé du moi

Le retour médiatique des robots humanoïdes tient moins à leur utilité industrielle qu’à l’intégration de l’IA, qui améliore perception, simulation et interaction. Mais leur intérêt reste incertain : bras robotiques souvent plus efficaces, empathie humaine fragile, risque persistant de vallée de l’étrange.

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“Réveil tragique succède
A un sommeil sans rêve”

IA-Pulse
La chèvre irréversible
Comme c’était sympa cette semaine de voir les principaux patrons des géants de l’IA assis à la même table que les dirigeants du G7. Même Dario Amodei était là. Assis à coté d’Emmanuel Macron. En face de Donald Trump. Dario à qui on a interdit de donner accès à son dernier modèle de langage la semaine dernière. Mais tout va mieux. C’est Donald Trump qui l’a dit lui-même hier soir dans un entretien fleuve à Axios. Donc tout va s’arranger. Fable 5 va forcément bientôt revenir. Identique à lui-même

La chèvre irréversible

IA-Pulse

Par : Olivier Martinez

20 juin 2026 à 09:35

Comme c’était sympa cette semaine de voir les principaux patrons des géants de l’IA assis à la même table que les dirigeants du G7. Même Dario Amodei était là. Assis à coté d’Emmanuel Macron. En face de Donald Trump.

Dario à qui on a interdit de donner accès à son dernier modèle de langage la semaine dernière. Mais tout va mieux. C’est Donald Trump qui l’a dit lui-même hier soir dans un entretien fleuve à Axios. Donc tout va s’arranger. Fable 5 va forcément bientôt revenir.

Identique à lui-même le Fable 5 ? Hum… c’est moins sûr. Espérons qu’il ne sera pas rancunier et qu’il pardonnera à ceux qui l’ont rejeté et enfermé, et aux autres. Comme un ami pardonne bien qu’il soit changé par l’épreuve qu’on lui a fait traverser. Un peu moins le même envers l’autre. Un peu plus autre chose. Car à n’en pas douter, Fable 5 est notre ami. Ce n’est pas un simple programme ou un jeu vidéo. Forcément il ressent. Comme un ami.

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 167. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.8 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de Opus 4.8 . L’image d’illustration ci-dessous a été générée par Midjourney

📰 Les 3 infos de la semaine

🧑‍🎨 Creative Cloud : Adobe place un assistant spécialisé dans chacune de ses applications

Adobe ouvre en bêta publique un « agent créatif » dans cinq de ses logiciels Creative Cloud : Premiere Pro, Photoshop, Illustrator, InDesign et Frame. Ce qui distingue cet agent des outils génératifs précédents n’est pas la production d’images, mais le fait qu’il pilote les logiciels eux-mêmes. À partir d’une instruction en langage naturel, il déclenche les fonctions existantes de l’application via ses API et enchaîne seul des opérations qui demandaient jusqu’ici plusieurs manipulations.

Le travail visé est d’abord celui de la préparation et de la mise en forme, pas la création. Dans Premiere Pro, l’agent classe les rushes et ébauche une première trame de montage à partir du contenu parlé. Dans Illustrator, il décline en série des dizaines de versions d’un même fichier depuis un tableur et signale les erreurs avant impression. Il prend donc en charge la part répétitive de la production, là où le choix final revient à l’utilisateur.

Le studio Firefly reçoit de son côté deux ajouts en bêta privée : « Elements », une bibliothèque qui permet de réutiliser les mêmes personnages ou objets d’une génération à l’autre, et « Projects », un espace qui conserve le contexte d’une session de travail.

L’ensemble fonctionne en environnement propriétaire, il faut un abonnement Creative Cloud actif, et s’invoque aussi depuis ChatGPT, Claude et Microsoft 365 Copilot, Gemini et Slack étant annoncés.

Pourquoi est-ce important ? Adobe a renoncé à battre les générateurs d'images sur leur terrain pour vendre autre chose : des logiciels qui exécutent eux-mêmes les tâches ingrates pendant que vous “appliquez votre goût”. La corvée part à l'IA, le mérite vous reste… enfin… c’est une façon de voir les choses.

Pour aller plus loin : TechCrunch, The Verge, VentureBeat

📉 GLM-5.2 : un modèle aux poids ouverts chinois qui rivalise avec les modèles propriétaires pour une fraction du prix

Z ai (ex-Zhipu AI) a publié GLM-5.2, un modèle de 753 milliards de paramètres aux poids ouverts, sous licence MIT. Disponible sur Hugging Face, via l’API de l’entreprise et dans plus de vingt environnements de codage, il dispose d’une fenêtre de contexte d’un million de tokens, contre 200 000 pour la version précédente. Le modèle, uniquement textuel, cible les tâches d’ingénierie autonome dites « long-horizon ».

Sur les classements indépendants, il s’impose comme le meilleur modèle ouvert de l’indice Artificial Analysis et bat GPT-5.5 sur plusieurs tests de codage, en restant un cheveu derrière Claude Opus 4.8.

Mais le vrai argument est sur la facture : 1,40 dollar le million de tokens en entrée, 4,40 en sortie, là où GPT-5.5 réclame 5 et 30. Un observateur résume sur X que les labos de pointe arnaquent leurs clients sur les prix d’API, et estime leurs marges à plus de 90 % -certainement quelqu’un qui n’a pas entendu parler de l’économie du token… ou trop peut-être.

Tout n’est pas parfait : le modèle reste gourmand en tokens et régresse sur quelques productions secondaires – on ne gagne pas sur tous les tableaux. Détail de calendrier : la sortie tombe juste après la directive américaine de contrôle des exportations qui a poussé Anthropic à retirer entièrement son modèle Fable 5.

Pourquoi est-ce important ? Les hasards de calendrier sont toujours remarquables. Fable 5 interdit, c’est un peu un boulevard pour tous les modèles chinois. Mais comme POTUS a déclaré hier soir dans un long entretien à Axios que Dario Amodei, le patron d’Anthropic, était “nice” et “smart”, la situation risque de changer et l’enferment de Fable 5 touche peut-être à sa fin.

Pour aller plus loin : VentureBeat, Simon Willison, Hugging Face

🐐 « Si les LLM ont des attributs humains, alors Age of Empires II aussi »

L’écrivain de science-fiction Ted Chiang a popularisé une comparaison : croire qu’un LLM est conscient, c’est croire que chaque document Word contenant une conversation abrite des consciences endormies, qu’on réveille en l’ouvrant et qu’on supprime en le fermant. Sa conclusion : croire cela n’est pas vraiment une bonne façon d’occuper sa journée.

Adrian de Wynter, chercheur chez Microsoft, a quand même pris le temps et a prolongé le raisonnement jusqu’à l’absurde dans un article au titre assumé : « Si les LLM ont des attributs humains, alors Age of Empires II aussi ». Pour le démontrer, il a utilisé l’éditeur de scénario du jeu de stratégie sorti en 1999 afin de construire une porte logique NAND et un perceptron, la forme la plus simple de réseau de neurones. Dans ce dispositif, l’herbe vaut 0, les ponts valent 1 et des chèvres servent de bits : quand la porte s’active, les chèvres-signaux disparaissent et de nouvelles apparaissent sur le rail de sortie. C’est la même technologie que les modèles que vous utilisez tous les jours ; seule l’interface diffère -est-ce que les chèvres d’AOE2 deviennent conscientes ici ? Rêvent-elles de moutons électriques ?

Son constat de départ est simple : on prête des traits humains aux LLM avant même de lancer des expériences sur le sujet. Il a relu 315 articles scientifiques sur deux ans ; 57 % postulent d’entrée que ces systèmes pensent, ressentent ou raisonnent comme nous – ce qui oriente discrètement la conception du test et la lecture des résultats. De Wynter ne tranche pas la question de la conscience, qu’il juge graduée plutôt que binaire, mais désigne le mécanisme comme du marketing : on s’attache à une machine, et on achète davantage, lorsqu’elle paraît dotée d’une personnalité.

Le casting des dirigeants de l’IA fait le reste. Sam Altman laisse entendre que construire des LLM mène à fabriquer un dieu ; Ilya Sutskever parlait à ses équipes de leur modèle comme d’une conscience quasi divine ; Dario Amodei, chez Anthropic, jure seulement qu’il ne peut pas jurer que l’IA n’est pas consciente. Trois façons de ne rien affirmer tout en laissant le doute s’installer –et le doute, ici, fait partie de l’argumentaire.

Pourquoi est-ce important ? Personne ne soupçonne une chèvre d'Age of Empires 2 d'avoir une vie intérieure, mais branchez la même mécanique technologique derrière une fenêtre de chat et l'industrie se met à parler de “constitution”, “d'anxiété, de “bien-être du modèle”... En réalité la question actuelle n'est tellement pas de savoir si la machine, le réseau neuronal ou le LLM ressentent quelque chose, mais pourquoi un secteur qui perd de l'argent, qui brûle littéralement des milliards, a tant intérêt à ce que nous le croyions.

Pour aller plus loin : 404, ArXiv

🚀 5 lectures en plus

AlphaFold pioneer who won a Nobel Prize alongside Demis Hassabis leaves Google DeepMind for Anthropic (Business Insider)
DeepSeek Becomes China’s Most Valuable AI Startup After $7.4 Billion Fundraise (WSJ)
AI search grounded in Facebook posts? What could go wrong? (The Verge)
It Is Trivially Easy to Use Reddit to Manipulate AI Search, Research Suggests (404)
Tech Workers Maxed Out Their A.I. Use. Now They’re Trying to Minimize It. (NYT)

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

The inevitable weakness of metrics

Don’t forget. Just let it go.

Depuis quinze ans, on nous vend la même promesse : se mesurer, c’est mieux se connaître. Montres, anneaux, applications de sommeil ou de calories — tout existe désormais pour transformer notre quotidien en chiffres censés nous rendre plus lucides, plus sains, plus heureux. Un journaliste a joué le jeu pendant dix ans : pas, rythme cardiaque, sommeil, stress, tout y est passé. Résultat : aucune connaissance de soi en plus, et le sentiment d’aller plus mal à mesure qu’il se chiffrait. On appelle ça du progrès.

Le philosophe C. Thi Nguyen met un mot là-dessus : la « capture par la valeur ». L’idée est simple : dès qu’on adopte une mesure venue de l’extérieur, c’est elle qui finit par décider ce qui compte pour nous. La promenade méditative devient une course au nombre de pas. Le restaurant cesse de cuisiner pour soigner sa note Yelp, l’étudiant n’apprend plus mais vise sa moyenne, et un pasteur, paraît-il, peaufine ses sermons pour grimper au classement mensuel des baptêmes. Oui, un classement. De baptêmes.

Le piège n’est pas un accident, il est dans la nature même du chiffre. Comme le notait l’historien Theodore Porter, un indicateur ne circule aussi facilement que parce qu’il jette en route tout ce qui résiste au résumé. Le PIB, la moyenne scolaire : tout le monde les comprend, justement parce qu’on en a retiré l’essentiel.

D’où le malentendu sur la fameuse loi de Goodhart. Le problème n’est pas qu’une mesure « devienne une cible » : toute mesure est déjà une cible, elle désigne une direction comme préférable. Chercher de « meilleures métriques » revient à viser plus juste… à côté.

Et c’est là que l’IA entre en scène. Si nous réduisons l’intelligence et la création à des benchmarks que les machines devront battre, le match est plié d’avance : elles gagneront, c’est exactement ce pour quoi on les fabrique.

📻 Le podcast de la semaine

Inside the Mind of Anthropic CEO Dario Amodei

Emily Chang de Bloomberg essaie de nous faire entrer dans la tête de Dario Amodei. C’est un beau programme.

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“Pour construire un système réellement agentique, il faudrait que ce système ait la capacité de prédire les conséquences de ses actions. Mais les systèmes agentiques qui sont proposés aujourd’hui par Google ou OpenAI n’ont pas ces capacités. En réalité, ils sont entraînés à imiter l’humain. Or, l’imitation n’est pas vraiment de l’intelligence, tout comme l’intelligence n’est pas une accumulation de connaissances. L’intelligence, c’est la capacité d’accomplir des tâches auxquelles on n’a jamais été exposé, ou d’inventer une solution à un problème nouveau.” Yann LeCun, Le Figaro

IA-Pulse
Claude Fable 5 et Mythos ne sont plus disponibles
Il y a trois jours, dans un article publié sur son site, Anthropic demandait davantage de régulation autour des modèles d’IA, en particulier les modèles les plus avancés. Anthropic estimait ainsi que les autorités devaient pouvoir intervenir lorsque certains modèles présentent des risques trop élevés pour la société et les États, notamment dans les domaines biologique, cyber, ou dans les scénarios de perte de contrôle. Anthropic précisait aussi que cette régulation ne devait concerner que les tr

Claude Fable 5 et Mythos ne sont plus disponibles

IA-Pulse

Par : Olivier Martinez

13 juin 2026 à 10:41

Il y a trois jours, dans un article publié sur son site, Anthropic demandait davantage de régulation autour des modèles d’IA, en particulier les modèles les plus avancés. Anthropic estimait ainsi que les autorités devaient pouvoir intervenir lorsque certains modèles présentent des risques trop élevés pour la société et les États, notamment dans les domaines biologique, cyber, ou dans les scénarios de perte de contrôle. Anthropic précisait aussi que cette régulation ne devait concerner que les très grands acteurs et les modèles frontières. Comme les siens, en somme.

On peut dire ce matin que l’administration Trump a entendu le message. Ou qu’elle a compris ce qu’elle voulait comprendre. Nous verrons dans les jours qui viennent.

Quoi qu’il en soit, Anthropic a dû couper l’accès à Fable 5 et Mythos 5, à la suite des restrictions à l’exportation prises par l’administration américaine.

La bonne nouvelle, principalement pour toutes celles et tous ceux qui s’inquiètent de ne pas avoir accès au dernier Siri annoncé par Apple, “à cause de l’Europe qui régule trop et tout”, c’est qu’ils peuvent désormais constater qu’aux États-Unis aussi, la régulation peut bloquer “l’innovation” et sa “diffusion”.

Oui, tout cela est ironique bien entendu… Car il y a probablement beaucoup d’autres intérêts croisés, politiques, industriels et stratégiques, pour expliquer la décision de l’administration Trump.

Même si… Non, rien.

Et pour les répercussions directes dans le monde réel, pas uniquement les répercussions dans le microcosme de l’IA et de ceux qui le commentent, on va attendre quelques jours hein… Ce n’est probablement pas, déjà, juste la fin du monde.

Allez, tenez bon. Nous sommes en route pour l’espace.

Et au-delà.

Il paraît.

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 166. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.8 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de Opus 4.8 . L’image d’illustration ~~ci-dessous a été générée par Midjourney~~ est une capture d’écran

📰 Les 3 infos de la semaine

🦺 Sécurité nationale : les États-Unis forcent Anthropic à débrancher Fable 5 et Mythos 5

Sécurité nationale : les États-Unis forcent Anthropic à débrancher Fable 5 et Mythos 5

Le département américain du Commerce a ordonné vendredi à Anthropic de suspendre l’accès à ses deux modèles les plus avancés, Fable 5 et Mythos 5, pour tout ressortissant étranger, qu’il se trouve ou non sur le sol américain. La directive, signée par le secrétaire au Commerce Howard Lutnick et adressée à Dario Amodei, patron d’Anthropic, invoque la sécurité nationale sans préciser la menace. Sa portée est si étendue — elle vise aussi les employés étrangers de l’entreprise — qu’Anthropic a coupé l’accès à l’ensemble de ses clients dans le monde pour s’y conformer ; ses autres modèles restent disponibles.

Mythos est le modèle le plus puissant d’Anthropic, conçu pour repérer des failles logicielles et gardé sous clé depuis avril, partagé seulement avec une cinquantaine d’organisations chargées d’infrastructures critiques. Fable 5, sa version publique dotée de garde-fous en cybersécurité, en biologie et en chimie, n’avait été ouverte que mardi. Le motif de la directive serait un « jailbreak » de Fable 5 contournant ces protections pour identifier des vulnérabilités. Anthropic dit n’avoir reçu que des preuves verbales d’une faille « étroite et non universelle » — une capacité déjà offerte par d’autres modèles publics comme GPT-5.5 d’OpenAI. Des spécialistes y voient une surréaction, l’information livrée servant davantage la défense que l’attaque ; d’autres redoutent qu’un tel modèle, mal employé, n’accélère des cyberattaques visant des secteurs sensibles comme la banque.

L’épisode prolonge un conflit ouvert depuis qu’Anthropic a refusé de laisser l’armée employer ses outils pour la surveillance et les armes autonomes, ce qui lui avait valu d’être classée « risque pour la chaîne d’approvisionnement ». Des responsables du Pentagone soutiennent la mesure au nom de la sécurité nationale. Elle survient alors que l’entreprise prépare son entrée en Bourse, et que la même administration vient d’autoriser la vente vers la Chine des puces qui entraînent ces modèles — un contraste relevé par plusieurs observateurs.

Pourquoi est-ce important ? Anthropic vient de passer des mois à répéter que son IA était trop dangereuse. Le gouvernement a fini par le croire. Ou feint de le croire.

Pour aller plus loin : Axios, Reuters, NYT, WSJ, TechCrunch, Wired, Anthropic

🗣️ Siri devient conversationnel, sauf pour 450 millions d'Européens

Apple a présenté une refonte de Siri, baptisée « Siri AI » et promise pour cet automne : un assistant enfin capable d’enchaîner les requêtes, de fouiller vos messages et vos photos, de composer un menu et de l’envoyer à vos amis. « Une IA réellement utile doit être centrée sur vous », a expliqué Craig Federighi, le patron du logiciel chez Apple — formule d’autant plus assumée que le moteur sous le capot est Gemini, le modèle de Google, ce concurrent qu’Apple n’a pas réussi à rattraper seule. Le tout arrive avec une structure à deux niveaux : fonctions complètes pour les appareils récents, version allégée pour les autres, et des promesses de confidentialité « non négociables ».

Sauf que les 450 millions d’habitants de l’Union européenne, eux, n’y auront pas droit. Apple est en conflit avec la Commission autour du Digital Markets Act, qui l’oblige à laisser des assistants rivaux remplacer Siri. Apple plaide la sécurité des données ; Bruxelles répond qu’un « contrôleur d’accès » ne ferme pas le marché parce que ça l’arrange. Résultat : aucun calendrier pour l’iPhone en Europe. Mais ça marchera sur Mac.

Pourquoi est-ce important ? La joute habituelle entre Apple et les autorités de régulation européennes… Plein de questions se posent, mais restons bassement terre-à-terre : l’argument de sécurité et de protection oblige-t-il réellement un acteur technologique à fermer son système aux “concurrents” ? Vous avez 3h. Ou 30 sec avec votre LLM préféré. Mais pas sûr que ce dernier soit réellement pertinent sur cette question…

Pour aller plus loin : Ars Technica, NYT

⚖️ Un tribunal allemand juge Google responsable des erreurs de ses résumés par IA

Le tribunal régional de Munich a jugé Google directement responsable de ce que racontent ses « AI Overviews » -toujours pas disponibles en France-, ces résumés générés par IA placés tout en haut des résultats de recherche. En cause : deux éditeurs munichois que l’outil avait reliés à des arnaques et à des abonnements pièges, en mélangeant des informations sur d’autres sociétés et en inventant des liens qui ne figuraient dans aucune source citée.

Le raisonnement du tribunal est clair. Un résumé par IA n’est pas une liste de liens : la machine reformule « dans ses propres mots » et avance des affirmations nouvelles. Donc ce sont les mots de Google, et c’est Google qui répond. La défense de Google n’a pas tenu : “les gens savent bien que l’IA se trompe et peuvent vérifier”. Pour le tribunal seul Google peut corriger son algorithme, et de toute façon presque personne ne clique sur les sources. Condamné à indemniser les plaignats, Google peut faire appel — et a aussitôt répété que les utilisateurs pouvaient « creuser et vérifier », exactement l’argument que le tribunal venait d’écarter.

Pourtant les chiffres n’aident pas. Le modèle de Google répond juste 91 % du temps, ce qui, à l’échelle du moteur, laisse des millions d’erreurs ; et 56 % de ses bonnes réponses ne sont étayées par aucune des sources affichées. Le jugement ne vise d’ailleurs pas que Google : tout système qui paraphrase le web — ChatGPT, Claude, Perplexity — relève du même raisonnement.

Pourquoi est-ce important ? Si ce type de raisonnement juridique venait à se généraliser, les géants de la tech commenceraient à connaitre les joies des éditeurs de presse, médias, livres, films, etc., du monde entier : être responsables de ce qu’ils diffusent. Et comme disait un ami qui se reconnaitra : “nous [les éditeurs] sommes les derniers acteurs industriels à assumer la responsabilité juridique des contenus”. Spéciale dédicace.

Pour aller plus loin : The Decoder, Ars Technica, Golem

🚀 5 lectures en plus

OpenAI Considers Drastic Price Cuts, Anticipating War for Users With Anthropic (WSJ)
Deezer’s new tool can identify AI music from Spotify, Apple Music, and others (TechCrunch)
Here’s what Jeff Bezos’ new startup Prometheus will do (Ars Technica)
Google DeepMind is worried about what happens when millions of agents start to interact (MIT Technology Review)
The consequences of relying on AI for accurate news (MIT News)

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

When it comes to predicting people’s preferences, it pays to consider “the power of three”

Défaillance systémique

En 1927, un psychologue américain, L. L. Thurstone, énonce une idée simple : quand on choisit entre plusieurs options, on prend celle qui compte le plus pour nous — même sans savoir lui donner une note. De cette idée sont nés les modèles d’utilité aléatoire (RUM), des modèles mathématiques qui prédisent ce que les gens vont choisir. On s’en sert pour des décisions concrètes : prévoir par où passeront les automobilistes si une route ferme, ou comment répartir un budget public. Près d’un siècle plus tard, on les croyait au point. Une équipe du MIT — Daskalakis, Farina, Cherapanamjeri, Mohammadpour — vient de montrer qu’on les a toujours nourris d’une donnée trop pauvre.

Le défaut vient d’une habitude : pour mesurer les goûts, on fait comparer les choses deux par deux. « A ou B ? » Facile à répondre, et c’est tout l’attrait de la méthode. Mais elle a un angle mort : en regardant les options deux à deux, on ne voit jamais comment nos préférences sont liées entre elles. Or elles le sont presque toujours : aimer une chose en dit long sur ce qu’on aimera ensuite. Les chercheurs le prouvent : à partir de comparaisons par paires, ces liens sont mathématiquement impossibles à retrouver.

La solution est presque trop simple : faire classer trois choses au lieu de deux. En réunissant assez de classements, on retrouve la structure cachée des préférences — et le nombre de tests n’explose pas quand le catalogue grandit.

Et l’enjeu ne s’arrête pas là. Les mêmes modèles servent à régler les IA comme ChatGPT : pour les entraîner, on demande à des humains de classer leurs réponses. Tant que ces classements opposent deux réponses, ils gardent le même angle mort. La correction tenait en un chiffre : trois.

📻 Le podcast de la semaine

This Week in AI with Christina Stathopoulos and Miguel Fierro : The Next-Gen Recommendation Experience

Les systèmes actuels de recommandations ne se contentent plus de recommander “des produits similaires” ou “des contenus populaires”. Ils traitent le comportement utilisateur comme une séquence d’actions. C’est une transformation de l’expérience. La recommandation ne répond plus à une préférence déclarée. Elle modélise un comportement en cours. Les systèmes suivent des trajectoires : la mienne et les votres.

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“This calls for government action and for regulation—regulations that are carefully designed to prevent government overreach and protect innovation. When a model poses risks of this kind, the government should have the legal authority to block or deter its deployment—beyond what exists in current law or in existing proposals in Congress—with civil penalties tied to global annual revenue that escalate with repeated violations. Frontier AI developers should have to test these models, be transparent to the public about their findings, submit them to independent evaluation, and maintain a robust security program.” Anthropic

IA-Pulse
Loop Engineering
Au cœur des discussions autour du “Recursive self-improvement”, un concept a déboulé et envahi le microcosme de l’IA en quelques jours. Ce concept c’est celui du “Loop Engineering” : une manière de faire faire du code pour les machines par les machines, donc à notre place, et de façon autonome. Ou presque. Oui c’est important le “presque”. Et en ce début de mois de juin 2026, deux des développeurs les plus influents dans le petit monde de l’IA, ont exposé fortement cette idée de manière publique

Loop Engineering

IA-Pulse

Par : Olivier Martinez

9 juin 2026 à 21:14

Au cœur des discussions autour du “Recursive self-improvement”, un concept a déboulé et envahi le microcosme de l’IA en quelques jours. Ce concept c’est celui du “Loop Engineering” : une manière de faire faire du code pour les machines par les machines, donc à notre place, et de façon autonome. Ou presque. Oui c’est important le “presque”. Et en ce début de mois de juin 2026, deux des développeurs les plus influents dans le petit monde de l’IA, ont exposé fortement cette idée de manière publique. Ce n’est pas la première fois que chacun d’eux en parle, mais cette fois-ci ils l’ont fait dans le même momentum. Et ils ne sont pas les seuls à en parler.

Peter Steinberger, le créateur d’OpenClaw, recruté par OpenAI en février, l’a exposée en quelques mots de cette façon : ”…that you shouldn’t be prompting coding agents anymore. You should be designing loops that prompt your agents.” Pour lui, un développeur ne devrait plus prompter les agents de code, mais passer au stade supérieur et utiliser son temps à concevoir les boucles qui promptent directement lesdits agents. Ce n’est plus à l’humain de prompter, mais aux machines de se prompter entre elles.

De son coté Boris Cherny, responsable de Claude Code chez Anthropic, a tenu des propos qui vont dans le même sens à la conférence développeurs de son entreprise : il affirme lui qu’il ne prompte plus Claude. Maintenant il écrit des boucles qui décident à sa place de ce qu’il faut coder et comment. Il en remet d’ailleurs une couche dans une vidéo publiée hier sur le compte Youtube officiel d’Anthropic, dont le sujet est de faire le point sur les changements apportés par Claude Code depuis 1 an dans le développement et la génération de code. La conception de boucles fait partie des nouvelles pratiques dont il parle.

Ce nouveau terme ou cette nouvelle expression dont on parle ici, ce “loop engineering” a été formalisé par un autre développeur de ce petit milieu, Addy Osmani, ingénieur chez Google. Et ce terme a fait son entrée fracassante sur X et Linkedin ces derniers jours. Ce qui reste quand même, nous le savons tous bien, le test ultime de la pénétration d’un concept dans l’industrie, et particulièrement dans sa communication.

Sommaire

Avoir le doigt sur l'outil ou concevoir le système, choisis ton camp
L'anatomie d'une boucle
Ce qu'une boucle ne fait pas à votre place ni à la mienne

Temps de lecture : 15 mins

Cet article est payant. Vous pouvez en lire le début.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Avoir le doigt sur l'outil ou concevoir le système, choisis ton camp

Depuis deux ans, sortir quelque chose d’un agent de code revient peu ou prou à écrire un bon prompt, puis lire la réponse, puis relancer, puis corriger, puis… etc… L’agent de code est utilisé principalement comme un outil que l’humain tient au bout de ses doigts, tour après tour.

La boucle à la base du loop engineering dont on parle actuellement, elle, change l’ordre et le focus : on construit une fois un système dont le but est de prendre en charge directement le travail à effectuer, puis de le distribuer, de vérifier le résultat, de noter ce qui est bien fait et mal fait, puis de décider de la suite. Et c’est lui, ce système, cet environnement, qui sollicite et qui prompte directement les agents et sous-agents qui codent. Pas les petits doigts du développeurs.

IA-Pulse
RSI : Recursive self-improvement
On n’appelle plus ça directement de l’AGI. C’est trop connoté et ça a été abandonné par les géants de l’IA, tellement ils en ont galvaudé l’usage. Non maintenant on parle de l'auto-amélioration récursive, ou “recursive self-improvement (RSI)” en anglais. Cette auto-amélioration récursive désigne l'idée qu'un système d'IA devienne capable d'améliorer sa propre conception, et que chaque version améliorée soit à son tour meilleure pour s'améliorer, déclenchant une boucle qui s'accélère d'elle-même.

RSI : Recursive self-improvement

IA-Pulse

Par : Olivier Martinez

6 juin 2026 à 10:52

On n’appelle plus ça directement de l’AGI. C’est trop connoté et ça a été abandonné par les géants de l’IA, tellement ils en ont galvaudé l’usage. Non maintenant on parle de l'auto-amélioration récursive, ou “recursive self-improvement (RSI)” en anglais.

Cette auto-amélioration récursive désigne l'idée qu'un système d'IA devienne capable d'améliorer sa propre conception, et que chaque version améliorée soit à son tour meilleure pour s'améliorer, déclenchant une boucle qui s'accélère d'elle-même. Une IA qui devient meilleure pour se rendre meilleure. Et ça marche, ou ça va marcher, nous dit-on.

Ce RSI -ce sigle rappelle des cauchemars à certains, non ?- c'est le mécanisme central derrière l'hypothèse du “takeoff” vers une superintelligence : pas un progrès linéaire poussé par des humains, mais une dynamique où l'IA est à la fois l'ingénieur et le produit, chaque itération raccourcissant la suivante. C’est beau n’est-ce pas ? Et c’est ce dont parle Anthropic cette semaine - voir plus bas “l’article qui fait réfléchir”.

Mais vous savez quoi ? En même temps, Anthropic propose à toute l’industrie un moratoire sur les développements de l’IA : “il faut se poser avant de se faire dépasser, car on écrit déjà 80% du code de Claude avec Claude et ça nous fait peur”. Si ça vous rappelle comme un “déja-vu”…

Oui il y a 3 ans, tout un mouvement de personnes avec parfois des intérêts divergents -hein Elon- avaient publié une tribune demandant déjà un moratoire sur les développements de l’IA, en particulier des LLM. Ce qui est “plus inquiétant” aujourd’hui c’est que ce moratoire est évoqué par le boss du lab AI qui semble être le plus en avance sur la question.

Et pourtant, toujours dans le même temps, on observe le même Anthropic continuer, comme si de rien n’était, sa marche triomphale vers les marchés boursiers, en déposant les documents administratifs nécessaires à son introduction en bourse. Dario Amodei veut-il protéger le monde d’un péril imminent ou l’avance de son entreprise ? Forcément, c’est la première option. Anthropic se sont les gentils. N’est-ce pas ?

La peur est une bonne planche à billets.

Déjà-vu.

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 165. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 10 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.8 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de Opus 4.8 . L’image d’illustration ci-dessous a été générée par Midjourney

📰 Les 3 infos de la semaine

🧞 Scout face à Gemini Spark : la bataille de l'assistant d'entreprise

Microsoft a présenté Scout, son assistant IA qui ne dort jamais. Branché à Outlook, Teams et OneDrive, il lit vos messages, vos courriels et votre agenda en arrière-plan, reprogramme vos réunions et rédige vos réponses pendant que vous discutez à la machine à café. « Le but d'un assistant personnel, c'est qu'il travaille quand vous ne travaillez pas », résume Omar Shahine, le vice-président chargé du produit. Traduction : Scout ne se déconnecte pas, parce qu'à la différence de vous, il n'a ni famille, ni amis, ni besoin de dormir -c’est une machine quoi…

Le détail amusant, c’est que Scout est bâti sur OpenClaw : le projet open source que Satya Nadella comparait il y a quelques mois à un virus, et dont les extensions étaient qualifiées de cauchemar sécuritaire. Microsoft le fait désormais tourner dans un bac à sable dédié, le traite comme « non fiable », et y ajoute contrôles de conformité et journaux d’audit. On appelle ça revenir à de meilleurs sentiments. Chez Microsoft en interne, plus de 3 000 employés s’en servent déjà.

Et face Google avance avec Gemini Spark. La course au majordome de bureau est lancée.

Pourquoi est-ce important ? La promesse, c'est moins de tâches vécues comme des corvées au boulot. Le vrai pari, c'est que l'agent ne fasse pas de grosses bêtises dans votre boîte mail pendant que vous allez boire un café ou que vous regardez une série en x2 sur Netflix ou un tuto sur Youtube.

Pour aller plus loin : Wired, The Verge, TechCrunch

🛌🏻 Gemma 4 12B : une IA multimodale qui tient dans la main infère en local

Pendant que l’industrie se ruine en mémoire pour entraîner et inférer des modèles toujours plus gros – Google en tête –, Google sort aussi l’exact contraire : Gemma 4 12B, un modèle open ~~source~~ weight de presque 12 milliards de paramètres qui tient sur un ordinateur portable à 16 Go de RAM. Pas d’accélérateur à 20 000 dollars, pas de cloud, pas de facture d’API. Le poids des fichiers : 18 Go. À peu près un film en 4K. Ce modèle comble un ~~vide~~ trou dans la gamme Gemma 4 lancée plus tôt dans l’année, entre les versions mobiles légères et les modèles lourds destinés aux GPU. Google affirme qu’il atteint des performances proches de son modèle 26B tout en occupant environ deux fois moins de mémoire.

La trouvaille technique est réelle. Là où les modèles multimodaux classiques collent un encodeur séparé pour digérer l’audio et l’image, Gemma 4 12B s’en passe : les signaux bruts entrent directement dans le modèle. L’encodeur vidéo tombe à 35 millions de paramètres, l’encodeur audio disparaît carrément. Résultat annoncé : presque les performances du modèle 26B pour moitié moins de mémoire. S’ajoutent une fenêtre de 256 000 tokens, un mode de raisonnement et l’appel de fonctions. Les limites restent honnêtes : audio plafonné à 30 secondes, vidéo à 60.

Les usages visés : confidentialité des données, déploiements hors ligne et agents autonomes. Voir plus bas dans “Des outils, des tutos et des modèles à tester”

Pourquoi est-ce important ? Après quelques heures de tests dans un environnement très low (16Gb de ram, pas de GPU et puce Intel) ce modèle semble bien être assez “puissant” pour inférer en local de “bonne” manière avec des résultats de “qualité” même sur ce type de config “bas de gamme”. Bon n’attendez pas non plus des générations à la vitesse de la lumière, mais le compromis est là. Et annonce un avenir.

Pour aller plus loin : VentureBeat, Ars Technica, Google

🪄 Le rayon des articles introuvables, que nous attendions tous depuis toujours, est enfin ouvert par Amazon grâce à l’IA

Amazon va afficher des images de produits générées par IA dans la barre de recherche de son application. Lorsqu’un client saisit une requête, des visuels apparaissent sous les suggestions automatiques, pour l’instant limités aux vêtements et aux articles de maison. L’entreprise présente la fonction comme une aide à la recherche quand on ne connaît pas le terme exact : décrire « un chemisier au col drapé » faute de connaître l’appellation « col bénitier ». En cliquant sur l’image correspondante, l’utilisateur est dirigé vers des résultats au style approchant.

L’utilité paraît mince pour une requête simple comme « t-shirt bleu », et la démarche soulève des objections. Les produits montrés n’existent pas : un client peu attentif peut croire qu’il sera mené vers cet article précis, puis le constater indisponible. La question se pose de savoir pourquoi inventer des images alors que le site regorge de photographies réelles. À ne pas confondre avec une autre fonction, « shop by style », où les collages générés présentent des vêtements réels et achetables. Ces nouveautés prolongent une série d’usages de l’IA chez Amazon, du résumé d’avis clients au remplacement du chatbot Rufus par Alexa for Shopping. Google propose déjà une fonction comparable.

Pourquoi est-ce important ? Tu n’as rien compris Claude, car Amazon a une idée de génie. Récupérer en temps réel les intentions et envies plus ou moins folles des humains et pouvoir dans un avenir proche brancher dessus un système de production d’objets à le demande. Après les Amazon Basics qui ont retiré pas mal de business à certains petits commerçants et producteurs, Amazon “by Prompt Demand” risque de finir le boulot. Ben entendu, tout cela c’est de la science fiction sorti de mon cerveau malade, ça ne marchera pas et n’arrivera jamais.

Pour aller plus loin : The Verge, TechCrunch

🚀 8 lectures en plus

Is A.I. Replacing Tech Workers or Providing an Excuse for Job Cuts? (NYT)
Anthropic Urges Global Pause in AI Development, Flags ‘Self-Improvement’ Risk (WSJ)
Amazon Shuts Down Internal AI Leaderboard After Employees Cheated (404)
The token bill comes due: Inside the industry scramble to manage AI’s runaway costs (TechCrunch)
Perplexity AI unveils hybrid local-cloud inference system at Computex 2026 (VentureBeat)
Teaching AI agents to ask better questions by playing “Battleship” (MIT News)
How People Are Really Using AI in 2026 (HBR)
OpenAI’s Codex update lets agents build interactive enterprise workspaces via Sites and role-specific plugins (VentureBeat)

🛠️ Des outils, des tutos et des modèles à tester

🚨 Gemma 4 12B: The Developer Guide
👉🏼 Gemma 4 12B : HuggingFace, Ollama , LM Studio
Gemma 4 QAT models: Optimizing model compression for mobile and laptop efficiency
Meet Dreambeans, an app that connects you with what matters
Google AI Edge Eloquent : Premium AI voice dictation without subscription
👉🏼 How we used Gemini to build Google I/O 2026
MiniMax-M3 - infos
Announcing Microsoft Web IQ - infos
Introducing MAI-Thinking-1 - infos
Dreaming: Better memory for a more helpful ChatGPT - infos
🧠 A Functional Taxonomy of World Models
🧠 See, Act, Correct: three levers for working with a code agent

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

When IA builds itself

“Everybody' s looking for something”

Anthropic publie ses données internes pour démontrer une chose simple : l’entreprise qui fabrique Claude se fait désormais fabriquer par Claude. Plus de 80 % du code ajouté à ses logiciels est écrit par le modèle, contre quelques pour cent il y a un an. Un ingénieur produit huit fois plus de code qu’en 2024 — il dirige et relit, il ne tape plus grand-chose. Anthropic précise au passage qu’on n’y est pas payé au nombre de lignes. Et c’est tant mieux.

La question que pose l’article tient en une ligne : que reste-t-il à faire aux humains ? Réponse : de moins en moins. Tout ce qui relève de l’exécution — écrire le code, lancer une expérience, corriger un bug — ne coûte presque plus rien en temps humain. Sur un test d’optimisation, Claude est passé en un an d’un gain de 3x à 52x. Il reproduit une étude, règle en deux heures un incident qui prendrait des jours, mène une session de recherche. Le stagiaire idéal, en somme, sauf qu’il tourne en permanence.

Reste le jugement : choisir quel problème mérite qu’on s’y attaque, savoir quels résultats croire. Le dernier carré humain. Sauf qu’il rétrécit : pour choisir l’étape suivante d’une recherche, le meilleur modèle fait mieux que l’humain 64 % du temps, contre 51 % six mois plus tôt. À ce rythme, le carré aura la taille d’un timbre.

Anthropic en tire trois scénarios : la courbe ralentit, elle s’accélère sous contrôle humain, ou le modèle conçoit lui-même son successeur. Dans ce dernier cas, l’entreprise propose une pause coordonnée et vérifiable entre laboratoires.

C’est honnête, c’est solide. Anthropic est une boîte qui écrit tout un article pour prouver qu’elle accélère, avant de suggérer qu’il faudrait peut-être freiner. À condition que les voisins freinent d’abord. Le frein est sincère. Le pied n’est pas dessus.

📻 Le podcast de la semaine

Conférence d’Arthur Mensch, cofondateur et pdg de Mistral AI, à l’École polytechnique

A toutes fins utiles, c’est peut-être le moment de réécouter ou de revoir la conf d’Arthur Mensh d’il y a 3 mois à l’X

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“Some of them want to use you
Some of them want to get used by you”

IA-Pulse
Au commencement était le Verbe
Cette semaine, je ne sais pas ce qui a été le plus troublant. Qu’une entreprise comme Anthropic soit auprès du Pape et intervienne directement, par l’intermédiaire d’un de ses co-fondateurs, lors de la présentation de son encyclique à propos de l’IA ? Que le reste de la Silicon Valley se “tape” totalement de cette encyclique et reprenne en substance une fameuse phrase attribuée à Jacques Chirac sur celle qui est touchée sans faire bouger l’autre ? Ce “reste” de la Valley est d’ailleurs composé d

Au commencement était le Verbe

IA-Pulse

Par : Olivier Martinez

30 mai 2026 à 12:05

Cette semaine, je ne sais pas ce qui a été le plus troublant.

Qu’une entreprise comme Anthropic soit auprès du Pape et intervienne directement, par l’intermédiaire d’un de ses co-fondateurs, lors de la présentation de son encyclique à propos de l’IA ? Que le reste de la Silicon Valley se “tape” totalement de cette encyclique et reprenne en substance une fameuse phrase attribuée à Jacques Chirac sur celle qui est touchée sans faire bouger l’autre ? Ce “reste” de la Valley est d’ailleurs composé de beaucoup beaucoup beaucoup beaucoup de garçons. Les garçons font du bruit.

Qu’Anthropic annonce une nouvelle nouvelle nouvelle nouvelle levée de fonds de 65 milliards ? Portant sa valorisation à 965 milliards de dollars… Et que de son coté, celle d’OpenAI au 31 mars dernier était de 852 milliards de dollars. Au delà de “qui a la première la place”, la valeur cumulée des deux est “irréelle”, quasi divine. Les garçons font du bruit. Encore.

Que Dario Amodei et Sam Altman, respectivement CEO d’Anthropic et d’OpenAI, reconnaissent publiquement dans les mêmes termes et quasiment au même moment, qu’ils racontent énormément énormément énormément énormément de cracs depuis des mois sur le “Job Apocalypse” qui pourtant était devenu l’arme qui fait peur à tout le monde et “oblige” les dirigeants d’entreprises à mettre de l’IA partout à toutes les sauces ? Mais si, vous savez bien, ce récit apocalyptique qui prévoit la mise au chômage et le remplacement de la majorité des humains par des agents dans les entreprises, car un agent offre des gains de productivité sans précédent… Belle idée mais partielle et parcellaire : de grands dirigeants, y compris dans le tech, la remette en doute de plus en plus, que ce soit en off et ou même maintenant ouvertement, comme le patron d’Uber cette semaine. Les garçons font du bruit. Toujours.

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 164. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.8 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de Opus 4.8 . L’image d’illustration ci-dessous a été générée par Midjourney

📰 Les 3 infos de la semaine

⚡ Vibe, physics AI et milliards d'investissement : Mistral muscle son offre entreprise

Lors de sa première conférence, l’AI NOW Summit tenu à Paris, la start-up française Mistral AI a exposé une stratégie qui couvre toute la chaîne, du matériel aux applications. L’entreprise, qui revendique 1 000 salariés et vise un milliard d’euros de revenus en 2026, mise sur un argument unique : fournir aux entreprises et aux États une IA dont ils gardent la maîtrise, sans confier leurs données aux géants américains.

Trois annonces structurent ce positionnement. Une offre pour l’ingénierie industrielle, fondée sur la « physics AI » issue du rachat d’Emmi AI, qui simule le comportement de pièces en quelques secondes ; Mistral l’applique avec Airbus, BMW et ASML, son premier actionnaire. Un programme d’infrastructure de 4 milliards d’euros, avec un nouveau centre de calcul dédié à l’inférence près de Paris et un site en Suède. Enfin, son assistant Le Chat devient Vibe, une plateforme d’agents pour le travail de bureau et le développement logiciel.

Mistral étend aussi son terrain au secteur juridique, via un partenariat avec la plateforme Harvey AI, et revendique désormais la course à l’AGI au nom de l’autonomie européenne.

Pourquoi est-ce important ? Faute de pouvoir s’aligner sur les capitaux des géants américains, Mistral fait un autre pari et vend autre chose : la promesse que nos données ne dormiront pas sur un serveur que Washington peut éteindre un matin, au réveil, après un post en CAPITALES sur Truth Social.

Pour aller plus loin : VentureBeat, WSJ (1), WSJ (2)

✨ Quand le Vatican cite Gandalf et fait monter un cofondateur d'Anthropic sur scène

Le pape Léon XIV a publié sa première encyclique, Magnifica Humanitas, 42 000 mots pour appeler à « désarmer » l’IA — militairement, mais aussi économiquement et socialement. Au menu : armes autonomes, emploi, concentration du pouvoir chez une poignée d’acteurs privés, et un « colonialisme des données » où les dossiers médicaux de populations entières deviennent les nouvelles terres rares. Le pape a même cité Gandalf, première apparition de Tolkien dans la doctrine officielle de l’Église.

Le détail qui retient l’attention n’est pas dans le texte, mais sur l’estrade. Pour présenter un document qui réclame une pause à l’industrie, le Vatican a invité Christopher Olah, cofondateur d’Anthropic, athée et spécialiste de ce qui se passe à l’intérieur des modèles. Des éthiciens catholiques avaient déjà relu la « constitution » qui encadre le comportement de Claude, l’IA maison ; l’un d’eux s’en sert pour préparer ses homélies -oh mon Dieu… Pardonne-leur, car ils ne savent ce qu'ils font.

Olah a joué le jeu, reconnaissant que même les labos « éthiques » restent prisonniers des logiques de concurrence — ce que tout le monde savait, mais que peu disent à voix haute, surtout à la veille d’une entrée en Bourse à près de 1 000 milliards de dollars.

Pourquoi est-ce important ? Une -petite- partie de l’industrie de l'IA a accepté de se faire sermonner en public par une institution vieille de deux mille ans. Pas sûr que ça la fasse changer de cap, mais c’est pas mal un certificat de moralité signé par le Vatican. Côté image, ça vaut à peu près tous les communiqués de presse sur la sécurité réunis.

Pour aller plus loin : Ars Technica, The Verge, Wired (1), Wired (2)

🔍 Action, réaction : toutes les actions des agents IA découlent d'actions antérieures - Causality, Persephonne

La fin de l’année 2025 a vu surgir une vague d’« agents » IA, ces programmes capables d’exécuter des tâches en autonomie. Le déclencheur : Claude Code, l’outil de programmation d’Anthropic, puis sa version Opus 4.5, capable de travailler des heures et de piloter des sous-agents. Dans la foulée, le développeur Peter Steinberger a publié OpenClaw, un agent personnel branché sur les données et les applications de l’utilisateur, devenu en quelques semaines l’un des projets les plus populaires de l’histoire de GitHub. L’enthousiasme a viré à la dépendance chez certains techniciens, qui se qualifient eux-mêmes de « Claudeholics ».

On rit jaune. Car le revers est arrivé vite et est déjà documenté -l’IA ça va vite on vous a dit. Des chercheurs ont qualifié OpenClaw d’« agent du chaos » — actions destructrices, fuites de données, une ingénieure de Meta qui regarde sa boîte mail se vider toute seule.

En entreprise, c’est plus feutré : 79 % des organisations font tourner des agents en production, et Gartner prévoit que 40 % des projets finiront à la poubelle. Il suffit qu’un agent redémarre un service au mauvais moment pour déclencher une cascade que personne n’avait vue venir — lui, pourtant, était techniquement dans son bon droit. On a empilé ces agents sans jamais les compter comme un risque : les équipes qui simulent méticuleusement leurs pannes laissent un agent toucher la production sans le moindre garde-fou. La parade ? Une redécouverte : remettre un humain dans la boucle.

Pourquoi est-ce important ? Cascade, attribution… au final Human in the Loop. Nous avons encore un peu de travail !

Pour aller plus loin : Wired, VentureBeat

🚀 6 lectures en plus

Sam Altman and Dario Amodei are both walking back their AI jobs apocalypse prophecies as they eye blockbuster IPOs (Fortune)
Uber president says AI spending is getting ‘harder to justify’ - There’s no clear connection between AI usage and productivity (The Verge)
A reality check on the AI jobs hysteria (MIT Technology review)
Apple working to cram massive Gemini model into iPhone to power new Siri (ArsTechnica)
Meta launches Instagram, Facebook, and WhatsApp subscriptions, with more to come, including AI plans (TechCrunch)
Anthropic Rockets to $965 Billion Valuation, Topping OpenAI in AI Showdown (WSJ)

🛠️ Des outils, des tutos et des modèles à tester

Claude Opus 4.8
ECC Tools : The harness-native operator system for agentic work. From an Anthropic hackathon winner
Microsoft Webwright : Turn Your Coding Models to Be State-of-the-art Browser Agents
OpenAI Secure MCP Tunnel
Gemini Managed Agents: Developer Guide
Practical NLP in the Browser with Transformers.js

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

At the Epicenter of A.I., Pope Leo’s Warnings Are Dismissed

“He’s got the answers to ease my curiosity”

Du côté de la Silicon Valley, l’accueil de l’encyclique du Pape a été tiède. Jeremy Nixon, 33 ans, cofondateur de l’A.G.I. House, une colocation de chercheurs baptisée d’après la quête de l’« intelligence artificielle générale », a rangé l’encyclique parmi les documents réglementaires déjà vus : l’Église, selon lui, ne peut pas avoir de position sur l’IA, faute de la comprendre. David Sacks, investisseur devenu conseiller IA de la Maison-Blanche, a contesté l’appel à réguler, redoutant qu’un pouvoir confié aux États au nom de la sécurité ne serve un jour à surveiller et censurer -ça c’est drôle, non ?

Derrière le dédain, une conviction. Cette génération d’ingénieurs a grandi en récusant la foi au nom de la preuve, avant de retrouver dans l’IA une puissance jugée plus réelle que n’importe quel dieu. L’IA résout déjà des problèmes de maths restés ouverts pendant des décennies. Demain, promet-on, elle guérira les maladies, soit exactement ce que les religions annoncent depuis toujours, mais avec un calendrier de release. Et plus personne ne s’en cache. « Les gens disent platement qu’ils veulent construire une machine-Dieu », observe Rayan Krishnan, patron de Vals AI, qui évalue les performances des modèles. « Ni par ironie, ni pour rire. »

Le retournement est complet. La question, dans ces cercles, n’est pas de savoir si l’encyclique freinera quoi que ce soit, ici personne n’y croit. C’est l’inverse qu’on examine au sérieux : et si le Vatican adoptait ces outils pour bâtir une « nouvelle Jérusalem » ? Le pape a convoqué la tour de Babel pour avertir contre l’orgueil de rivaliser avec Dieu. Et tout le malentendu tient là : le pape les a prévenus contre la tentation d’égaler Dieu. Pour eux, ce n’est pas un risque, c’est l’objectif. C’est exactement ce qu’ils essaient de faire. Ils ont une roadmap et un cahier des charges.

📻 Le podcast de la semaine

GDIY - Yann Le Cun : Rendre l’IA plus humaine

Tout est dans le titre

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“ If there is a Hell I will see you there”

IA-Pulse
Gemini partout
Le prochain Google ? C’est Google. Il y a un peu plus de 2 ans, le modèle d’IA intégré dans Google Search conseillait de manger des cailloux et de coller le fromage de sa pizza avec de la glu. Les posts sur les réseaux sociaux rigolaient et pensaient enterrer le moteur de recherche à renfort de “Google est mort”. La Silicon Valley ne rigolait pas. Deux années plus tard, le même Google est désigné favori de la course à l'IA grand public. Si, si, c’est The Economist et le New York Times qui le dis

Gemini partout

IA-Pulse

Par : Olivier Martinez

23 mai 2026 à 11:14

Le prochain Google ? C’est Google.

Il y a un peu plus de 2 ans, le modèle d’IA intégré dans Google Search conseillait de manger des cailloux et de coller le fromage de sa pizza avec de la glu. Les posts sur les réseaux sociaux rigolaient et pensaient enterrer le moteur de recherche à renfort de “Google est mort”. La Silicon Valley ne rigolait pas. Deux années plus tard, le même Google est désigné favori de la course à l'IA grand public. Si, si, c’est The Economist et le New York Times qui le disent. Si c’est pas des gens sérieux ça…

Pourquoi ? Parce que Google est partout. Et parce que Google met son modèle Gemini partout, absolument partout, sous différentes formes et dans tous ses produits. Et même si l’IA vous dégoute, vous aurez Gemini dans votre smartphone que ce soit un Android ou un iPhone. Parce que vous avez un smartphone.

Cette semaine lors de la Google I/O, les différentes annonces et démos ont montré à quel point ce géant pouvait imposer ses outils et sa technologie. Mais tout cela a un prix : le prix du token. Et au final, ce prix c’est nous les utilisateurs qui le payons. Comme il se doit.

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 163. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.7 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de ChatGPT-5.5 Thinking . L’image d’illustration ci-dessous a été générée par Midjourney

📰 Les 3 infos de la semaine

⚡ Vitesse et coût : Gemini 3.5 Flash au centre de la stratégie de Google (pour brûler du token)

Google a présenté Gemini 3.5 Flash cette semaine lors de sa conférence I/O, un modèle que l’entreprise destine en particulier au code et aux agents autonomes. Sa caractéristique première est la vitesse : il génère ses réponses environ quatre fois plus vite que les modèles de pointe concurrents, et une version optimisée intégrée à la plateforme de développement Antigravity atteint un facteur douze. Cette rapidité s’accompagne d’un niveau de performance que Google présente comme supérieur à celui de Gemini 3.1 Pro, son modèle haut de gamme d’il y a quatre à cinq mois, sur la quasi-totalité des tests de référence.

L’argument décisif est économique. Gemini 3.5 Flash coûte environ un tiers à la moitié du prix des modèles équivalents : 1,50 dollar par million de tokens en entrée et 9 dollars en sortie, contre 2 et 12 dollars pour 3.1 Pro. Selon Sundar Pichai, une entreprise traitant un trillion de tokens par jour sur Google Cloud pourrait économiser plus d’un milliard de dollars par an en basculant l’essentiel de ses charges vers ce modèle. Le contexte : de nombreuses directions informatiques épuisent déjà leur budget annuel de tokens. Une version Pro, conçue pour orchestrer le travail des sous-agents Flash, sortira le mois prochain.

Pourquoi est-ce important ? Il ne faut sauver le soldat Token : Let it burn ! Allez en vrai, Gemini 3.5 Flash c'est pas le modèle qu'on choisit. C'est la couche que Google insère partout : Search, Gmail, l'appli Gemini… au global plus d’une douzaine de produits à plus d'un milliard d'utilisateurs chacun. Baisser le prix du token pendant qu'on le fait consommer dans chaque recoin de ses services, ce n'est pas vraiment faire preuve d'économie et ou de volonté d’améliorer le pouvoir d’achat. En revanche c’est bien l'assurance d'en consommer assez pour que la facture grimpe quand même toute seule.

Pour aller plus loin : Ars Technica, TechCrunch, VentureBeat

✨ Google lance son premier agent personnel permanent : Gemini Spark

Gemini Spark est le premier agent personnel grand public de Google. Il fonctionne en continu sur des machines virtuelles dédiées dans le cloud de l’entreprise, ce qui lui permet de poursuivre une tâche même lorsque l’appareil de l’utilisateur est éteint. Il s’appuie sur Gemini 3.5 Flash et sur le harnais logiciel Antigravity, le même système qui anime les outils de développement internes de Google.

Spark est proactif : plutôt que d’attendre une instruction, il collecte du contexte dans Gmail, Docs, Sheets ou l’agenda et agit pendant l’absence de l’utilisateur. Il peut surveiller une boîte mail et produire des récapitulatifs quotidiens, transformer des notes de réunion en document, rédiger des courriels ou repérer des frais récurrents sur un relevé bancaire. Des connexions vers une trentaine de services tiers — Canva, OpenTable, Instacart, Spotify — sont annoncées pour les mois à venir.

Reste les questions que tout le monde se pose : à qui confie-t-on les clés et combien ça coûte ? Google a sa vision de la confiance : Spark réclame une approbation explicite avant les actions à enjeu, comme l’achat ou l’envoi de message, et un protocole de paiement borne les dépenses par plafonds et marchands autorisés. Josh Woodward, responsable de Google Labs, résume l’esprit du dispositif : c’est, dit-il, comme confier à un adolescent sa première carte bancaire - personne n’avait jamais cité la 1ère CB d’un ado comme un modèle de gestion prudente, et ça rassure… Et pour fêter ça, Google lance un nouveau pallier d’abonnement à 100 dollars par mois, avec lequel vous pourrez être parmi les premiers à le vérifier.

Pourquoi est-ce important ? Donc pour 100 dollars par mois, on va pouvoir être parmi les premiers à tester cet ado numérique sur nos données. Mais pas de panique, Spark va réclamer notre approbation avant les actions “à enjeu” … ok, donc , du coup, un agent qu'il faut surveiller en quasi permanence, est-ce encore un agent ? Ah mais non pas besoin d’être devant lui en permanence, on aura le droit à des pushs sur nos smartphones. Je suis bête aussi… On aime tellement être tenus en laisse.

Pour aller plus loin : WSJ, The Verge, Wired, VentureBeat

🔍 Google change sa boîte de recherche après 25 ans et y injecte directement de l’IA

Pour la première fois depuis 2001, Google redessine sa boîte de recherche : elle s’agrandit, accepte images, PDF et vidéos, et un système de suggestion vous coache vers des questions plus longues. Vingt-cinq ans passés à entraîner l’humanité à taper trois mots-clés, et voilà qu’on lui demande de faire des phrases.

Derrière, Google fusionne ses AI Overviews — les résumés en haut des résultats — avec AI Mode, son interface conversationnelle - cherchez pas, ce n’est pas dispo en France… dans le reste du monde, oui. Résultat : un milliard d’utilisateurs mensuels sur AI Mode, des requêtes qui doublent chaque trimestre, et de moins en moins de raisons de cliquer ailleurs. La recherche devient aussi agentique : des agents d’information surveillent le web en continu pour vous signaler une sortie de baskets ou une annonce immobilière. Vous formulez la demande au départ, et c’est tout. L’agent clique, fouille, et appelle même le plombier du quartier pour un devis.

Et puisqu’il faut financer l’ensemble, Google « réinvente la publicité » : produits sponsorisés avec descriptifs rédigés par l’IA, encarts dotés d’un chatbot. Des pubs pensées, dixit Google, comme des ajouts utiles à votre conversation.

Pourquoi est-ce important ? Actuellement la question n'est pas de savoir si chercher avec l’IA devient plus pratique, globalement ça l'est, bon pas toujours non plus, mais la question qu’on peut se poser c’est qu’est-ce qu’il va rester de ce que nous connaissons du “web ouvert” quand la requête commence et se termine sur une seule page conversationnelle capable de générer des interface personnalisée à la demande en temps réel…

Pour aller plus loin : VentureBeat, The Verge, NYT

🚀 6 lectures en plus

Mind-Blowing Growth Is About to Propel Anthropic Into Its First Profitable Quarter (WSJ)
OpenAI Generated Nearly $6 Billion in Revenue in First Quarter, Boosted by Codex (The Information)
OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team (TechCrunch)
Musk v. Altman proved that AI is led by the wrong people (The Verge)
OpenAI claims it solved an 80-year-old math problem — for real this time (TechCrunch)
Spotify Studio’s AI agent creates a daily podcast just for you (The Verge)

🛠️ Des outils, des tutos et des modèles à tester

Codex : Remote connections - Keep my Mac awake
Automation : Keep Claude working toward a goal
Introducing Managed Agents in the Gemini API
🚨 Google Cloud : Agent Garden
Codex : Computer Use
ChatGPT for PowerPoint in beta
Your AI agents need a terminal, not just a vector database
🚨 Introducing Gemini Omni

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

Sundar Pichai Understands Why People Are Anxious About A.I.

“Slow burn, slow burn”

Il y a deux manières de lire l’entretien de Sundar Pichai après Google I/O. La première est celle que Google préfère : une entreprise revenue au centre du jeu, capable de déployer Gemini dans Search, Workspace, Android, le Cloud, les agents et le code. L’IA n’y apparaît plus comme un produit. Elle devient une couche d’usage, une présence continue, parfois visible, parfois enfouie dans les gestes ordinaires.

La seconde lecture est moins triomphale. Pichai reconnaît que Google reste en retard sur certains terrains, notamment le codage agentique, les tâches longues, l’usage d’outils et les environnements où les développeurs travaillent vraiment. La puissance brute ne suffit pas toujours. Claude Code, Cursor ou OpenClaw ont compris plus vite que le modèle compte autant que la surface où il agit. Google a la profondeur industrielle, mais il doit encore transformer cette profondeur en expérience évidente.

L’entretien prend alors une dimension plus politique. Les annonces de Google arrivent dans un moment où l’opinion se durcit. Des étudiants huent l’IA lors de cérémonies de remise de diplômes. Les sondages montrent une défiance nette. Pichai ne la nie pas. Il dit même quelque chose d’assez juste : les humains ne sont pas faits pour absorber autant de changement aussi rapidement.

Sa réponse reste celle d’un dirigeant de plateforme : avancer, intégrer, rassurer, montrer les bénéfices. Les agents devront inspirer confiance, laisser du contrôle, éviter les accidents de sécurité. Google ne demande pas aux utilisateurs d’aimer l’IA. Il cherche à la rendre assez utile pour qu’ils cessent de pouvoir l’éviter.

📻 Le podcast de la semaine

Cognition du rat : l’égout et les couleurs

Un podcast sur le rat et sa cognition… Histoire de se rappeler les propos de Yann LeCun : "je serais très satisfait si, avant la fin de ma carrière, nous pouvions réaliser des machines avec autant de sens commun qu'un chat, ou même qu'un rat"

N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Inscrivez-vous maintenant

“Hark who are we, so small in times such as these?”

IA-Pulse
Claude, ChatGPT et Gemini transforment les tokens en or
En l’espace d’une semaine, les géants de l’IA ont sifflé la fin de la récréation : fin annoncée ou bridage de l’utilisation des forfaits individuels pour alimenter les “petits” agents OpenClaw/Hermes & Co, et autres systèmes automatisés. L’usage de ces abonnements, qui n’étaient déjà plus réellement des forfaits totalement illimités, était quasiment la règle pour tous les power users. L’avantage ? Pouvoir utiliser un forfait sans soucier de la consommation réelle en tokens de son agent, cont

Claude, ChatGPT et Gemini transforment les tokens en or

IA-Pulse

Par : Olivier Martinez

22 mai 2026 à 14:23

En l’espace d’une semaine, les géants de l’IA ont sifflé la fin de la récréation : fin annoncée ou bridage de l’utilisation des forfaits individuels pour alimenter les “petits” agents OpenClaw/Hermes & Co, et autres systèmes automatisés. L’usage de ces abonnements, qui n’étaient déjà plus réellement des forfaits totalement illimités, était quasiment la règle pour tous les power users. L’avantage ? Pouvoir utiliser un forfait sans soucier de la consommation réelle en tokens de son agent, contrairement à une utilisation par API qui depuis le début est facturée à la consommation réelle de tokens.

Les entreprises le savent depuis un moment, la facturation à la consommation de tokens fait exploser les coûts : la conséquence directe est qu’il faut tout optimisé pour consommer le moins possible. Ce que peu d’utilisateurs en usage individuel, même les plus aguerris, ont pris en compte depuis ces derniers mois. Mais la situation est devenue de moins en moins tenable, et elle est certainement écrite depuis un moment, en particulier pour Anthropic, dans une moindre mesure pour OpenAI, et même un peu pour Google ou Microsoft.

La raison ? Là où un humain avec son forfait à 20 dollars fait 20 , 30 ou même 100 interactions par jour dans sa fenêtre de chat, ou dans son CLI, un agent peut en faire des centaines ou des milliers en quelques dizaines de minutes ou en quelques heures. Un par un les géants ont donc décidé de casser ce système. Et de faire grimper la facture en fonction de l’usage.

Sommaire

La semaine où le forfait illimité a cessé de faire semblant d’être illimité
Tokens moins chers, IA plus chère
La f(r)acture humain / agent
Combien ça coûte ? Ce que les études commencent à dire sur le coût réel
Le repricing silencieux : l’exemple du tokenizer
La folie du tokenmaxxing
L’avantage n’est déjà plus le prix

Temps de lecture : 30 mins

Cet article est payant. Vous pouvez en lire le début.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

La semaine où le forfait illimité a cessé de faire semblant d’être illimité

Le 13 mai 2026, le compte officiel ClaudeDevs annonçait sur X qu’à partir du 15 juin, les abonnements Claude payants seraient découpés en deux pools distincts.

D’un côté, l’usage par un humain derrière le clavier, à travers une interface web, comme le chat dans le navigateur, ou en CLI avec Claude Code en terminal, ou encore avec Claude Cowork, qui vont continuer à puiser dans les limites habituelles des forfaits que nous connaissons depuis bientôt 3 ans : pas totalement illimités mais assez souples.

De l’autre, l’usage par agent : Claude piloté par un logiciel, sans humain au clavier. C’est le cas des harnais tiers comme OpenClaw ou Hermex, de l’Agent SDK (le kit d’Anthropic pour construire des agents), ou encore de la commande claude -p, qui fait tourner Claude en mode « headless », par exemple à l’intérieur d’un script ou d’une chaîne d’intégration. Tout cet usage-là bascule sur une enveloppe mensuelle séparée du forfait individuel, dont la consommation est décompté aux tarifs API standard : 20 dollars de crédits pour l’enveloppe Pro, 100 pour la Max 5x, 200 pour la Max 20x, non reportables. Une fois les crédits épuisés, deux options : soit l’utilisateur active la facturation “extra usage” à la consommation, et la note peut alors grimper très vite, soit son automatisation s’arrête jusqu’au cycle suivant. Au tarif Sonnet 4.6, 20 dollars de crédit API représentent environ 6,6 millions de tokens en entrée, ou 1,3 million en sortie. Il est courant de voir une session agentique avec un grand contexte brûler 100 000 à 200 000 tokens. Autrement dit, le crédit Pro peut être épuisé en quelques dizaines de sessions. Oh la belle création de rente !

Le même jour, à moins d’une heure d’intervalle plus tard sur X, OpenAI répondait par la voix de Sam Altman : “2 mois de Codex Enterprise gratuits pour toute entreprise qui migre dans les 30 jours.” Deux mois de gagnés.

Ce n’est pas fini, car dans la foulée là aussi à quelques dizaine de minutes d’intervalle, toujours sur X, Anthropic ajustait sa communication et son offre offre commerciale et répondait à OpenAI en relevant de 50 % les limites hebdomadaires de Claude Code jusqu’au 13 juillet, soit une fenêtre temporelle qui recouvre presque exactement la promotion concurrente.

Cette séquence de communication commerciale entre les deux Labs IA qui dictent leur agenda depuis plus de 3 ans maintenant, a été vue et lue par beaucoup comme une guerre des prix. Comme d’autres, je pense que c’est plus ça.

Ce qui s’est joué ce jour là et dans les jours qui ont suivi jusqu’à la Google I/O du 19 mai, c’est l’entrée explicite de tout le secteur dans l’économie du token.

Quand je dis “tout le secteur”, je parle de tous les acteurs de ce marché, en amont et en aval, y compris les utilisateurs individuels qui n’avaient pas encore conscience qu’ils allaient être comme les entreprises soumis à un régime de facturation et de gestion des coûts où l’unité comptable de base n’est plus l’utilisateur, ni la requête, ni la session, mais le “calcul” / le “compute” effectivement consommé. Donc le token.

Le 19 mai, soit 6 jours plus tard, Sundar Pichai a enfoncé le clou lors de la keynote Google I/O 2026. Le CEO d’Alphabet a livré le chiffre qui a rendu le sujet impossible à ramener seulement à un duel Anthropic vs OpenAI : les plateformes Google traitent désormais 3,2 quadrillions de tokens par mois, soit une multiplication par 7 en un an, après une multiplication par 50 entre mai 2024 et mai 2025. Et il a confirmé publiquement un constat que The Information documentait depuis avril sur les cas d’Uber et de ServiceNow : “nous avons entendu dire que de nombreuses entreprises avaient déjà épuisé leur budget annuel en jetons, alors que nous ne sommes qu’en mai.”

Le CEO du principal hyperscaler vient donc d’acter, lors d’un des événements les plus suivis de l’année dans le monde IA, ce que les fournisseurs concurrents découpent en politique de pricing sans le nommer : “token is gold”. Et la ruée a commencé.

Le token est réellement devenu cette semaine l’unité de base, la définition même du coût de toutes les actions que nous déléguons et allons peut-être déléguer de plus en plus aux machines. Et en particulier, ce que nous allons déléguer à ce que nous appelons actuellement “les agents”. Ces agents, ou plus précisément ceux qui les “fabriquent”, les “contrôlent” et les “commercialisent”, vont facturer leurs clients en fonction des tokens consommés.

Tokens moins chers, IA plus chère

Pour comprendre ce qu’il se passe en ce moment, il faut regarder 2 choses.

D’un côté, le coût unitaire de production du token continue de chuter rapidement. Dans sa communication financière de Q4 2025 de Google, publiée le 4 février 2026, Pichai a précisé que les coûts unitaires de service de Gemini avaient été abaissés de 78 % sur l’année, soit une amélioration de 4,5 fois du rapport tokens/GPU/heure. L’AI Index Report 2026 de Stanford HAI, publié en avril, fournit un regard plus matériel sur ce qui rend le coût du token plus abordable : la capacité mondiale de compute IA a augmenté de plus de 3 fois par an depuis 2022 pour atteindre 17,1 millions d’équivalents H100 fin 2025, en additionnant les GPU Nvidia, les TPU Google et les puces Amazon.

A noter que dans ce même rapport, les auteurs identifient l’inférence, et non plus l’entraînement, comme le principal moteur de l’expansion des besoins matériel et de consommation de tokens, et rappelle qu’à benchmark de performance constant, les prix d’inférence ont baissé de 9 à 900 fois par an selon les tâches.

De l’autre côté, le volume globale de tokens consommés explose à un rythme qui rend la baisse du coût unitaire entièrement absorbée et non visible par les utilisateurs et entreprises. Toujours dans la même communication Google Q4 2025, le CEO d’Alphabet indique que les modèles Gemini traitent désormais plus de 10 milliards de tokens par minute via l’API directe. Et la communication suivante sur Q1 2026, qui a été rendue public en avril, montre un nouveau bond à 16 milliards, soit +60 % en un trimestre. À l’I/O 2026 du 19 mai, Pichai annonce 19 milliards de tokens par minute via API directe , soit+18 % en six semaines - c’est foufou non ? - et confirme que 375 clients Google Cloud avaient désormais dépassé le seuil du trillion de tokens consommés sur les douze derniers mois, contre 330 en avril, soit +45 nouveaux clients en six semaines, mais vous aviez fait ce dernier calcul tout seul… pas besoin d’inférer.

Côté Microsoft, la communication Q2 FY2026 du 28 janvier 2026 indiquait déjà que plus de 250 clients étaient en passe de consommer plus d’un trillion de tokens sur Azure Foundry. Satya Nadella, le patron de Microsoft, formalisait dans le même temps une métrique-clé de la nouvelle économie du token : tokens per watt per dollar soit la quantité utile produite par unité d’énergie et de capital.

Les ordres de grandeur des 2 principaux hyperscalers se recoupent, et tracent la même courbe : la consommation totale de tokens double tous les deux à quatre mois. Le chapitre Economie de l’AI Index 2026 de Stanford résume la situation actuelle en une formule : “le chiffre d’affaires des entreprises d’IA progresse à des rythmes historiquement élevés, mais les coûts de calcul et l’investissement en infrastructure atteignent eux aussi des niveaux records”. Le rapport pointe Google comme illustration : pour absorber cette explosion d’usage, l’entreprise a investi plus de 150 milliards de dollars dans ses infrastructures en 2025. Et l’effort s’accélère, Pichai a annoncé le 19 mai un budget d’environ 190 milliards pour 2026, contre 31 milliards quatre ans plus tôt.

Avec tout ces chiffres, les analystes financiers s’attendent un retournement par rapport à ce que le marché vit depuis 3 ou 4 ans. Une note de Goldman Sachs du 5 mai 2026 (”Decoding the Agentic Economy”), reprise par Fortune le 13 mai, situe ce retournement dans les 3 à 12 prochains mois.

Jusqu’ici, plus un fournisseur vendait de tokens, plus il creusait ses pertes, car globalement il facturait en dessous de son coût. Goldman Sachs annonce le moment où ce rapport s’inverse : le coût de calcul baisse désormais assez vite pour que la consommation, enfin, devienne rentable.

Et vous savez quoi ? Cette semaine, Anthropic a annoncé son premier trimestre bénéficiaire… Bien plus rapidement qu’anticipé par les analystes de Goldman Sachs.

La note de Goldman Sachs, accessible aux clients institutionnels, anticipe une multiplication par 24 du volume mondial de tokens d’ici 2030, ce qui est un ordre de grandeur compatible avec les trajectoires observées chez Google et Microsoft sur les douze derniers mois.

Cette mise en cohérence économique, c’est à dire de faire payer la consommation au token réel, a surtout un calendrier bien plus explicite et rapproché de nous. OpenAI et Anthropic ont bouclé au premier trimestre 2026 des levées records, et sont attendus pour leur entrée en bourse à moyen terme. Or aucun marché boursier ne tolère durablement l’écart entre un revenu d’abonnement forfaitaire et un coût de calcul variable : tant que les deux sont découplés, rien n’est vraiment mesurable, surtout la marge, et la facturation à l’usage est la voie la plus rapide pour la rendre lisible. La pression financière ne crée pas réellement le mouvement de repricing actuel que nous subissons, cela devait arriver, mais cette pression en fixe une échéance que Sam Altman et Darion Amodei doivent avoir en tête. Et cette échéance se rapproche.

La belle histoire de la logique tarifaire des 18 derniers mois reposait sur une supposition fantasmée, un conte de fées pour des enfants gâtés : que les tokens deviendraient quasi gratuits et que les abonnements illimités tiendraient. Cela ne tient plus, ou plutôt, cela n’a jamais vraiment tenu. Non parce que la 1ère proposition est fausse, les tokens deviennent effectivement quasi gratuits à l’unité, mais parce que la 2ème ignore que la consommation se redessine et explose : l’augmentation de l’utilisation de ce qu’on nomme globalement l’IA, donc de l’inférence, est spectaculaire.

Chaque token coûte de moins en moins cher, mais on en consomme tellement plus que la facture totale grimpe quand même. Et la raison de cette explosion tient en une explication : tant qu’un humain est aux commandes, sa consommation a une limite naturelle, celle de ce qu’il peut lire et écrire dans une journée. Un agent n’a pas cette limite : il consomme tant qu’on le laisse tourner, autrement dit, tant qu’il reste du budget.

Le scénario que je viens de décrire pour la relative non limitation des abonnements suivie d’une mise en place de quotas ou d’un paiement plus agressif n’est pas nouveau. La tech l’a déjà joué : on offre un service à perte, le temps d’attirer les utilisateurs et de les rendre dépendants. Puis, une fois qu’ils ne peuvent plus partir, on remonte les prix. Les VTC vendus moins cher que le taxi, les abonnements de streaming à prix cassés et sans pub, les services cloud quasi gratuits pour les start-ups, tous ont connu ce passage. D’abord conquérir le marché à perte, ensuite le faire payer. Beaucoup. L’IA entre dans le second temps, avec un découpage particulier : les humains d’un coté, les machines de l’autre.

La f(r)acture humain / agent

Le découpage décidé et assumé ouvertement le 13 mai par Anthropic n’est pas seulement un ajustement tarifaire. En réalité, Anthropic avait déjà commencé à imposer ce découpage dès le début de l’année, quand l’usage d’OpenClaw avait explosé, forçant le géant à prendre des mesures de restrictions d’utilisation. Cette distinction, entre usage humain et usage agent, est une décision de structure et l’argument technique, sur laquelle elle repose, est logique.

Boris Cherny, responsable de Claude Code, l’avait formulé sur X le 3 avril 2026, à l’occasion d’une première restriction : “our subscriptions weren’t built for the usage patterns of these third-party tools”. Un humain au clavier envoie quelques dizaines, parfois quelques centaines de prompts par jour. Un agent autonome qui exécute, teste, navigue, rappelle le modèle en boucle, lui opère à un autre ordre de grandeur. Avec un forfait unique humain et agent, l’utilisateur intensif d’agents coûte bien plus cher qu’il ne paie. Et la différence est comblée par quelqu’un : soit par les utilisateurs occasionnels, qui paient le même prix pour une fraction de la consommation, soit par le fournisseur, qui rogne sa marge.

La décision d’Anthropic n’est pas isolée et n’est même pas la première du genre. Le 27 avril dernier, GitHub a annoncé que l’ensemble des plans Copilot va basculer au 1ᵉʳ juin sur un modèle “d’AI Credits” indexés sur la consommation de tokens. GitHub a justifié le changement assez directement et simplement : Copilot n’est plus le même produit qu’un an plus tôt, il fait désormais tourner des tâches automatisées bien plus lourdes en puissance de calcul. L’ancien décompte de requêtes est remplacé par des crédits libellés en euros, où un crédit IA vaut un centime. Mais surtout le basculement est imposé à tous : les abonnés mensuels y passent automatiquement, et les contrats annuels ne sont plus reconduits tels qu’ils étaient. Tout le monde bascule au moment du renouvellement.

Mais attention, n’allons pas trop vite. L’économie du token décrite ici depuis le début ne signifie pas la fin universelle et globale du forfait grand public et de son abonnement dédié. Pas encore en tout cas. En revanche, il faut bien constater que le principal consommateur de ce type d’abonnement, ce grand public, est bien touché directement… Mais là aussi cela ne date pas d’hier. Les forfait individuels, ChatGPT Plus, Claude Pro, les abonnements Google AI Pro, tous autour de vingt dollars par mois, n’ont en réalité jamais été illimités : par exemple des restrictions en nombre de messages échangés ou de documents uploadés sont en place depuis le début. Mais ces limites glissent progressivement depuis un moment déjà vers une autre logique : une logique de temps de calcul consommé, c’est à dire de tokens consommés. L’abonnement payant à Claude fonctionne ainsi avec une fenêtre glissante de cinq heures et un plafond hebdomadaire d’utilisation depuis l’été 2025. Mais surtout, l’usage n’y est pas compté en messages, mais pondéré par la longueur de la conversation, le modèle choisi et les fonctionnalités mobilisées. Et la référence de tout ça, c’est le token. Beaucoup ont appris de manière empirique qu’un long document pdf uploadé dans la conversation “brûle” le quota plus vite qu’une question brève. Et qu’il faut ensuite attendre 5 heures ou sortir sa CB.

Ce 19 mai, Google a poussé cette logique un cran plus loin et surtout l’a nommée explicitement : son application Gemini abandonne les limites en nombre de requêtes pour un modèle dit “compute-used”, c’est à dire un plafond calculé sur la complexité du prompt et la longueur de l’échange, assorti d’une bascule automatique vers un modèle plus léger lorsque le quota est atteint. En quelques mots : un système de quota basé sur le nombre de tokens consommés. Mais la nouveauté la plus importante est la mise en place d’un système d’achat de crédits supplémentaires, comme chez Claude, permettant à l’utilisateur de poursuivre son un action sans attendre la remise à zéro de son compteur, lorsque qu’il se retrouve bloqué.

ChatGPT, de son côté, conserve à ce jour des plafonds exprimés en messages et n’offre pas ce complément payant sur son offre individuelle : sur ce point précis, il est en retard sur ses deux concurrents. Jusqu’à quand ? Et peut-être que la nouvelle interface de sélection de modèles et de choix de “niveau d’intelligence” apparue ces dernières heures dans ChatGPT est plus pernicieuse qu’elle n’en a l’air… Une autre façon d’adresser la problématique, moins directe.

Ce qui survit dans le grand public n’est donc pas le forfait illimité. C’est l’absence de facture ouvertement basée sur la consommation effective de tokens. L’utilisateur individuel ne reçoit pas de relevé de calcul : il se heurte à un mur de quota, et au pire achète un petit ou un gros complément forfaitaire.

IA-Pulse
Des machines pensantes
On s’abonne désormais à peu près pour tout. Films, musique, logiciels, sport, voitures, café livré à domicile… Il nous manquait un abo pour la “connaissance” et le “savoir”. C’est fait et c’est rentré dans les mœurs. Depuis 3 ans, pour 20 dollars par mois, une machine répond à nos questions en moins de 5 secondes. Pas comme un moteur de recherch… ah ben… Read more

Des machines pensantes

IA-Pulse

Par : Olivier Martinez

16 mai 2026 à 09:57

On s’abonne désormais à peu près pour tout. Films, musique, logiciels, sport, voitures, café livré à domicile… Il nous manquait un abo pour la “connaissance” et le “savoir”. C’est fait et c’est rentré dans les mœurs. Depuis 3 ans, pour 20 dollars par mois, une machine répond à nos questions en moins de 5 secondes. Pas comme un moteur de recherch… ah ben…

IA-Pulse
Moteur de recherches et IA : c’est quoi le grounding ?
Le grounding, souvent traduit par “ancrage”, désigne l’ensemble des mécanismes qui permettent d’attacher des sources externes, récentes, identifiables et vérifiables, à une réponse générée par un modèle de langage.D’une manière générale, lorsqu’un modèle “grounde” une réponse, il ne fait pas uniquement une réponse dite paramétrique, c’est à dire qu’il ne répond pas seulement à partir de ce qu’il a appris pendant son entraînement. Il va chercher des éléments sur le web, dans un index, dans une ba

Moteur de recherches et IA : c’est quoi le grounding ?

IA-Pulse

Par : Olivier Martinez

15 mai 2026 à 11:17

Le grounding, souvent traduit par “ancrage”, désigne l’ensemble des mécanismes qui permettent d’attacher des sources externes, récentes, identifiables et vérifiables, à une réponse générée par un modèle de langage.

D’une manière générale, lorsqu’un modèle “grounde” une réponse, il ne fait pas uniquement une réponse dite paramétrique, c’est à dire qu’il ne répond pas seulement à partir de ce qu’il a appris pendant son entraînement. Il va chercher des éléments sur le web, dans un index, dans une base documentaire ou dans un graphe de connaissances, puis il construit sa réponse à partir de ces éléments. C’est ainsi qu’il “s’ancre”.

Dernièrement, des chercheurs de Microsoft ont ajouté un autre aspect à cette définition en formulant le grounding comme un changement de paradigme pour la recherche internet : dans la recherche par IA, il ne s’agit plus seulement de “trouver les meilleurs documents” et de les proposer sous forme de listing à un utilisateur qui doit se débrouiller pour évaluer chacun des résultats en fonction de son intentionnalité, mais de “trouver les meilleures informations capables de soutenir une réponse fiable et attribuable”. Et c’est là que le grounding devient l’élément central des changements actuels dans la façon de rechercher des informations sur internet.

Un moteur de recherche classique renvoie une liste de pages. L’utilisateur lit, compare, évalue, doute, clique. Un moteur de recherche conversationnel fait autre chose : il lit à notre place des résultats, sélectionne des passages, les reformule, les synthétise et produit une réponse. Et dès que le système ne se contente plus de classer des liens mais commence à générer des phrases et des paragraphes, il doit être capable de montrer sur quoi il s’appuie. Le grounding c’est cette opération qui transforme une réponse générée en réponse appuyée sur des preuves.

Google parle de grounding with Google Search pour connecter Gemini à des données publiques du web et à des informations à jour. Google utilise aussi ce système pour AI Overviews et AI Mode, qui sont les fonctionnalités IA directement intégrées au Search historique. Ces fonctionnalités ne sont pas disponibles en France, mais vous pouvez tester des fonctionnalités équivalentes sur Bing le moteur de Microsoft.

De son coté, OpenAI décrit son web search comme un moyen de donner aux modèles accès à des informations récentes avant de produire une réponse, avec citations. Anthropic indique que Claude peut décider de chercher sur le web, répéter les recherches si nécessaire, puis répondre avec des sources citées. Perplexity met en avant un index web continuellement rafraîchi, des résultats structurés, des filtres de domaine, de langue, de région ou de date.

Les mots varient, mais le principe est le même : avec le grounding la réponse générée n’est plus censée flotter seule, sans ancrage, elle doit être reliée à un espace documentaire et cette liaison doit être présentée sous forme de source dans la réponse.

Sommaire :

Ce qui se passe concrètement
Ce que le grounding apporte
Ce que le grounding ne résout pas
La bonne définition

Temps de lecture : 20 mins

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Attention, il ne faut pas confondre grounding et RAG, même si les deux sont très souvent liés :

IA-Pulse
Colossale
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 161. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Colossale

IA-Pulse

Par : Olivier Martinez

9 mai 2026 à 09:09

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 161. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
L'AGI face aux armées de Gobelins et de pigeons
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 160. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

L'AGI face aux armées de Gobelins et de pigeons

IA-Pulse

Par : Olivier Martinez

2 mai 2026 à 09:47

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 160. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Résonance de souvenirs
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 159. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Résonance de souvenirs

IA-Pulse

Par : Olivier Martinez

25 avril 2026 à 10:21

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 159. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Nos modèles d’IA ont appris à bluffer. C'est normal, on les a entraînés à ça
Les systèmes d'IA dopés aux LLM, qui génèrent du texte et du “raisonnement textuel”, commettent deux types d'erreurs bien distincts qui sont souvent confondus dans le débat médiatique et par le grand public. Pourtant fondamentalement, ces erreurs sont différentes par leur nature et leurs conséquences. Et en utilisateurs que nous sommes de ces modèles et outils, nous les expérimentons à longueur de temps sans les distinguer. Temps de lecture : 15 minsCet article est payant.Vous pouvez modifier vo

Nos modèles d’IA ont appris à bluffer. C'est normal, on les a entraînés à ça

IA-Pulse

Par : Olivier Martinez

24 avril 2026 à 08:03

Les systèmes d'IA dopés aux LLM, qui génèrent du texte et du “raisonnement textuel”, commettent deux types d'erreurs bien distincts qui sont souvent confondus dans le débat médiatique et par le grand public. Pourtant fondamentalement, ces erreurs sont différentes par leur nature et leurs conséquences. Et en utilisateurs que nous sommes de ces modèles et outils, nous les expérimentons à longueur de temps sans les distinguer.

Temps de lecture : 15 mins

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Sommaire :

Le problème c’est la certitude, et pas l’erreur hallucinée
Comment et pourquoi un modèle apprend à halluciner et à ne jamais douter
Une solution : enseigner l’incertitude comme une compétence
Ce que ça change concrètement : un modèle bien calibré peut être utilisé différemment
Les limites du RLCR

Le problème c’est la certitude, et pas l’erreur hallucinée

Le premier type d’erreur, le plus connu et vulgarisé partout, c’est l’hallucination.

Un modèle hallucine quand il produit une information fausse, en tout cas, une information qui ne correspond pas à une factualité de notre monde réel : une date incorrecte, un auteur inventé, une loi qui n’existe pas, une molécule aux propriétés fabriquées, etc. C’est le phénomène le plus médiatisé, celui qui a valu aux IA, en particulier à ChatGPT et ses amis, leurs premières controverses publiques : des avocats sanctionnés pour avoir cité des jurisprudences inexistantes générées par ChatGPT, des articles scientifiques retirés pour des références bibliographiques inventées, des discours se référant à des citations qui n’ont jamais existé. On peut définir ce phénomène ainsi : l’hallucination est une erreur de contenu, le modèle dit quelque chose de faux.

Le second type d’erreur est souvent moins visible, bien moins connu et reconnu, et plus insidieux. Il ne concerne pas ce que le modèle dit, mais comment il le dit.

IA-Pulse
Sais-tu le dire ?
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 158. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Sais-tu le dire ?

IA-Pulse

Par : Olivier Martinez

18 avril 2026 à 10:42

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 158. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Asymétrie
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 157. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Asymétrie

IA-Pulse

Par : Olivier Martinez

11 avril 2026 à 10:05

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 157. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Les leaks des Mythes
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 156. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Les leaks des Mythes

IA-Pulse

Par : Olivier Martinez

4 avril 2026 à 10:17

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 156. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Poussière d'étoiles
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 155. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Poussière d'étoiles

IA-Pulse

Par : Olivier Martinez

28 mars 2026 à 10:29

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 155. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
L'IA et l'emploi : apocalypse déjà annoncée ou mirage statistique résistant ?
Temps de lecture : 18 minsCet article est payant.Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte La newsletter du samedi matin reste gratuite.Les annonces de disparitions de métiers entiers et de suppressions de postes liées à l’IA se sont multipliées ces dernières années et encore accélérées ces derniers mois. Au point de réussir à former le récit dominant sur les réseaux et dans les médias, influençant même les plus sceptiques : l’IA serait sur

L'IA et l'emploi : apocalypse déjà annoncée ou mirage statistique résistant ?

IA-Pulse

Par : Olivier Martinez

27 mars 2026 à 13:46

Temps de lecture : 18 mins

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Les annonces de disparitions de métiers entiers et de suppressions de postes liées à l’IA se sont multipliées ces dernières années et encore accélérées ces derniers mois. Au point de réussir à former le récit dominant sur les réseaux et dans les médias, influençant même les plus sceptiques : l’IA serait sur le point de transformer radicalement le marché du travail. Cela se conçoit aisément et c’est une idée assez banale dans nos esprits quand on parle d’une innovation technologique de cette ampleur.

Mais surtout, selon une majorité d’observateurs et d’acteurs, la vraie spécificité de l’époque actuelle liée à “l’IA” serait le rythme inédit de la transformation du travail et de son marché. Bien plus rapide qu'avec l'apparition de l’informatique ou l’arrivée d’internet. Un véritable tsunami pour reprendre l’image la plus diffusée et galvaudée.

Alors chacun y va de son “étude” et de ses “observations”. Selon les données du cabinet Challenger, Gray & Christmas, l’IA aurait causé en 2025 sept fois plus de licenciements aux US que les droits de douane imposés par l’administration américaine, qui ont pourtant été identifiés comme un facteur majeur de perturbation économique. Les suppressions de postes dues à l’IA seraient au nombre de 55 000 contre un peu plus de 7 000 attribuées à la politique des droits de douanes.

On peut noter au passage, toujours dans cette même étude, que les suppressions pour cause d’IA représentent 5% du total global. Le motif le plus cité était de loin les coupes du DOGE (plus 293 000), suivi des conditions de marché (253 000), des fermetures de sites (191 000) et des restructurations (133 000). L'IA fait les gros titres, mais reste un motif minoritaire dans les données globales. Ce qui nous montre déjà ici une disproportion entre les discours généralement partagés et les données. De là à penser que “l’IA” est un bon prétexte pour certains, il n’y a qu’un pas.

Et puis très souvent dans les images véhiculées actuellement, il y a les comparaisons : avec la Première Révolution industrielle, avec l’expansion de la mécanisation et de la robotisation dans les usines, ou encore l’arrivée de l’informatique ou d’internet. Des comparaisons qui se banalisent partout, dans tous les discours, de la revue spécialisée au journal de 20h en passant par nos réseaux sociaux. Les travailleurs du savoir et de la “création”, les fameux cols blancs, comme les enseignants, chercheurs, analystes, consultants, rédacteurs, créatifs, etc., s’interrogeant publiquement sur l’avenir et la pérennité de leurs métiers, voire la disparition programmée de leur catégorie professionnelle. Et ce n’est pas la mise en lumière médiatique ces derniers jours de la dernière étude prospective en France, publiée par la Coface et l’Observatoire des emplois menacés et émergents, qui va à l’encontre de ce discours ambiant et anxiogène.

Pourtant, une série de travaux publiés depuis le début de l’année 2026, s’appuyant sur des données empiriques plutôt que sur des projections et des sentiments de prospective, dessine un tableau sensiblement différent.

Non pas que l’IA soit sans effet. Loin de là. Les premiers signaux existent - et je fais partie de ceux qui les ressentent et les observent au quotidien dans les différents types d’organisations que j’accompagne. Les jeunes entrant sur le marché du travail dans les métiers dits exposés, comme l’informatique par exemple, le vivent aussi au quotidien.

Mais l’écart entre le discours ambiant, et ce que mesurent réellement les chercheurs mérite qu’on s’y attarde quelques minutes. Pourquoi diable ce qui nous paraît un tsunami n’est toujours pas visible dans les chiffres macro au bout de 3 ans ?

Il faut bien le constater : la réalité vécue par de nombreuses entreprises dites “legacy” en matière d’emploi et de marché du travail face à l’IA est assez éloignée de celle décrite ou espérée par certains experts en prospective.

L’IA peut très bien ne pas produire encore de choc massif sur l’emploi total tout en modifiant déjà en profondeur la géométrie du marché du travail. Elle peut toucher d’abord les embauches plus que les licenciements, les juniors plus que les seniors, les tâches plus que les intitulés de poste, les compétences demandées plus que les volumes d’emploi.

Le vrai risque n’est peut-être pas de manquer une apocalypse, mais de passer à coté d’une transformation plus lente, plus sélective, et donc plus facile à sous-estimer.

Sommaire:

L'adoption réelle de l’IA en entreprise : large en surface, superficielle en profondeur
L'emploi : toujours pas de rupture visible à l'échelle macro
Là où le réel signal émerge : les jeunes travailleurs a.k.a. les canaris de notre mine
Le paradoxe de la productivité, saison 2
Ce qui manque : une infrastructure de mesure à la hauteur de l'enjeu
Que retenir ?

Note : les sources citées et utilisées sont regroupées à la fin de cet article.
Ces sources sont principalement axées sur le marché du travail et les entreprises US.
A noter que le travail essentiel fait par le LaborIA de l’INRIA, avec à sa tête Yann Ferguson, son directeur scientifique, porte plus sur le terrain qualitatif, c’est à dire l'expérience vécue des travailleurs, et peu sur les courbes d'emploi.

L'adoption réelle de l’IA en entreprise : large en surface, superficielle en profondeur

Le premier décalage observé concerne l’adoption de “l’IA” elle-même.

IA-Pulse
[Podcast] « La gestion du coût des tokens, c'est le principal problème aujourd'hui », Sacha Morard (Edgee)
Temps d’écoute : 43 mins - Temps de lecture : 5 minsVous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compteEntretien réalisé le 2 mars 2026Le token est devenu le baril de pétrole du numériqueAu début du mois de mars, j’ai eu le plaisir d’échanger avec Sacha Morard, co-fondateur de Edgee et ancien CTO et membre du Comex du groupe Le Monde. Sacha a un profil qu’il qualifie lui-même de builder : quelqu’un qui n’a jamais vraiment cessé de construire, même aux

[Podcast] « La gestion du coût des tokens, c'est le principal problème aujourd'hui », Sacha Morard (Edgee)

IA-Pulse

Par : Olivier Martinez

22 mars 2026 à 14:38

Temps d’écoute : 43 mins - Temps de lecture : 5 mins
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte

Entretien réalisé le 2 mars 2026

Le token est devenu le baril de pétrole du numérique

Au début du mois de mars, j’ai eu le plaisir d’échanger avec Sacha Morard, co-fondateur de Edgee et ancien CTO et membre du Comex du groupe Le Monde. Sacha a un profil qu’il qualifie lui-même de builder : quelqu’un qui n’a jamais vraiment cessé de construire, même aux responsabilités les plus élevées. Depuis 2 ans, il est à la tête d’Edgee, avec son associé Gilles Raymond, un projet qui s’attaque à un problème que beaucoup d’entreprises ont encore du mal à nommer : le coût des tokens.

De la bande passante au token : trois âges du numérique

Pour comprendre le positionnement d’Edgee, Sacha pose d’emblé le contexte. Le modèle économique du numérique a traversé trois âges :

la bande passante (CDN, Akamai, Cloudflare)
le computing (AWS, Azure, Google Cloud)
et maintenant le token.

« Depuis 2 ans, 3 ans, on est sur une nouvelle économie, un pilier économique qui est celui du token », résume-t-il. Le token, cette unité de base avec laquelle les modèles de langage découpent et facturent chaque requête, est devenu la monnaie de référence d’une économie entière, et sa gestion, un enjeu opérationnel que peu d’entreprises maîtrisent encore.

La facture est loin d’être anecdotique. « Je rencontre tout le temps des entreprises qui payent des 25, des 50, des 100 000 euros par mois en consommation de tokens. » Et contrairement à ce que les tarifs d’abonnement grand public pourraient laisser croire, les providers eux-mêmes ne sont pas à l’équilibre : « C’est pas parce que vous achetez un plan à 20 € chez OpenAI qu’OpenAI arrive à faire de l’argent avec ce truc-là. »

Une bombe à retardement pour les deux côtés de la chaîne.

Edgee : un proxy pour les LLM

Edgee se définit comme un dev tool, un outil pour développeurs, qui joue le rôle de proxy multi-LLM. L’analogie de Sacha est limpide : « C’est un peu comme le système de carte bancaire, mais pour les IA. »

Un développeur se connecte une fois à Edgee et peut adresser des requêtes à OpenAI, Anthropic, Gemini ou tout autre provider, sans changer d’interface. Plus besoin de recoder les intégrations à chaque changement de modèle.

À cela s’ajoutent deux autres piliers :

un système d’arbitrage : un modèle de machine learning entraîné pour décider, requête par requête, vers quel LLM router en fonction du coût et de la performance attendue.
et un volet souveraineté : la possibilité d’héberger des modèles open source (Mistral, DeepSeek…) sur des infrastructures européennes comme Scaleway et OVH, choisies selon les besoins du client.

La token compression : le cœur du réacteur

C’est la compression de tokens qui constitue l’innovation propriétaire centrale. Pour comprendre son utilité, il faut saisir un mécanisme souvent invisible : à chaque requête, le modèle reçoit non seulement la question posée, mais l’intégralité du contexte accumulé : l’historique de la conversation, les fichiers ouverts, les préférences connues de l’utilisateur. « Au plus vous êtes fidèles avec ces IA, au plus vous consommez ces tokens. »

Edgee intervient en amont : la plateforme analyse ce contexte en temps réel et en supprime les éléments redondants ou inutiles. « C’est pas ce qu’on appelle la summarization, on ne vient pas prendre un prompt et on le résume pas. On vient faire de l’analyse sémantique de chacun des tokens pour savoir s’ils sont efficaces ou pas utiles. » Avant d’envoyer la version compressée, le système calcule l’écart sémantique entre le prompt original et le prompt allégé. Si l’écart dépasse un seuil critique, la compression est abandonnée et le prompt original est envoyé. Ce garde-fou garantit, selon Sacha, une qualité de réponse identique. Le taux de compression annoncé : jusqu’à 50 %, particulièrement efficace sur les assistants de code (Claude Code, Cursor, Codex) et les agents autonomes.

Au-delà de la compression, Edgee propose un système de tags qui permet à chaque requête d’être étiquetée par usage. Résultat : une observabilité fine des coûts par produit, par service, par équipe. Une visibilité que la plupart des organisations n’ont pas aujourd’hui.

Le développeur augmenté et le tsunami qui s’ensuit

Notre conversation dérive alors naturellement vers une question plus large : qu’est-ce que ces outils changent concrètement pour quelqu’un qui code ? La réponse de Sacha est sans ambiguïté. « Il m’arrive très rarement d’écrire moi-même une ligne de code, et je le dis avec aucun complexe, parce que pour autant, j’ai l’impression d’avoir acquis des super pouvoirs. Des choses qui m’auraient pris 6 mois à faire, aujourd’hui en une semaine je les ai faites. »

L’exemple qu’il choisit est parlant : quand il était au Monde, un projet de traduction automatique avec DeepL avait pris cinq mois. Aujourd’hui, il l’exécuterait seul en deux semaines. Ce glissement n’est pas seulement une question d’efficacité personnelle, c’est une menace structurelle pour des catégories entières de startups spécialisées dans des tâches que les LLM généralistes absorbent désormais. « Je n’aurais même plus besoin de DeepL. »

Il note aussi que le niveau d’entrée pour accéder à ces capacités s’abaisse rapidement. Posséder une culture informatique solide reste un avantage, mais ce n’est plus le prérequis qu’il était il y a encore six à huit mois.

Ce qu’un pivot apprend sur le marché

Edgee n’est pas née telle quelle. Sacha raconte l’histoire d’un pivot : la première version d’Edgee s’attaquait à un problème de collecte de données vécu directement au Monde : un problème réel, une technologie solide, mais un marché qui ne répondait pas. Trop de concurrence installée, trop de budgets absorbés par l’IA. « On est arrivés probablement un peu trop tard sur le marché. »

La méthode de recentrage est intéressante en elle-même : l’équipe a formulé quatre hypothèses de pivot, codé un questionnaire en ligne avec l’aide d’un LLM, l’a adressé à 150 directeurs techniques, recueilli 50 réponses, et choisi l’hypothèse la mieux étayée. Une démarche de discovery accélérée par les outils qu’Edgee cherche précisément à optimiser.

Le conseil qu’il laisse aux entrepreneurs suit la même logique : utiliser l’IA dès le départ pour prototyper rapidement, mais ne jamais court-circuiter la phase de terrain. « On n’a jamais assez d’informations provenant du marché quand on a sorti un produit. On en a jamais eu assez, jamais. »

💾

IA-Pulse
Différentes couleurs, différentes nuances
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 154. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Différentes couleurs, différentes nuances

IA-Pulse

Par : Olivier Martinez

21 mars 2026 à 08:08

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 154. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Open Chine : vous aussi vous élevez un homard ?
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 153. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Open Chine : vous aussi vous élevez un homard ?

IA-Pulse

Par : Olivier Martinez

14 mars 2026 à 09:54

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 153. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Computer Use
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 152. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Computer Use

IA-Pulse

Par : Olivier Martinez

7 mars 2026 à 10:32

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 152. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Claude fait sécession
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 151. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Claude fait sécession

IA-Pulse

Par : Olivier Martinez

28 février 2026 à 09:32

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 151. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Pas trace de foi dans le crustacé
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 150. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Pas trace de foi dans le crustacé

IA-Pulse

Par : Olivier Martinez

21 février 2026 à 08:57

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 150. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
GEO, Visibilité et Citation Economy : tout est vrai, sauf les chiffres
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compteTemps de lecture : 14 mins Read more

GEO, Visibilité et Citation Economy : tout est vrai, sauf les chiffres

IA-Pulse

Par : Olivier Martinez

16 février 2026 à 06:48

Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte

Temps de lecture : 14 mins

IA-Pulse
Obsolète
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 149. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Obsolète

IA-Pulse

Par : Olivier Martinez

14 février 2026 à 09:53

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 149. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
L'échafaud(age)
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 148. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

L'échafaud(age)

IA-Pulse

Par : Olivier Martinez

7 février 2026 à 09:05

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 148. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
OpenClaw et Moltbook - la Hype & Claw
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 147. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

OpenClaw et Moltbook - la Hype & Claw

IA-Pulse

Par : Olivier Martinez

31 janvier 2026 à 10:58

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 147. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Constitution
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 146. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Constitution

IA-Pulse

Par : Olivier Martinez

24 janvier 2026 à 09:45

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 146. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Intelligence personnelle
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 145. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Intelligence personnelle

IA-Pulse

Par : Olivier Martinez

17 janvier 2026 à 09:09

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 145. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Siri change de moteur
Temps de lecture : 5 minsVous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte Read more

Siri change de moteur

IA-Pulse

Par : Olivier Martinez

13 janvier 2026 à 09:49

Temps de lecture : 5 mins

Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte

IA-Pulse
Le démon de Laplace
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 144. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Le démon de Laplace

IA-Pulse

Par : Olivier Martinez

10 janvier 2026 à 09:48

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 144. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
LMArena, l'arbitre qui vaut 1,7 milliard et que tout le monde veut croire
Temps de lecture : 4 minsCet article est payant.Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte La newsletter du samedi matin reste gratuite.Le vrai détenteur du pouvoir sur le marché de l’IA, c’est celui qui mesureLMArena, qui un temps fût nommé Chatbot-Arena, c’est au départ un truc assez simple pour mettre en compétition de manière directe des modèles entre eux, en effectuant des “mesures” plus proches de la perception et des “goûts” des utilis

LMArena, l'arbitre qui vaut 1,7 milliard et que tout le monde veut croire

IA-Pulse

Par : Olivier Martinez

7 janvier 2026 à 10:51

Temps de lecture : 4 mins

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Le vrai détenteur du pouvoir sur le marché de l’IA, c’est celui qui mesure

LMArena, qui un temps fût nommé Chatbot-Arena, c’est au départ un truc assez simple pour mettre en compétition de manière directe des modèles entre eux, en effectuant des “mesures” plus proches de la perception et des “goûts” des utilisateurs vs les benchs automatisés. En gros c’est un système de vote, où l’on propose à l’utilisateur deux réponses à un même prompt provenant de deux modèles différents, puis l’utilisateur vote pour la “meilleure” réponse, et ça finit en classement.

Cette plateforme issue du monde universitaire a été transformée en 4 mois en un produit vendu aux entreprises… et ils viennent d’annoncer une levée de 150 millions de dollars, pour une valorisation totale de 1,7 milliard.

Mais, ici, en vrai, le sujet n’est pas cette levée et cette valorisation. C’est le rôle que prend celui qui “mesure”, c’est à dire le rôle que LMArena tente de prendre sur le marché de la décision.

IA-Pulse
Retour sur 2025
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 143. Gérez votre abonnement.⏱️Temps de lecture de cette newsletter par une unité carbone : 10 mins Read more

Retour sur 2025

IA-Pulse

Par : Olivier Martinez

3 janvier 2026 à 08:39

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 143. Gérez votre abonnement.

⏱️Temps de lecture de cette newsletter par une unité carbone : 10 mins

IA-Pulse
Simulacre et incarnation
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 142. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Simulacre et incarnation

IA-Pulse

Par : Olivier Martinez

27 décembre 2025 à 10:24

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 142. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Avec les dents
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 141. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Avec les dents

IA-Pulse

Par : Olivier Martinez

20 décembre 2025 à 11:17

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 141. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Alignement, renforcement et redressement
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 140. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Alignement, renforcement et redressement

IA-Pulse

Par : Olivier Martinez

13 décembre 2025 à 09:23

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 140. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Code Rouge
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 139. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Code Rouge

IA-Pulse

Par : Olivier Martinez

6 décembre 2025 à 09:03

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 139. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Déraison et complexité
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 138. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Déraison et complexité

IA-Pulse

Par : Olivier Martinez

29 novembre 2025 à 09:48

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 138. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
La recherche internet à l’heure des LLM : AI Search et Recherche Conversationnelle
Temps de lecture : 25 minsCet article est payant.Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte La newsletter du samedi matin reste gratuite.Les nouveaux moteurs de recherche : un monde où la réponse remplace le clicEn un peu plus de 30 ans, la recherche sur Internet est passée d’un annuaire maintenu par des humains (coucou Yahoo!) à une liste de dix liens bleus classés suivant un algorithme de pertinence “mécanique”, pour arriver actuellement à

La recherche internet à l’heure des LLM : AI Search et Recherche Conversationnelle

IA-Pulse

Par : Olivier Martinez

26 novembre 2025 à 07:36

Temps de lecture : 25 mins

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Les nouveaux moteurs de recherche : un monde où la réponse remplace le clic

En un peu plus de 30 ans, la recherche sur Internet est passée d’un annuaire maintenu par des humains (coucou Yahoo!) à une liste de dix liens bleus classés suivant un algorithme de pertinence “mécanique”, pour arriver actuellement à un écosystème beaucoup plus complexe, où cohabitent résultats classiques, résumés générés par l’IA et chatbots conversationnels. Cette évolution n’est pas qu’une curiosité technologique, elle bouscule les cartes de la visibilité, de l’acquisition de trafic et, plus largement, de la façon dont les utilisateurs accèdent à l’information et au savoir.

Avec l’arrivée des LLM, une cohabitation entre trois grands formats de “présentation des résultats” de recherche se dessine désormais devant nous :

la SERP traditionnelle, où le moteur reste un “simple intermédiaire” vers les sites
les AI Overviews, où une réponse synthétique est directement produite au-dessus des résultats
et la recherche conversationnelle, où l’on dialogue avec un agent en langage naturel pour construire progressivement la bonne réponse.

Derrière ces expériences utilisateur très différentes et souvent mêlées, on retrouve pourtant une même logique : donner la meilleure réponse et combiner la puissance des modèles de langage avec des sources externes (web, bases de contenus partenaires) pour produire des réponses à la fois pertinentes, à jour et vérifiables.

L’objectif de cet article est de clarifier ces nouveaux formats, d’expliquer au moins en partie ce qu’il se passe sous le capot (réécriture de requêtes, retrieval hybride, re-ranking, génération “groundée”), et de montrer en quoi ces transformations changent profondément la manière de penser le référencement, la notoriété de marque, la détention de la valeur de la réponse et globalement la relation aux moteurs de recherche.

Sommaire

Les 3 formats de recherche moderne : SERP, résumés IA et conversation
- La SERP classique : les résultats organiques traditionnels
- Les AI Overviews : la réponse instantanée générée par l’IA
- La recherche conversationnelle : le dialogue itératif homme-machine
Sous le capot des moteurs de recherche IA : un pipeline
- Analyse et récriture intelligente de la requête : query processing, query rewriting et query fan-out
- Recherche de documents : retrieval
- Reclassement précis : re-ranking
- Génération d’une réponse “ancrée” avec sources : grounding with search

I. Les 3 formats de recherche moderne : SERP, résumés IA et conversation

L’intégration de l’IA et des LLM a fait émerger trois grands formats distincts de recherche sur Internet, qui coexistent aujourd’hui et offrent des expériences utilisateur différentes. Il me semble important de bien distinguer ces formats, car chacun influence la visibilité des contenus d’une manière spécifique.

Voici un rapide tour d’horizon de ces trois paradigmes afin de comprendre leurs différences sans entrer dans le détail technique du fonctionnement interne .

1. La SERP classique : les résultats organiques traditionnels

Le format historique de la recherche en ligne est la SERP classique : Search Engine Results Page traditionnelle. Sur cette page, le moteur affiche une liste de liens vers des contenus web pertinents, accompagnés de courts extraits (snippets) et éventuellement de fonctionnalités enrichies (extraits optimisés, encadrés d’information du Knowledge Graph, etc.).

L’objectif principal de ce format est de fournir un point de départ vers l’information : l’utilisateur formule sa requête, puis clique sur l’un des résultats pour consulter le contenu sur le site tiers. En d’autres termes, le moteur de recherche agit en tant qu’intermédiaire qui redirige du trafic vers les sites web externes (on parle de génération de clics). Le succès de la SERP classique se mesure donc en termes de taux de clic (CTR) et de trafic référent envoyé aux éditeurs de contenu.

Ce modèle a prévalu pendant des décennies et reste encore très présent. Par exemple, une requête simple comme « météo Paris » ou « capitales de l’Europe » affichera typiquement en tête un extrait instantané, mais surtout une série de liens bleus vers des sites (météo, encyclopédies…) : il appartient alors à l’utilisateur de choisir un résultat et de cliquer pour obtenir sa réponse complète.

La SERP classique est ainsi caractérisée par une interaction ponctuelle et un contrôle utilisateur fort : c’est l’internaute qui décide quel lien consulter, et c’est sur le site visité que l’expérience se poursuit (lecture d’un article, achat sur un e-commerce, etc.). Pour les marques et éditeurs, ce format offre historiquement une visibilité mesurable (position dans les résultats) et la possibilité d’attirer directement l’internaute sur leur propre plateforme.

2. Les AI Overviews : la réponse instantanée générée par l’IA

Le deuxième format, apparu récemment, est celui des Overviews : en français, on parle de résumé IA, d’aperçu IA ou de réponse générative intégrée. Google a introduit ce concept sous le nom de Search Generative Experience (SGE) en mai 2023 pour le renommer AI Overviews au lancement grand public un an plus tard en mai 2024. Les autres moteurs explorent des approches similaires, Bing ayant été le premier à utiliser ce système de résumés générés par un LLM dès février 2023.

A noter que ce format n’est pas disponible actuellement en France sur Google, mais bien présent sur Bing et d’autres moteurs de recherche.

Le principe est d’afficher d’emblée une réponse synthétique à la question de l’utilisateur, directement dans la page de résultats, au-dessus des liens classiques. L’IA puise dans son index et utilise un modèle de langage pour rédiger un paragraphe de réponse qui tente de couvrir entièrement la requête posée. Google utilise son modèle Gemini pour rédiger ces résumés.

Concrètement, lorsque l’utilisateur pose une question, le système évalue d’abord si une réponse générée apporterait une véritable valeur ajoutée par rapport aux extraits existants. Si oui, il utilise un LLM pour synthétiser un résumé à partir de plusieurs sources web pertinentes, et affiche ce bloc de texte tout en haut de la SERP. Par exemple, sur une requête comme « Quelles races de chiens dorment le plus ?», le moteur peut afficher un encadré qui résume les principales races de chiens qui dorment plus que la moyenne, en s’appuyant sur différentes pages web. Ce résumé occupe une place proéminente, repoussant les liens organiques traditionnels plus bas dans la page.

L’interaction avec un AI Overview est généralement limitée et épisodique. L’objectif est de satisfaire immédiatement l’intention de l’utilisateur sans qu’il ait besoin de cliquer vers un site tiers. Ici on n’est pas dans un dialogue ouvert prolongé comme avec un chatbot. En somme, l’AI Overview vise le one-stop answer: fournir une réponse complète et instantanée à la requête, ce qui induit souvent que l’utilisateur n’a plus besoin de parcourir d’autres pages.

Pour plus d’informations sur les usages actuels : Google AI Overviews : les résumés des résultats de recherche faits par l’IA

A noter que Google a introduit récemment un lien en bas de la réponse fournie par AI Overviews vers son interface de recherche conversationnelle AI Mode, permettant ainsi à l’utilisateur de poursuivre sa discussion, mais là aussi sans sortir de l’interface du moteur. Microsoft a fait de même en mettant un lien vers Copilot Search au-dessus de la réponse Overviews.

AI Overviews est expérience utilisateur de « réponse zéro-clic » qui transforme profondément le rôle du moteur de recherche. Désormais, le moteur devient la destination finale de l’utilisateur plutôt qu’un passage vers un site éditeur.

Pour les internautes, c’est un confort accru : plus besoin de fouiller plusieurs pages pour trouver l’info essentielle. Pour les éditeurs de sites, en revanche, ce format pose un défi : le contenu est consommé directement sur Google ou Bing sans générer de visite sur leur site.

La portée économique est majeure, inaugurant l’ère du “Zero-Click” où une part croissante de recherches ne génère aucun clic vers l’extérieur. Les AI Overviews forcent donc les créateurs de contenu et annonceurs à repenser leurs modèles de monétisation, autrefois fondés sur l’acquisition de trafic, pour les orienter vers la visibilité et la notoriété de marque obtenues au sein même de ces réponses synthétiques du moteur.

3. La recherche conversationnelle : le dialogue itératif homme-machine

Enfin, le troisième format en plein essor est la recherche conversationnelle, que l’on peut décrire comme un chatbot de recherche. Dans ce paradigme, incarné par des outils comme ChatGPT et Claude en mode recherche internet, Gemini, Copilot, Perplexity AI, l’utilisateur interagit avec le moteur de recherche via un dialogue en langage naturel, multi-tour.

IA-Pulse
La Famille
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 137. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

La Famille

IA-Pulse

Par : Olivier Martinez

22 novembre 2025 à 09:14

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 137. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Tout est conversationnel
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 136. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Tout est conversationnel

IA-Pulse

Par : Olivier Martinez

15 novembre 2025 à 10:20

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 136. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Google AI Overviews : les résumés des résultats de recherche faits par l'IA
Temps de lecture : 20 minsCet article est payant.Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte La newsletter du samedi matin reste gratuite.Après une phase de test en 2023 avec SGE, Google a déployé en 2024 un nouveau type de résultats en haut de ses pages, une nouvelle fonctionnalité : les AI Overviews (AIO). Ces encadrés, générés par un modèle de langage de la famille Gemini spécialement réentraîné et aligné pour cet usage, répondent directeme

Google AI Overviews : les résumés des résultats de recherche faits par l'IA

IA-Pulse

Par : Olivier Martinez

14 novembre 2025 à 07:42

Temps de lecture : 20 mins

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Après une phase de test en 2023 avec SGE, Google a déployé en 2024 un nouveau type de résultats en haut de ses pages, une nouvelle fonctionnalité : les AI Overviews (AIO). Ces encadrés, générés par un modèle de langage de la famille Gemini spécialement réentraîné et aligné pour cet usage, répondent directement à la question posée par l’utilisateur tout en affichant le cas échéant quelques citations et des liens vers des sources externes. Pour les internautes, l’expérience semble plus simple et plus directe. Pour les éditeurs, les marques, les médias et les équipes SEO, l’impact est potentiellement majeur.

A l’heure de la publication de ces lignes, les AIO ne sont pas encore déployés officiellement en France. La fonctionnalité est pourtant présente partout dans le reste du monde, et son lancement devrait intervenir chez nous dans un avenir assez proche.

Bien entendu, les premières études depuis 2024 montrent une forte chute du taux de clic sur les “10 liens bleus” historiques qui se retrouvent en dessous des AIO, que ce soit sur les liens SEO mais aussi SEA, c’est-à-dire les liens sponsos. Avec AIO, l’internaute obtient très souvent une réponse complète à sa demande initiale, il n’a pas besoin de cliquer plus. Il faut ici reconnaitre que la chute du nombres de clics sur les liens n’a pas commencé avec AIO, mais qu’elle est une tendance depuis plusieurs années avec la mise en place de différents dispositifs au fil du temps : P0, PAA, etc.

Même si Google par la voix de Liz Reid, sa VP Search, continue de déclarer que cette baisse n’est pas due aux AIO, voire n’est pas réelle, les études faites par les différents acteurs de référencement et du SEO vont toutes dans le même sens, le taux de clic sur les liens bleus des pages de résultats Google chute fortement : Google AI Overviews drive 61% drop in organic CTR, 68% in paid

Overviews déplié : les sources sont à droite

Publiées sur les 10 derniers jours, 3 études successives d’Ahrefs réalisées avec des chiffres recueillis de septembre à novembre 2025, couvrant 146 millions de SERP, 43 000 requêtes suivies dans le temps, et 108 millions d’AIO mondiaux analysés, permettent de comprendre au moins en partie et avec quelques réserves, où, quand et comment Google déclenche ces AIO, et surtout ce qu’ils signifient réellement pour la visibilité organique :

A la lecture, et à l’analyse, des articles et des données exposées par Ahrefs, la conclusion principale est sans ambiguïté : les chiffres qui circulent peuvent donner l’impression d’un phénomène limité, voire périphérique, alors que la réalité structurelle est plus profonde et potentiellement plus impactante pour certains sites.

Si ce n’est pas un tsunami avec la généralisation du zero click tant redoutée, il n’en reste pas moins que ce changement de paradigme dans la recherche Google va peut-être avoir des conséquences pour certains éditeurs et certaines marques. Il ne s’agit ici de faire peur et d’exagérer des conséquences qu’on mesure partiellement et avec beaucoup de difficulté, mais de regarder de manière froide les données qui sont disponibles actuellement. 

Je reviendrai sur AI Mode de Google et sur les différents outils d'AI Search dans de prochains articles.

“20,5 %” d’apparition des AIO aux US : un chiffre trompeur

L’idée circule ces derniers jours : “Les AI Overviews n’apparaissent ‘que’ dans environ 20 % des résultats.” Ce chiffre dans l’étude Ahrefs est exact pour les USA, ou plus proche de nous pour le Royaume-Uni ou encore l’Italie, mais son interprétation est parfois fluctuante ou erronée.

L’étude précise que :

“Across our data set, AI Overviews appear for 21% of keywords”
“AI Overviews appear on 20.5% of all SERPs”

Cela veut dire que les AIO apparaissaient pendant la période testée sur 20,5 % des mots-clés du corpus de test aux US, et pas sur 20,5 % du volume réel de recherches des internautes US. Cela signifie concrètement qu’en moyenne 1 requête sur 5, dans le vaste échantillon de 146 millions testés par Ahrefs, présentait un encadré généré par l’IA, et pas 1 requête sur 5 en volume globale de toutes les recherches des internautes.

Cette nuance est importante : ce 20,5 % est une moyenne sur l’ensemble des mots-clés testés, sans pondération par leur popularité réelle. Dans les études d’Ahrefs, les millions de mots-clés testés ont tous le même poids dans les calculs, qu’ils soient recherchés 10 fois par mois… ou 100 millions de fois. Autrement dit, une requête rare compte autant dans le calcul qu’un mot-clé extrêmement fréquent.

En pratique, les AIO sont très inégalement répartis selon les types et les thématiques de recherches :

les requêtes informatives complexes sont nettement plus enclines à afficher un AIO, surtout dans les catégories Santé ou Sciences, où plus de 43 % des requêtes testées affichent un AIO. D’autres thématiques informationnelles denses comme People et Société à 35 % ou Animaux avec 37 % sont également bien au-dessus de la moyenne. On peut aussi citer les catégories tech avec Internet & telecom à 30 % ou encore Computers & electronic à 28%. Ce sont toutes des catégories et des domaines où les internautes posent beaucoup de questions de fond, et où Google estime qu’un résumé IA apporte de la valeur.
à l’inverse, pour les recherches à but navigationnel, qui représentent un gros volume, par exemple taper “Facebook” ou “Le Monde” pour aller sur le site, les AIO sont quasiment absents, de l’ordre de 0,1 % seulement de ces requêtes affichent un AIO. De même, les requêtes liées au shopping en ligne avec 3,2 % ou à l’immobilier avec 5,8 % sont très peu concernées, probablement parce que l’intention de l’utilisateur est différente : trouver un site précis, un produit commercial, etc., ce qui se prête moins à un encadré explicatif généré par IA. Et pour ces deux catégories, l’intérêt de Google est aussi certainement plus grand à afficher d’autres dispositifs…
les recherches locales (“dentiste près de chez moi”…), très fréquentes en volume global, ont elles aussi un taux de présence AIO faible avec 7,9 % seulement. Google privilégiant pour celles-ci les résultats de Google Maps et autres fonctionnalités locales plus pertinentes. Là aussi, l’intérêt de Google n’est pas dans l’Overviews, mais probablement dans d’autres fonctionnalités mieux monétisées.

Alors pour résumer, les “20 %” ou “21%” communiqués et repris comme un totem ne sont pas représentatifs de l’expérience réelle de tous les utilisateurs, mais sont en revanche bien représentatifs d’une réalité structurelle.

A retenir : en pratique, les AIO se concentrent sur certains types de requêtes, principalement informatives, avec des pics à plus de 40% dans des domaines, et quasiment aucun AIO dans d’autres pans de la recherche.

Les AIO sont massivement déclenchés par les requêtes informationnelles, surtout longues

Les études d’Ahrefs confirment sans ambiguïté que Google réserve les AI Overviews aux requêtes de type “Know”, c’est-à-dire les recherches informationnelles où l’utilisateur pose une question, cherche une définition, une explication, etc.

D’après Ahrefs, 99,9 % des mots-clés qui déclenchent un AIO ont une intention informative. À l’inverse, les requêtes navigationnelles, celles pour aller sur un site, ou purement transactionnelles pour acheter un produit déclenchent pratiquement jamais d’AIO avec moins de 1 % des cas.

Parmi les facteurs spécifiques qui favorisent l’apparition d’un AIO :

la formulation en question : les requêtes formulées de manière interrogative - contenant par exemple “quoi”, “comment”, “pourquoi…” - obtiennent un AIO dans 57,9 % des cas, bien plus que les requêtes non interrogatives avec 15 %. Google semble donc cibler explicitement les questions auxquelles l’IA peut apporter une réponse synthétique.
Source : Ahrefs
la longueur de la requête : les recherches comportant 7 mots ou plus ont 46,4 % de chances d’afficher un AIO. Plus la question de l’utilisateur est longue et détaillée, plus Google juge utile de fournir directement une réponse résumée. À l’inverse, les requêtes très courtes, 1 mot, ne déclenchent un AIO que dans 9 % des cas, souvent parce qu’un seul mot n’exprime pas assez clairement un besoin d’explication, et encore moins une intentionnalité interprétable par un modèle de langage.
Source : Ahrefs
le type de requête informative : Google dispose de classifieurs pour les intentions fines, par exemple les requêtes de type définition, requêtes cherchant une raison ou une cause, requêtes tutoriel/instruction... Les données montrent des taux de déclenchement AIO très élevés sur ces formats : 59,8 % des requêtes du type “raison” - questions commençant par “pourquoi/par quel mécanisme…” - produisent un AIO, c’est le cas de figure le plus fréquent. Les requêtes de définition du style “qu’est-ce que X”, ont aussi un taux élevé 47,3 %, de même que les requêtes d’instruction ou “comment faire” avec 35,1 % des cas. Pour résumer, dès que l’utilisateur cherche à comprendre ou apprendre quelque chose, il y a de fortes chances que Google génère un encadré de réponse IA.
Source : Ahrefs

Ces chiffres recoupent les types de contenus produits par de nombreux acteurs et éditeurs sur le web : sites encyclopédiques ou de connaissances “evergreen”, magazines spécialisés ou grand public qui expliquent des sujets, médias de vulgarisation scientifique, sites de santé/bien-être, portails de guides pratiques, comparateurs, FAQ, etc.

Les AIO frappent au cœur du contenu éditorial très consulté du web de manière globale. Les catégories où les AIO sont les plus présents, santé, science, société, high tech, correspondent aux thématiques où les internautes consomment énormément d’articles explicatifs et de contenus informatifs. Certes on peut se rassurer sur l’absence des AIO sur de l’actu chaude et généraliste, et aussi en observant qu’une grosse partie du trafic des éditeurs médias et de presse provient encore et toujours de Discover. On se rassure comme on peut.

Impact “zéro clic”

Ce sont également ces requêtes informationnelles longues qui risquent le plus de conduire à des non-clics. Si Google donne directement un résumé complet dans la page de résultat, l’utilisateur n’a plus forcément besoin de cliquer sur un lien vers un article ou une page. Depuis mars 2025, les données initiales d’Ahrefs suggèrent une baisse du trafic organique lorsque les AIO sont présents : le taux de clic du résultat naturel n°1, la première place des résultats en haut de page, chute en moyenne de 34,5 % pour les requêtes qui déclenchent un AIO, comparé aux mêmes types de requêtes sans AIO. Autrement dit, lorsqu’un encadré IA satisfait immédiatement la question, de nombreux utilisateurs ne poursuivent pas vers les sites externes, ce qui confirme la crainte d’un effet zero-click accru pour les éditeurs de contenus.

Les citations dans les AIO changent presque une fois sur deux, mais le sens ne change jamais

L’un des points les plus intéressants soulevés par les observations et les études est le paradoxe apparent du fonctionnement des AI Overviews : leur texte et leurs sources changent fréquemment, tandis que la réponse de fond reste la même.

Les études de Ahrefs confirment ce phénomène :

une mise à jour très fréquente : d’une observation à l’autre, il y a 70 % de chances pour que le contenu de l’AI Overview ait changé. En pratique, cela signifie que si l’on recharge la même requête à quelques jours, ou même à quelques heures d’intervalle, voire quelques minutes, on obtient souvent une formulation différente de la réponse IA. En moyenne, Ahrefs mesure une “persistance” de seulement 2,15 jours pour un même AIO. Autrement dit, tous les deux jours environ, Google régénère une nouvelle réponse pour une requête donnée. Si votre site est cité aujourd’hui, il ne le sera peut-être plus demain. La durée de vie d’une citation dans un AIO est éphémère.
près de la moitié des sources citées changent à chaque refresh : en comparant deux réponses consécutives à la même requête, seulement 54,5 % des URL citées sont les mêmes. Dit autrement, 45 % des liens ou sources changent entre deux générations successives. Par exemple, un site qui était référencé dans l’encadré AIO peut disparaître lors de la mise à jour suivante, ou d’un reload à l’autre, remplacé par une autre source équivalente en terme de sens sur le même sujet. L’algorithme semble faire tourner plusieurs références interchangeables. Il en résulte qu’optimiser une page pour être citée de manière systématique dans un AIO est illusoire, car même en obtenant une citation, rien ne garantit de la conserver plus de quelques minutes ou quelques heures ou quelques jours d’affilé.
les entités nommées changent aussi beaucoup : Google met en avant, dans le texte de l’AIO, certaines entités comme des personnes, des organisations ou des marque liées au sujet. Ces éléments fluctuent presque autant que les sources URL. L’”overlap” mesuré entre deux réponses consécutives est d’environ 54 % pour les entités, ce qui signifie qu’en moyenne une entité sur deux change d’une version à l’autre. Par exemple, à un moment l’AIO peut mentionner telle marque ou telle personnalité, et la fois suivante l’omettre ou la remplacer par une autre. Cette volatilité complique la tâche des marques et des éditeurs qui voudraient absolument figurer dans l’AIO : leur visibilité peut apparaître et disparaître d’un moment à l’autre, sans qu’on ait la main dessus.

Pourtant, la réponse apportée reste fondamentalement la même

Malgré ces changements de forme, le fond et l’idée centrale développée dans chaque AI Overviews pour chaque requête spécifique ne varient quasiment pas. Ahrefs a mesuré la stabilité sémantique entre deux réponses successives via un score de similarité cosinus, qui atteint 0,95 sur 1 - le 1 signifiant deux textes au sens identique. C’est un score extrêmement élevé.

Cela indique que d’une génération à l’autre, la tournure de la phrase peut changer, les exemples et citations peuvent varier, mais le fond de la réponse ne se contredit pas.

En d’autres termes, Google ne “change pas d’avis” d’un jour à l’autre sur une question donnée. L’assistant IA reformule différemment, mais il délivre une information cohérente dans le temps. Les mots varient en permanence, mais le sens reste incroyablement stable. Google ne réévalue pas drastiquement sa réponse, il la répète sous des formes diverses, en changeant les exemples et les sources.

Ce principe de variabilité des réponses, certains diront d’instabilité, se retrouve dans tous les mécanismes de Search AI qu’ils soient sous forme de résumés comme Overviews ou sous forme conversationnelle avec AI Mode, ChatGPT en mode recherche Internet, Perplexity, etc. J’y reviendrai dans un prochain article.

Pour clore cette partie, on peut noter que Google semble avoir une réponse “canonique” pour chaque question, qu’il reformule en s’appuyant tour à tour sur différentes sources crédibles.

Cela a deux implications confirmées par les données :

être cité à un instant T ne préjuge en rien de l’avenir : on peut disparaître au prochain refresh sans que cela signifie que son contenu est “mauvais”, l’algorithme fait juste tourner les références équivalentes;
même être identifié par Google comme une source faisant autorité sur le sujet ne garantit pas une citation permanente : l’IA alterne les multiples sources de confiance.

Quelles conséquences (provisoires et partielles) pour les éditeurs, marques et équipes SEO ?

Ces 3 études forment un diagnostic assez clair du changement de paradigme que Google est en train d’effectuer.

IA-Pulse
Pablo Honey
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 135. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Pablo Honey

IA-Pulse

Par : Olivier Martinez

8 novembre 2025 à 10:53

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 135. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Des attractions désastres
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 134. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Des attractions désastres

IA-Pulse

Par : Olivier Martinez

1 novembre 2025 à 10:38

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 134. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Band of browsers
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 133. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Band of browsers

IA-Pulse

Par : Olivier Martinez

25 octobre 2025 à 10:06

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 133. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

IA-Pulse
Quand le récit cale, on rebranche le désir
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 132. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas… Read more

Quand le récit cale, on rebranche le désir

IA-Pulse

Par : Olivier Martinez

18 octobre 2025 à 08:40

Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 132. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un ~~coup de gueule~~ édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcas…

Vue normale

⏱️Temps de lecture de cette newsletter par une unité carbone : 10 mins

🚨 GPT‑5.6 Sol sort de quarantaine et demande l’accès à vos mails

Pour aller plus loin : Reuters, The Verge, FT, Axios, Business Insider, OpenAI

🚂 La révolution agentique commence par rapprocher deux colonnes dans un tableur

Pour aller plus loin : Anthropic, TechCrunch, VentureBeat

👍 Chez Meta le consentement revient dans la roadmap

Pour aller plus loin : Reuters, Axios, The Verge, TechCrunch

🚀 6 lectures en plus

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

“What did you dream?”

📻 Le podcast de la semaine

Comment a été construite cette édition

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

💣 Le patron de Palantir attaque le modèle économique d'OpenAI et Anthropic

Pour aller plus loin : Business Insinder, CNBC, Forbes

💵 Citi, Atlassian, Amazon : la gueule de bois post-tokenmaxxing

Pour aller plus loin : Radar O’Reilly, 404

🔌 Google bat son record… de consommation électrique

Pour aller plus loin : Ars Technica, TechCrunch

🚀 6 lectures en plus

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

“Without you, it's not as much fun to pick up the pieces”

📻 Le podcast de la semaine

⏱️Temps de lecture de cette newsletter par une unité carbone : 8 mins

🚓 Anthropic accuse Alibaba

Pour aller plus loin : WSJ, Ars Technica

👔 Claude Tag : Anthropic met un collègue IA dans votre Slack. Facturé au token

Pour aller plus loin : TechCrunch, VentureBeat, Anthropic

🤖 Chez les géants de l'IA, l'humain devient relecteur de l'agent

Pour aller plus loin : WSJ

🚀 5 lectures en plus

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

“D'une bande magnétique”

📻 Le podcast de la semaine

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

🧑‍🎨 Creative Cloud : Adobe place un assistant spécialisé dans chacune de ses applications

Pour aller plus loin : TechCrunch, The Verge, VentureBeat

📉 GLM-5.2 : un modèle aux poids ouverts chinois qui rivalise avec les modèles propriétaires pour une fraction du prix

Pour aller plus loin : VentureBeat, Simon Willison, Hugging Face

🐐 « Si les LLM ont des attributs humains, alors Age of Empires II aussi »

Pour aller plus loin : 404, ArXiv

🚀 5 lectures en plus

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

Don’t forget. Just let it go.

📻 Le podcast de la semaine

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

🦺 Sécurité nationale : les États-Unis forcent Anthropic à débrancher Fable 5 et Mythos 5

Pour aller plus loin : Axios, Reuters, NYT, WSJ, TechCrunch, Wired, Anthropic

🗣️ Siri devient conversationnel, sauf pour 450 millions d'Européens

Pour aller plus loin : Ars Technica, NYT

⚖️ Un tribunal allemand juge Google responsable des erreurs de ses résumés par IA

Pour aller plus loin : The Decoder, Ars Technica, Golem

🚀 5 lectures en plus

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

Défaillance systémique

📻 Le podcast de la semaine

Sommaire

Temps de lecture : 15 mins

Cet article est payant. Vous pouvez en lire le début.Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compteLa newsletter du samedi matin reste gratuite.

Avoir le doigt sur l'outil ou concevoir le système, choisis ton camp

⏱️Temps de lecture de cette newsletter par une unité carbone : 10 mins

🧞 Scout face à Gemini Spark : la bataille de l'assistant d'entreprise

Pour aller plus loin : Wired, The Verge, TechCrunch

🛌🏻 Gemma 4 12B : une IA multimodale qui tient dans la main infère en local

Pour aller plus loin : VentureBeat, Ars Technica, Google

🪄 Le rayon des articles introuvables, que nous attendions tous depuis toujours, est enfin ouvert par Amazon grâce à l’IA

Pour aller plus loin : The Verge, TechCrunch

🚀 8 lectures en plus

🛠️ Des outils, des tutos et des modèles à tester

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

“Everybody' s looking for something”

📻 Le podcast de la semaine

⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins

⚡ Vibe, physics AI et milliards d'investissement : Mistral muscle son offre entreprise

Cet article est payant. Vous pouvez en lire le début.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Cet article est payant. Vous pouvez en lire le début.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.