Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

Moteur de recherches et IA : c’est quoi le grounding ?

Le grounding, souvent traduit par “ancrage”, désigne l’ensemble des mécanismes qui permettent d’attacher des sources externes, récentes, identifiables et vérifiables, à une réponse générée par un modèle de langage.

D’une manière générale, lorsqu’un modèle “grounde” une réponse, il ne fait pas uniquement une réponse dite paramétrique, c’est à dire qu’il ne répond pas seulement à partir de ce qu’il a appris pendant son entraînement. Il va chercher des éléments sur le web, dans un index, dans une base documentaire ou dans un graphe de connaissances, puis il construit sa réponse à partir de ces éléments. C’est ainsi qu’il “s’ancre”.

Image générée par ChatGPT

Dernièrement, des chercheurs de Microsoft ont ajouté un autre aspect à cette définition en formulant le grounding comme un changement de paradigme pour la recherche internet : dans la recherche par IA, il ne s’agit plus seulement de “trouver les meilleurs documents” et de les proposer sous forme de listing à un utilisateur qui doit se débrouiller pour évaluer chacun des résultats en fonction de son intentionnalité, mais de “trouver les meilleures informations capables de soutenir une réponse fiable et attribuable”. Et c’est là que le grounding devient l’élément central des changements actuels dans la façon de rechercher des informations sur internet.

Un moteur de recherche classique renvoie une liste de pages. L’utilisateur lit, compare, évalue, doute, clique. Un moteur de recherche conversationnel fait autre chose : il lit à notre place des résultats, sélectionne des passages, les reformule, les synthétise et produit une réponse. Et dès que le système ne se contente plus de classer des liens mais commence à générer des phrases et des paragraphes, il doit être capable de montrer sur quoi il s’appuie. Le grounding c’est cette opération qui transforme une réponse générée en réponse appuyée sur des preuves.

Google parle de grounding with Google Search pour connecter Gemini à des données publiques du web et à des informations à jour. Google utilise aussi ce système pour AI Overviews et AI Mode, qui sont les fonctionnalités IA directement intégrées au Search historique. Ces fonctionnalités ne sont pas disponibles en France, mais vous pouvez tester des fonctionnalités équivalentes sur Bing le moteur de Microsoft.

De son coté, OpenAI décrit son web search comme un moyen de donner aux modèles accès à des informations récentes avant de produire une réponse, avec citations. Anthropic indique que Claude peut décider de chercher sur le web, répéter les recherches si nécessaire, puis répondre avec des sources citées. Perplexity met en avant un index web continuellement rafraîchi, des résultats structurés, des filtres de domaine, de langue, de région ou de date.

Les mots varient, mais le principe est le même : avec le grounding la réponse générée n’est plus censée flotter seule, sans ancrage, elle doit être reliée à un espace documentaire et cette liaison doit être présentée sous forme de source dans la réponse.

Sommaire :

  1. Ce qui se passe concrètement

  2. Ce que le grounding apporte

  3. Ce que le grounding ne résout pas

  4. La bonne définition

Temps de lecture : 20 mins
Cet article est payant.
Vous pouvez modifier vos préférences de réception ou vous désabonner sur la page de votre compte
La newsletter du samedi matin reste gratuite.

Attention, il ne faut pas confondre grounding et RAG, même si les deux sont très souvent liés :

Read more

❌