GEO / AI Search

Comment fonctionne vraiment la recherche IA (et pourquoi elle change le SEO)

La recherche IA ne classe pas dix liens. Elle récupère des pages candidates, juge lesquelles méritent confiance, rédige une seule réponse et cite quelques sources. Voici comment la machine fonctionne, étape par étape, et ce que chaque étape signifie pour faire citer votre entreprise.

Chris BorlonganGrowth· Search LeadsJune 11, 202613 min de lecture

Posez aujourd'hui une question à ChatGPT, Perplexity ou Google et, bien souvent, vous n'obtenez plus une liste de liens. Vous obtenez une seule réponse rédigée, avec quelques sources citées en dessous.

Quelque chose s'est passé dans l'intervalle entre votre question et ce paragraphe. La plupart des explications à ce sujet se noient dans le jargon ou sont si floues qu'elles ne vous apprennent rien.

Voici donc la version simple. Un moteur de recherche IA fait quatre choses, dans l'ordre : il récupère un ensemble de pages candidates, les classe par pertinence et confiance, rédige une seule réponse à partir de celles auxquelles il se fie, et cite les quelques-unes sur lesquelles il s'est réellement appuyé.

Une fois ces quatre étapes bien comprises, tout le jeu consistant à se faire citer cesse d'être un mystère.

Nous optimisons pour ces moteurs chaque jour, sur les sites de nos clients comme sur les nôtres. C'est donc le modèle à partir duquel nous travaillons réellement, pas le résumé du schéma de quelqu'un d'autre. Le GEO fait partie de nos services, et le comportement de ces moteurs est précisément ce que nous surveillons pour gagner notre vie.

Abstract editorial illustration: a left-to-right pipeline of three stages - navy sources gathered, then ranked, resolving into one orange answer - how AI search works.

Le basculement : de dix liens bleus à une seule réponse#

La recherche classique vous tend une liste et vous laisse choisir. Le travail du moteur s'arrête au classement. Vous lisez, comparez et cliquez. La page est le produit.

La recherche IA fait la lecture à votre place. Elle réunit plusieurs sources, raisonne sur elles et vous rend une seule réponse composée, avec des citations. La réponse est le produit, et votre page devient désormais un ingrédient dans le paragraphe de quelqu'un d'autre au lieu d'une destination.

Ce seul changement réécrit tout l'objectif.

Vous ne cherchez plus à occuper la position trois. Vous cherchez à être une source que le moteur récupère, à laquelle il se fie et qu'il cite. Et pour le faire à dessein, vous devez savoir ce qui se passe à chaque étape du pipeline.

Les quatre étapes d'une réponse de recherche IA

RécupérationLe moteur rassemble des pages candidates depuis la recherche et son index.

ClassementIl note ces sources selon la pertinence, la confiance et l'extractibilité.

SynthèseIl compose une seule réponse à partir des passages auxquels il se fie le plus.

CitationIl relie les sources utilisées : les notes que l'utilisateur voit vraiment.

Les quatre étapes d'une réponse IA#

Toute surface de recherche IA majeure exécute une version du même cycle. Les détails diffèrent d'un moteur à l'autre, mais la forme tient : récupérer, classer, synthétiser, citer.

Un moteur de recherche IA récupère des candidates, les classe par confiance, rédige une seule réponse et cite les quelques-unes sur lesquelles il s'est appuyé. Gagnez aux quatre, pas à une seule.

Récupération : comment le moteur trouve les pages candidates#

La récupération, c'est l'endroit où le moteur construit une liste restreinte de pages susceptibles de répondre à la question. Si vous n'êtes pas dans l'ensemble des candidates, rien d'autre de ce que vous faites ne compte.

Le contenu parvient à un moteur de deux façons, et elles fonctionnent sur des horloges complètement différentes.

Récupération en direct. Posez à ChatGPT avec recherche, à Perplexity ou à Google une question d'actualité et le moteur lance ses propres recherches, va chercher un ensemble de pages en direct et les lit sur le moment. C'est la surface sur laquelle vous pouvez bouger en quelques jours. Google décrit les AI Overviews comme une "requête en éventail" (query fan-out) : elles lancent plusieurs recherches connexes et récupèrent plus de pages qu'une requête unique n'en sortirait (voir la documentation des AI Overviews de Google sur developers.google.com/search/docs/appearance/ai-features). Perplexity procède de la même façon : il cherche sur le web pour chaque question et lit les résultats avant de répondre.
Données d'entraînement. Une partie de ce qu'un modèle "sait" est intégrée à partir du texte sur lequel il s'est entraîné, figée jusqu'à l'entraînement suivant. C'est pourquoi ChatGPT peut nommer des entreprises avec la recherche désactivée. Vous influencez cette couche lentement, en faisant écrire sur vous de façon cohérente pendant des mois, pas en modifiant une page cette semaine.

Voici la distinction pratique : la récupération en direct est rapide et modifiable, les données d'entraînement sont lentes et durables.

Pour être récupéré en direct, le robot du moteur doit pouvoir atteindre votre page et la lire. OpenAI va chercher les pages pour ChatGPT search avec OAI-SearchBot et documente ses robots sur platform.openai.com/docs/bots.

Bloquez ce robot dans votre robots.txt et vous vous serez retiré de l'ensemble des candidates de vos propres mains. Cela vaut la peine de le vérifier avant toute chose.

Classement : comment le moteur décide à quoi se fier#

La récupération jette un filet large. Le classement, c'est l'endroit où le moteur le resserre, en notant les candidates sur deux critères à la fois : cette page répond-elle vraiment à la question, et cette source est-elle assez crédible pour être reprise ?

La pertinence est la moitié facile. La confiance est la moitié difficile, et elle se décide avant qu'un seul mot ne soit cité. Un moteur ne mettra pas son nom derrière une affirmation issue d'une source qu'il n'a aucune raison de croire.

Cette confiance vient des mêmes signaux qui construisent l'autorité partout sur le web :

Qui vous référence. Les mentions et les liens provenant de sites crédibles que le moteur lit déjà lui indiquent que vous êtes une voix reconnue, pas une page inconnue qui lance des affirmations dans le vide.
Avec quelle cohérence le web vous relie au sujet. Couvrez un sujet avec une réelle profondeur et vous vous lisez comme une source dessus. Une page mince et isolée se lit comme une mention de passage.
Si votre identité est claire et cohérente. Le même nom d'entreprise, la même description, les mêmes sujets centraux partout où vous apparaissez. Des signaux mélangés diluent l'association que le moteur tente de former.

Les propres consignes de Google pointent dans la même direction : ses systèmes visent à mettre en avant un contenu qui démontre l'expérience, l'expertise, l'autorité et la confiance (le cadre E-E-A-T des consignes de qualité de recherche de Google).

La confiance n'est pas une tactique que l'on ajoute à la fin. C'est le filtre qui décide si votre page pertinente est seulement autorisée à entrer dans la réponse.

Synthèse : comment le moteur rédige la réponse#

La synthèse est l'étape qui n'existait tout simplement pas dans la recherche classique. Le moteur prend les pages qui ont survécu au classement et compose une réponse entièrement nouvelle, avec ses propres mots, en cousant ensemble des faits issus de plusieurs sources à la fois.

C'est pourquoi la façon dont votre contenu est rédigé compte autant que la confiance qu'on lui accorde. Un modèle de langage lit votre page pour en extraire une affirmation utilisable. Si la réponse tient dans une seule phrase claire sous un en-tête clair, elle est facile à reprendre. Si elle est étalée sur trois paragraphes de préambule, le modèle doit deviner où se trouve la réponse, et il ira souvent simplement chercher un concurrent qui l'a rendue évidente à la place.

Si un modèle peut reprendre une seule phrase de votre page et qu'elle tient toute seule, vous êtes extractible. Si chaque phrase a besoin des trois qui l'entourent, vous ne l'êtes pas.

L'extractibilité est une propriété structurelle, pas une opinion sur la qualité d'écriture. Commencez par la réponse, accordez les en-têtes à la façon dont les gens posent réellement leurs questions, gardez des paragraphes courts et faites en sorte que chaque fait tienne tout seul.

Une page construite ainsi alimente l'étape de synthèse avec une matière propre. Une page qui enterre sa réponse force le moteur à la chercher, et les moteurs soumis à un budget de tokens ne se donnent pas de mal pour vous.

Citation : comment et quand le moteur crédite une source#

Une fois la réponse rédigée, le moteur attache des citations aux sources sur lesquelles il s'est appuyé. Une citation est la récompense : le lien qui envoie une vraie personne vers votre site, et le crédit qui construit votre position pour la prochaine réponse.

Les citations ne sont pas distribuées de façon égale. Le moteur tend à créditer les sources qui ont fourni le plus directement les affirmations de la réponse, ce qui nous ramène droit aux étapes précédentes. Une page qui a été récupérée, à laquelle on s'est fié et dont il était facile d'extraire est la page qui se fait nommer. Une page seulement présente dans l'ensemble, ou à laquelle on s'est fié mais difficile à citer, est souvent lue puis laissée sans crédit.

Et voici la partie qui mérite d'être dite sans détour : la page citée n'est pas toujours la plus autoritaire du web.

C'est celle qui était atteignable, assez crédible et la plus claire au moment exact de la requête. C'est précisément cet écart que vous optimisez.

D'où les moteurs tirent leurs informations#

Deux conduites alimentent chaque réponse, et les confondre est l'erreur la plus courante que je vois.

La première est la récupération web en direct, la conduite rapide. Elle reflète les pages telles qu'elles existent aujourd'hui, si bien qu'une page que vous améliorez cette semaine peut apparaître dans des réponses ce mois-ci. C'est là que structurer le contenu pour l'extraction et garder les robots non bloqués paie rapidement.

La seconde est le corpus d'entraînement, la conduite lente. Il reflète ce que le web a dit de vous pendant les mois et les années qui ont précédé la dernière coupure d'entraînement, et vous ne pouvez pas le modifier directement. Vous le faites bouger comme vous construisez toute réputation : en faisant écrire sur vous, de façon cohérente, sur votre sujet, sur les sites dont les moteurs apprennent.

La plupart des entreprises ont besoin que les deux conduites fonctionnent.

La récupération en direct gagne la réponse de ce trimestre. Le corpus d'entraînement fait de vous le nom qu'un modèle choisit par défaut un an plus tard, même avec la recherche désactivée. L'ordre qui fonctionne vraiment : réparez d'abord la conduite rapide, puis financez la lente.

Ce que cela signifie pour le SEO#

Les fondamentaux du SEO n'ont pas cessé de compter. Ils sont devenus le prix d'entrée.

Explorabilité, vitesse, HTML propre, schema, autorité gagnée. C'est exactement ce qui vous fait entrer dans l'ensemble des candidates et passer le filtre de confiance. Donc si votre maison est déjà en ordre pour la recherche, vous ne partez pas de zéro. Le travail se reporte.

Ce qui est véritablement nouveau, ce sont deux missions que le SEO classique ne vous a jamais demandées :

Structurer le contenu pour l'extraction par les machines. Positionner une page pour un lecteur humain et fournir une affirmation propre à un modèle de synthèse sont liés, mais ce ne sont pas la même mission. La seconde récompense le fait de commencer par la réponse et d'écrire des faits autonomes, ce que quantité de contenu pourtant bien positionné ne fait tout bonnement pas.
Mesurer la visibilité IA directement. Les citations n'apparaissent pas dans un rank tracker. Vous devez poser aux moteurs les vraies questions de vos acheteurs et consigner si vous êtes nommé, cité ou absent, car la même question peut renvoyer des sources différentes d'une semaine à l'autre.

Le SEO classique positionne une page pour une requête. La recherche IA récompense une source pour sa fiabilité et son extractibilité, suffisantes pour être citée. Le recouvrement est réel, mais la seconde mission est nouvelle.

Le playbook plus approfondi pour mener ce travail, étape par étape, fait l'objet de son propre guide : notre guide complet de l'optimisation pour moteurs génératifs. Le mécanisme ci-dessus est la raison pour laquelle ce playbook a la forme qu'il a.

En quoi ChatGPT, Perplexity et les AI Overviews de Google diffèrent#

Tous exécutent le même cycle à quatre étapes, mais l'accent se déplace de façons qu'il vaut la peine de connaître.

ChatGPT (avec recherche). Mêle deux surfaces. Recherche désactivée, il répond à partir des données d'entraînement, donc y être présent est un jeu de réputation à long terme. Recherche activée, il récupère des pages en direct via OAI-SearchBot et les cite, se comportant davantage comme un moteur de recherche rapide et modifiable. Pour les tactiques propres à celui-ci, voir comment se positionner dans ChatGPT.
Perplexity. Le plus proche d'un moteur de recherche des trois. Il est bâti autour de la récupération en direct, lance des recherches pour chaque question et affiche ses citations bien en évidence, ce qui en fait l'endroit le plus facile pour voir le cycle récupérer-classer-citer se dérouler et le plus rapide pour faire des tests.
AI Overviews de Google. Elles s'appuient sur l'index et le classement existants de Google, puis viennent y greffer une couche de synthèse par-dessus. Google a décrit la "requête en éventail" (query fan-out) qui les sous-tend, où il déclenche plusieurs recherches connexes et récupère un ensemble de pages plus large qu'une requête unique. Ici, des fondations solides de recherche classique pèsent le plus lourd, parce que les AI Overviews puisent dans les mêmes systèmes pour lesquels vous optimisez déjà.

Voici la partie rassurante. Comme les trois récompensent les mêmes choses de fond (un contenu récupérable, crédible et extractible), vous n'optimisez pas trois fois séparément. Faites le travail une fois, bien fait, et il se cumule sur chaque surface d'IA en même temps.

Que faire à ce sujet#

Maintenant que vous savez comment la machine fonctionne, les actions découlent directement des étapes :

Assurez-vous de pouvoir être récupéré. Confirmez que les robots d'IA qui comptent pour vous sont bien autorisés, que vos pages rendent leur contenu en HTML propre et que rien d'important ne se cache derrière du JavaScript lourd. C'est le prix d'entrée dans l'ensemble des candidates.
Gagnez la confiance qui vous fait classer. Couvrez votre sujet avec une réelle profondeur, gardez l'identité de votre entreprise cohérente partout et faites-vous référencer par des sites crédibles. C'est la couche lente et cumulative que les concurrents ne peuvent pas truquer.
Écrivez pour l'étape de synthèse. Commencez chaque section par la réponse, accordez les en-têtes à de vraies questions, gardez des unités courtes et faites en sorte que chaque fait tienne tout seul. C'est le changement le plus impactant que la plupart des sites n'ont jamais pris la peine de faire.
Mesurez ce qui se fait citer. Passez les vraies questions de vos acheteurs dans ChatGPT, Perplexity et Google selon un calendrier régulier, et suivez les citations séparément des mentions. Vous ne pouvez pas améliorer ce que vous ne surveillez pas.

Passez ces quatre points comme une liste à cocher sur vos propres pages avec notre checklist GEO.

Nous faisons cela pour nos clients et sur nos propres propriétés, et cet article est construit exactement selon la spécification qu'il décrit. Si vous l'avez trouvé à l'intérieur d'une réponse d'IA, eh bien, c'est la méthode à l'œuvre en temps réel.

Si vous préférez qu'on s'en charge pour vous, c'est précisément ce que couvrent nos services : nous faisons de votre contenu la réponse que les moteurs d'IA récupèrent, à laquelle ils se fient et qu'ils citent, et nous le mesurons sur vos propres requêtes. Réservez une consultation et nous vous montrerons exactement où vous en êtes aujourd'hui sur les trois moteurs.