Glossaire GEO

GEO Generative Engine Optimization

Discipline qui consiste à optimiser un contenu pour qu'il soit sélectionné et cité par les IA génératives dans leurs réponses. Là où le SEO cherche à ranker sur Google, le GEO cherche à devenir la source que ChatGPT, Perplexity ou Gemini mobilisent pour répondre à une question. Ce n'est pas le même jeu.

Qu'est-ce que le GEO ?
AEO Answer Engine Optimization

Précurseur du GEO, l'AEO optimise le contenu pour répondre directement à une question précise — pas pour plaire à un algorithme de classement. L'objectif est d'apparaître dans les featured snippets et les réponses vocales. Le GEO étend cette logique aux moteurs IA génératifs.

Recherche conversationnelle

Mode de recherche où l'utilisateur formule une vraie question en langage naturel, plutôt que d'aligner des mots-clés. Il pose une question, reçoit une réponse, relance, précise. Ce dialogue remplace progressivement la requête classique. Le GEO structure le contenu pour exceller dans cet environnement conversationnel.

Citation

Une citation, c'est le moment où une IA mentionne votre contenu comme source dans sa réponse. C'est l'équivalent de la position 1 en SEO — mais avec une différence majeure : l'IA choisit sa source, elle ne se contente pas de classer. Être cité, c'est avoir été jugé fiable, pertinent et structuré.

E-E-A-T Expérience · Expertise · Autorité · Confiance

Cadre d'évaluation de la qualité d'un contenu, utilisé à l'origine par Google, repris aujourd'hui par les IA. Un contenu avec un fort E-E-A-T montre que derrière les mots, il y a une vraie expertise, une expérience terrain et une source identifiable. Les IA s'appuient dessus pour éviter de citer n'importe quoi.

Entité

Une entité est un élément du monde réel que l'IA reconnaît sans ambiguïté : une marque, une personne, un lieu, un concept. Plus votre entreprise est une entité claire dans les données du web, plus l'IA la connaît, la distingue et la cite spontanément. Le GEO travaille à renforcer cette présence.

AI Overviews

Bloc de réponse généré par l'IA de Google, affiché en haut des résultats avant tout lien organique. Il synthétise plusieurs sources pour répondre directement à la question. Être cité dans un AI Overview, c'est la visibilité maximale sur Google — sans garantie de clic, mais avec une exposition massive.

Zero-Click Search Recherche sans clic

Requête dont la réponse est fournie directement sur la page de résultats, sans que l'utilisateur clique sur un lien. Les IA génératives accélèrent ce phénomène : la réponse arrive avant la liste de sites. Le trafic organique recule. La visibilité dans la réponse elle-même devient l'enjeu principal.

Intention de recherche

Ce que l'utilisateur cherche vraiment derrière sa requête — pas les mots qu'il tape, mais le besoin qu'il exprime. Les IA comprennent l'intention mieux que n'importe quel algorithme de matching. Un contenu GEO efficace répond à l'intention profonde, pas seulement à la formulation de surface.

Prompt engineering

Art de formuler des instructions précises pour obtenir d'une IA la réponse souhaitée. En GEO, cette compétence sert à tester comment les IA répondent à vos requêtes cibles, à identifier les sources qu'elles citent et à calibrer votre contenu pour correspondre aux patterns de sélection des modèles.

YMYL Your Money or Your Life

Catégorie de sujets à fort enjeu — santé, finances, droit, sécurité. Les IA appliquent un filtre de qualité beaucoup plus strict sur ces contenus. Elles ne citent que des sources identifiables, vérifiables et reconnues. Si vous évoluez dans un secteur YMYL, votre E-E-A-T doit être irréprochable.

Rich Snippets Résultats enrichis

Formats de résultats Google qui affichent des éléments structurés — étoiles, prix, FAQ, événements. Ils reposent sur les données Schema.org. Ces mêmes balises que les moteurs lisent pour créer un rich snippet sont celles que les IA utilisent pour extraire et comprendre votre contenu. SEO et GEO partagent ce socle.

LLM Large Language Model

Modèle d'IA entraîné sur des volumes massifs de texte pour comprendre et produire du langage humain. GPT-4, Gemini, Claude sont des LLM. Leur savoir est figé à leur date d'entraînement — ils ne savent pas ce qui s'est passé après. C'est pourquoi ils s'appuient sur le RAG pour accéder à des informations récentes.

IA générative

Famille d'intelligences artificielles capables de produire du contenu nouveau — texte, image, son, code — à partir d'une instruction. Elle ne classe pas, elle génère. Cette différence fondamentale change tout pour la visibilité : une marque absente des réponses générées n'existe pas pour l'utilisateur.

Transformers

Architecture technique publiée en 2017 qui a tout changé dans le traitement du langage par les machines. Les Transformers permettent à l'IA de saisir les relations entre les mots dans un texte, même éloignés les uns des autres. Tous les LLM actuels — ChatGPT, Gemini, Claude — reposent sur cette base.

Hallucination

Quand une IA invente une information fausse avec le même aplomb que si elle était vraie. Ce n'est pas un bug, c'est une limite structurelle des LLM. Pour s'en protéger, les systèmes IA privilégient les sources avec un fort signal de fiabilité. Un contenu bien sourcé et structuré réduit le risque d'être remplacé par une hallucination.

NLP Natural Language Processing

Branche de l'IA qui permet aux machines de lire, comprendre et produire du langage humain. Le NLP va bien au-delà du matching de mots-clés : il analyse le sens, le contexte, le ton et l'intention. C'est ce qui permet à une IA de comprendre que «tarif» et «prix» répondent à la même question.

RAG Retrieval-Augmented Generation

Mécanisme qui permet à un LLM de chercher des informations actuelles sur le web avant de générer sa réponse. L'IA récupère des passages pertinents, les intègre dans son raisonnement, puis cite ses sources. Le GEO optimise précisément ce moment : votre contenu doit être trouvé, extrait, et jugé pertinent.

Grounding

Processus par lequel une IA ancre ses affirmations dans des sources externes vérifiables, plutôt que dans sa seule mémoire d'entraînement. Le grounding réduit les hallucinations et légitime les réponses. Pour une marque, devenir une source de grounding, c'est être la référence que l'IA choisit pour valider ses affirmations.

Embeddings

Traduction mathématique du sens d'un texte sous forme de vecteur numérique. Grâce aux embeddings, une IA comprend que «coût» et «tarif» parlent de la même chose, sans mot en commun. Plus votre contenu couvre le champ sémantique d'un sujet, plus ses embeddings se rapprochent des requêtes de vos clients.

Base de données vectorielles

Système de stockage qui indexe les contenus sous forme d'embeddings pour les retrouver par similarité sémantique. Quand un utilisateur pose une question, la base vectorielle identifie les passages les plus proches en sens — pas en mots exacts. C'est l'infrastructure qui détermine quels contenus sont récupérés par le RAG.

Chunking

Découpage d'un contenu en blocs autonomes que les systèmes RAG peuvent traiter indépendamment. L'IA ne lit pas une page entière : elle extrait des morceaux. Un contenu bien chunkable est structuré en sections qui ont chacune un sens complet, sans avoir besoin du reste pour être comprises.

Passage

Fragment de texte spécifique qu'un système RAG sélectionne pour construire une réponse. L'IA ne cite pas une URL, elle cite un passage. Rédiger pour le GEO, c'est rédiger des passages : denses en information, autonomes dans leur sens, et suffisamment clairs pour être réutilisés hors contexte.

Proximité sémantique

Mesure de la ressemblance de sens entre deux textes, indépendamment de leurs mots exacts. Plus votre contenu est sémantiquement proche de la requête d'un utilisateur, plus les systèmes RAG le remontent. Couvrir toutes les formulations possibles d'un même sujet est une priorité absolue en GEO.

Tokenisation

Étape préalable à tout traitement par un LLM : le texte est découpé en unités élémentaires appelées tokens — mots, syllabes ou caractères selon le modèle. Chaque LLM a une limite de tokens qu'il peut traiter en une fois. Comprendre la tokenisation aide à écrire des contenus que les IA absorbent intégralement.

Fenêtre de contexte Context Window

Volume maximal d'information qu'un LLM peut traiter en une seule interaction. Ce qui dépasse cette limite est ignoré. GPT-4 Turbo tolère 128 000 tokens, Gemini 1.5 Pro jusqu'à 2 millions. Un contenu structuré et concis consomme moins de fenêtre — et a plus de chances d'être lu et cité en entier.

Knowledge Graph

Base de données qui relie les entités du monde entre elles — marques, personnes, lieux, concepts. C'est la carte mentale des moteurs de recherche. Une marque bien représentée dans le Knowledge Graph est plus facilement reconnue et citée par les IA, qui s'appuient sur ce graphe pour structurer leurs réponses.

Données structurées

Balisage Schema.org intégré dans le code HTML pour expliquer aux machines ce que contient une page. Ce n'est pas du contenu visible : c'est du contenu lisible par les robots. Les IA l'exploitent pour extraire rapidement des informations fiables — auteur, date, FAQ, prix, organisation. Indispensable en GEO.

Query fan-out

Technique par laquelle un LLM décompose une requête complexe en plusieurs sous-requêtes pour explorer toutes les dimensions du sujet. À partir d'une question, il lance plusieurs recherches parallèles aux formulations différentes. Être présent sur l'ensemble de ces variantes maximise ses chances d'apparaître dans la réponse finale.

RRF Reciprocal Rank Fusion

Algorithme qui fusionne les classements issus des différentes sous-requêtes d'un query fan-out. Plutôt que de comparer des scores incompatibles, le RRF regarde les positions : un contenu régulièrement bien placé sur plusieurs variantes de requête remonte en priorité. La consistance sémantique prime sur la performance sur une seule requête.

ChatGPT

Assistant conversationnel d'OpenAI, premier LLM grand public à avoir transformé les usages de la recherche. Depuis l'intégration de la recherche web en temps réel, ChatGPT cite des sources dans ses réponses. Apparaître dans les réponses de ChatGPT sur ses requêtes cibles est l'un des objectifs GEO prioritaires pour toute marque.

Perplexity AI

Moteur de recherche IA qui génère des réponses synthétiques avec citations systématiques et liens vers les sources. Perplexity est aujourd'hui l'un des environnements les plus mesurables pour le GEO : chaque citation est explicite, vérifiable, et correspond à un vrai choix de l'algorithme. Un terrain idéal pour auditer sa visibilité IA.

Gemini

Famille de modèles IA de Google qui alimente les AI Overviews, le AI Mode et Google Workspace. Gemini accède directement à l'index Google — il ne cherche pas sur le web comme les autres, il puise dans la base de données la plus large du monde. Être bien indexé par Google est donc une condition nécessaire pour être cité par Gemini.

AI Mode de Google

Mode de recherche de Google qui remplace la liste de résultats par une conversation avec l'IA. Disponible aux États-Unis depuis mai 2025, il utilise le query fan-out pour explorer une requête sous tous ses angles avant de synthétiser une réponse. L'avant-poste de ce que sera la recherche Google dans deux ans.