- GEO
- Generative Engine Optimization. Discipline d'optimisation pour les moteurs de réponse génératifs comme ChatGPT, Perplexity, Gemini, Claude, Copilot et Google AI Overviews.
- AEO
- Answer Engine Optimization. Synonyme historique de GEO, encore largement utilisé. Désigne l'optimisation pour tout moteur qui produit une réponse synthétique plutôt qu'une liste de liens.
- LLM
- Large Language Model. Modèle de langage de grande taille capable de générer du texte en langage naturel. Famille à laquelle appartiennent GPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta).
- RAG
- Retrieval-Augmented Generation. Technique qui combine la recherche d'informations dans des sources externes avec la génération de texte par un LLM. La plupart des moteurs génératifs modernes utilisent une forme de RAG.
- Featured Snippet
- Encadré de réponse directe affiché en haut de la page de résultats Google. Ancêtre direct des AI Overviews, dont les pages sources ont une probabilité élevée d'être également citées dans les réponses génératives.
- Knowledge Graph
- Base de connaissances structurée de Google qui relie entités, attributs et relations. Source primaire d'autorité pour Gemini et les AI Overviews. Y figurer renforce considérablement la probabilité d'être cité.
- llms.txt
- Fichier proposé en 2024 placé à la racine d'un site, fournissant aux LLM un résumé Markdown des contenus importants. Standard émergent en cours d'adoption par les principaux moteurs génératifs.
- JSON-LD
- JavaScript Object Notation for Linked Data. Format recommandé par Google pour les données structurées schema.org. Plus simple à implémenter et à maintenir que les alternatives microdata et RDFa.
- Speakable
- Type schema.org qui désigne les passages d'une page particulièrement adaptés à la lecture par un assistant vocal ou à l'extraction par un moteur génératif. Signal explicite d'importance éditoriale.
- E-E-A-T
- Experience, Expertise, Authoritativeness, Trustworthiness. Critères de qualité utilisés par Google et par la plupart des moteurs génératifs pour évaluer la fiabilité d'une source.
- Corpus d'entraînement
- Ensemble des textes utilisés pour entraîner un LLM. Inclut typiquement Wikipedia, Common Crawl, Reddit, GitHub, Crossref et de nombreuses sources éditoriales. Une présence sur ces sources augmente la probabilité d'être appris par le modèle.
- Bot d'entraînement
- Crawler utilisé par un éditeur de LLM pour collecter des données : GPTBot pour OpenAI, ClaudeBot pour Anthropic, Google-Extended pour Google, PerplexityBot pour Perplexity. Leur accès se gère dans le robots.txt.