Glossar: KI-Sichtbarkeit, GEO und LLM-Begriffe
Über 80 fachspezifische Begriffe rund um KI-Sichtbarkeit, Live-Daten-Auswertung und Generative Engine Optimization. Das Nachschlage-Werk für GEO im deutschsprachigen Raum.
Glossar: KI-Sichtbarkeit, Generative Engine Optimization und LLM-Begriffe
Über 80 fachspezifische Begriffe rund um KI-Sichtbarkeit, Live-Daten-Auswertung und algorithmische Quellen-Auswahl. Das umfassende Nachschlage-Werk für Generative Engine Optimization im deutschsprachigen Raum.
Dieses Glossar deckt das Themen-Feld der KI-Sichtbarkeit in seiner ganzen Breite ab: technische Standards, Plattform-Begriffe, Mess-Verfahren, Optimierungs-Methoden, branchen-spezifische Anforderungen und rechtliche Rahmen. Die Definitionen sind sachlich, präzise und für die Verwendung in Mandanten-Berichten, internen Schulungen und externen Veröffentlichungen geeignet.
A — D
AEO (Answer Engine Optimization)
Optimierung von Inhalten für KI-basierte Antwort-Systeme wie ChatGPT, Perplexity und Gemini. Methodisch eng verwandt mit Generative Engine Optimization (GEO), oft synonym verwendet. Schwerpunkt: Inhalts-Strukturierung für maschinelle Antwort-Extraktion.
AI Overviews (AIO)
Generative Antwort-Funktion in Google Search, früher als Search Generative Experience (SGE) bezeichnet. Liefert KI-generierte Antworten oberhalb der klassischen Trefferliste. Quellen-Auswahl folgt einer hybriden Logik aus Knowledge-Graph, klassischem Ranking und semantischer Nähe.
Anchor Citation
Eindeutige Zuordnung eines Antwort-Bestandteils zu einer konkreten Quelle in der KI-Antwort. In Perplexity üblich (nummerierte Fußnoten), in ChatGPT seltener und meist nur im Browse-Modus. Methodisch wichtig für die Citation-Mess-Auswertung.
Anthropic ClaudeBot
Web-Crawler-Identifier von Anthropic für die Indexierung von Inhalten zur Verwendung in Claude-Modellen. In der robots.txt zu adressieren, um Inhalts-Verwendung zu erlauben oder zu blockieren.
Applebot-Extended
Erweiterter Crawler-Identifier von Apple für die Indexierung zur Verwendung in Apple-eigenen KI-Modellen, abgesetzt vom Standard-Applebot für die Spotlight-Suche.
Author Schema (Person Schema)
Schema.org-Markup zur Auszeichnung von Autoren mit Name, Beruf, Qualifikation, Verbands-Mitgliedschaften und Publikations-Liste. Wichtiges E-E-A-T-Signal für KI-Plattformen.
Bingbot und Bing Chat
Crawler-Identifier von Microsoft. Bingbot bedient die klassische Bing-Suche und gleichzeitig die Such-Funktion in Microsoft Copilot. Inhalts-Erlaubnis für Bingbot ist Voraussetzung für Copilot-Sichtbarkeit.
BORA — Berufs-Ordnung für Rechts-Anwälte
Berufs-rechtlicher Rahmen für Anwalts-Werbung in Deutschland. Limitiert die zulässigen Werbe-Aussagen, was Auswirkungen auf die KI-Sichtbarkeits-Strategie von Kanzleien hat. Methodische Empfehlung: sachliche, fall-bezogene Inhalts-Tiefe statt werblicher Tonalität.
Bytespider
Crawler-Identifier von ByteDance (TikTok-Konzern) für KI-Indexierung. In der robots.txt zu adressieren.
CCBot
Crawler-Identifier von Common Crawl. Common Crawl liefert große Trainings-Datenbestände für viele KI-Sprach-Modelle. Inhalts-Verfügbarkeit für CCBot beeinflusst die Trainings-Daten-Basis vieler Plattformen.
ChatGPT-User
Crawler-Identifier von OpenAI, der bei nutzer-initiierten Browse-Anfragen aus ChatGPT verwendet wird. Abgesetzt von GPTBot (Trainings-Daten) und OAI-SearchBot (Search-Indexierung).
Citation
Nennung einer Quelle in einer KI-Antwort, entweder mit explizitem Link, mit Quellen-Verweis oder mit namentlicher Erwähnung. Citation ist die zentrale Mess-Größe für KI-Sichtbarkeit.
Citation-Quote
Anteil der KI-Antworten, in denen eine Marke oder Quelle genannt wird, gemessen über ein definiertes Prompt-Set und mehrere Plattformen. Standard-Mess-Größe in unseren Live-Mess-Berichten.
Citation-Ready Content
Inhalts-Format, das durch klare Definitionen, sachliche Tonalität und maschinell extrahierbare Strukturen für die Verwendung als Quelle in KI-Antworten optimiert ist.
Cohere-AI
Crawler-Identifier von Cohere für die Inhalts-Indexierung zur Verwendung in den Cohere-Sprach-Modellen.
Crawl-Budget
Begrenzte Ressource an Crawl-Aktivität, die ein Crawler einer Domain zuweist. Bei großen Domains entscheidet die Crawl-Budget-Verteilung darüber, welche Seiten überhaupt erfasst werden.
Crawl-Effizienz
Anteil der Crawl-Anfragen, die zu einer erfolgreichen Inhalts-Indexierung führen. Wird durch Server-Geschwindigkeit, robots.txt-Konfiguration und Sitemap-Qualität beeinflusst.
DSGVO
Daten-Schutz-Grund-Verordnung. Rahmen für die Verarbeitung personen-bezogener Daten in der EU. Berührt KI-Sichtbarkeits-Strategien insbesondere bei Tracking, Personalisierung und der Veröffentlichung von Mitarbeiter-Profilen.
E — H
E-E-A-T
Akronym für Experience, Expertise, Authoritativeness, Trustworthiness. Google-Bewertungs-Rahmen für Inhalts-Qualität, der zunehmend auch in KI-Plattform-Logiken übernommen wird.
Embedding
Vektor-Repräsentation eines Wortes, Satzes oder Dokuments in einem hoch-dimensionalen Vektor-Raum. Grundlage für semantische Ähnlichkeits-Berechnung in KI-Modellen und Retrieval-Augmented-Generation-Systemen.
Entity
Begriffliche Einheit (Person, Ort, Organisation, Konzept), die in einem Knowledge-Graph als eigenständiger Knoten geführt wird. Entity-Erkennung ist Voraussetzung für strukturierte Antwort-Generation.
Faktualität
Eigenschaft eines Inhalts, sachlich korrekte und überprüfbare Aussagen zu enthalten. Wichtiger Bewertungs-Faktor für KI-Plattformen, die werbliche oder spekulative Inhalte tendenziell als Quellen abwerten.
FAQPage Schema
Schema.org-Markup für Frage-Antwort-Sektionen. Wichtiges Format für KI-Sichtbarkeit, weil Plattformen FAQPage-Inhalte häufig direkt in Antworten extrahieren.
Generative Engine Optimization (GEO)
Systematische Optimierung von Inhalten für die Verwendung in generativen KI-Such-Systemen. Methodisch verwandt mit AEO, oft synonym verwendet. Schwerpunkt: technische, inhaltliche und externe Sichtbarkeits-Faktoren.
Gemini
KI-Sprach-Modell und Such-Plattform von Google. Gemini-Antworten greifen auf eine Kombination aus Modell-Wissen, Google-Knowledge-Graph und aktivem Web-Search-Grounding zurück.
Google-Extended
Crawler-Identifier von Google für die Inhalts-Verwendung in Gemini und anderen Google-eigenen KI-Modellen. Abgesetzt vom Standard-Googlebot für die klassische Such-Indexierung.
Google Knowledge Graph
Strukturierte Wissens-Datenbank von Google mit Entitäten, Beziehungen und Attributen. Eintritt in den Knowledge Graph erhöht die Citation-Wahrscheinlichkeit in Gemini und Google AIO substantiell.
GPTBot
Crawler-Identifier von OpenAI für die Inhalts-Indexierung zur Verwendung in den GPT-Modellen. Abgesetzt von ChatGPT-User (Browse) und OAI-SearchBot (Search).
Grounding
Mechanismus, mit dem ein KI-Modell seine Antworten an externen, aktuellen Daten-Quellen verifiziert. Bei Gemini standardmäßig aktiv, bei ChatGPT optional über den Browse-Modus.
Hallucination
Generierung sachlich falscher oder erfundener Inhalts-Bestandteile durch ein KI-Sprach-Modell. Plattform-Anbieter arbeiten kontinuierlich an Reduktion durch Grounding und besser strukturierte Prompts.
HWG (Heilmittelwerbe-Gesetz)
Deutsches Gesetz zur Regulierung der Werbung für Heilmittel und Therapien. Berührt KI-Sichtbarkeits-Strategien für medizinische Praxen und Anbieter im Gesundheits-Sektor.
I — N
Indexability
Eigenschaft einer Website, von Crawlern erfasst und in Such-Indizes oder KI-Trainings-Daten aufgenommen werden zu können. Voraussetzungen: technische Erreichbarkeit, robots.txt-Erlaubnis, ausreichende Inhalts-Substanz.
Inbound-Marketing
Marketing-Methodik, die Käufer durch nützliche Inhalte und Auffindbarkeit anzieht, statt sie aktiv anzusprechen. KI-Sichtbarkeit ist die methodisch konsequente Weiter-Entwicklung des Inbound-Ansatzes für Citation-getriebene Auffindbarkeit.
JSON-LD
Json-Linked-Data: Format zur Einbettung strukturierter Daten in Web-Seiten. Bevorzugtes Format für Schema.org-Markups und damit zentral für KI-Sichtbarkeits-Implementierungen.
Knowledge Cutoff
Datums-Grenze, bis zu der ein KI-Sprach-Modell mit Trainings-Daten versorgt wurde. Inhalte nach dem Cutoff sind nur über Browse- oder Grounding-Mechanismen für das Modell zugänglich.
Large Language Model (LLM)
Großes Sprach-Modell mit Milliarden bis Billionen Parametern, trainiert auf umfangreichen Text-Datenbeständen. Grundlage aller KI-Antwort-Systeme. Beispiele: GPT-4, Claude, Gemini, Llama, Mistral.
llms.txt
Datei-Standard für die Bereitstellung von Inhalts-Hierarchie-Informationen für KI-Systeme. Definiert Themen-Bereiche, Schwerpunkte und priorisierte URLs. Veröffentlicht unter llmstxt.org.
LocalBusiness Schema
Schema.org-Markup für lokal verankerte Unternehmen mit geografischen Angaben, Öffnungs-Zeiten und Service-Bereich. Voraussetzung für lokale KI-Sichtbarkeit.
Long-Tail-Prompt
Spezifische, mehrwortige Anfrage in einem KI-System. KI-Plattformen liefern bei Long-Tail-Prompts häufiger detaillierte Citations als bei generischen Kurz-Prompts.
Markdown
Leichtgewichtige Auszeichnungs-Sprache für Text-Strukturierung. Wichtig für die Erstellung citation-fähiger Inhalte und die llms.txt-Datei.
Meta-ExternalAgent
Crawler-Identifier von Meta für die Indexierung zur Verwendung in Meta-eigenen KI-Modellen.
Microsoft Copilot
KI-Assistent von Microsoft, integriert in Bing, Edge und Windows. Quellen-Auswahl basiert weitgehend auf der Bing-Indexierung.
Modell-Wissen
Wissens-Bestand, den ein KI-Sprach-Modell durch sein Training implizit gespeichert hat, abgesetzt von externen Daten, die über Grounding zugeführt werden.
NoIndex
Meta-Tag-Anweisung an Crawler, eine Seite nicht in den Such-Index aufzunehmen. Methodisch zu unterscheiden von der robots.txt-Disallow-Anweisung.
O — R
OAI-SearchBot
Crawler-Identifier von OpenAI für die Search-Indexierung in der ChatGPT-Such-Funktion. Abgesetzt von GPTBot (Trainings-Daten) und ChatGPT-User (Browse).
OnPage-Optimierung
Sammelbegriff für Optimierungs-Maßnahmen direkt auf den Web-Seiten einer Domain (Strukturierung, Keyword-Verwendung, Meta-Daten, interne Verlinkung). Klassische SEO-Disziplin mit Fortwirkung in der KI-Sichtbarkeit.
OpenGraph
Meta-Tag-Standard für die Beschreibung von Inhalten in sozialen Netzwerken und Vorschau-Karten. Methodisch sekundär für KI-Sichtbarkeit, aber relevant für Vorschau-Generation in Plattformen wie LinkedIn, Twitter, Slack.
Paywall
Bezahl-Schranke vor Inhalten. Paywalls verhindern die KI-Crawler-Erfassung und damit die Citation-Eignung der dahinter liegenden Inhalte.
Perplexity
KI-basierte Such-Plattform mit Schwerpunkt auf transparenter Quellen-Verwendung und nummerierten Fußnoten. Citation-Quote in Perplexity ist im Plattform-Vergleich am höchsten.
PerplexityBot
Crawler-Identifier von Perplexity für die Inhalts-Indexierung. Methodisch zu unterscheiden von Perplexity-User-Anfragen.
Pillar Page
Themen-übergreifende, ausführliche Inhalts-Seite (typischerweise 4.000 bis 6.000 Wörter), die als Anker einer Themen-Cluster-Struktur fungiert.
Plausibility
Bewertung der Glaubwürdigkeit eines Inhalts durch KI-Plattformen, abhängig von Quelle, Tonalität, Konsistenz und externen Vertrauens-Signalen.
Prompt
Eingabe-Text an ein KI-Sprach-Modell. In der KI-Sichtbarkeits-Mess-Methodik werden standardisierte Prompt-Sets verwendet, um Citation-Quoten reproduzierbar zu erfassen.
Prompt-Engineering
Systematische Gestaltung von Prompts zur Erzielung optimaler KI-Antworten. Methodisch wichtig für die Mess-Routine, weniger relevant für die Inhalts-Optimierung selbst.
Re-Crawling
Wiederholte Erfassung einer Web-Seite durch Crawler nach inhaltlichen Veränderungen. Crawl-Frequenz ist abhängig von Domain-Autorität, Änderungs-Häufigkeit und Sitemap-Aktualität.
Reputations-Signal
Externes Vertrauens-Signal (Bewertung, redaktionelle Erwähnung, Verbands-Mitgliedschaft, Wikidata-Eintrag), das die Citation-Wahrscheinlichkeit in KI-Antworten beeinflusst.
RAG (Retrieval-Augmented Generation)
Architektur-Muster, bei dem ein KI-Modell vor der Antwort-Generation externe Daten-Quellen abruft. Grundlage moderner KI-Such-Funktionen wie ChatGPT-Browse, Perplexity und Gemini-Grounding.
Robots.txt
Datei zur Steuerung des Crawler-Zugriffs auf eine Domain. Zentrale technische Voraussetzung für KI-Sichtbarkeit, weil sie bestimmt, welche Bots Inhalte überhaupt erfassen dürfen.
S — Z
Schema.org
Standardisiertes Vokabular für strukturierte Daten in Web-Seiten. Wird in JSON-LD-Format eingebunden und ist zentrale Voraussetzung für maschinelle Inhalts-Erkennung durch Such- und KI-Plattformen.
Search Generative Experience (SGE)
Frühere Bezeichnung für Google AIO. Generative Antwort-Funktion in Google Search.
Semantic HTML
Verwendung von HTML-Elementen entsprechend ihrer semantischen Bedeutung (article, section, nav, header, footer). Erleichtert die maschinelle Inhalts-Erkennung durch Crawler.
Sentiment
Tonalität einer Marken-Erwähnung in einer KI-Antwort (positiv, neutral, negativ). Wichtige Auswertungs-Dimension in der Live-Mess-Routine.
Service Schema
Schema.org-Markup zur Auszeichnung angebotener Dienst-Leistungen. Methodisch wichtig für Beratungs-Anbieter, Kanzleien, Praxen und Handwerks-Betriebe.
Sitemap
XML-Datei mit der Liste aller indexierungs-relevanten URLs einer Domain. Voraussetzung für effizientes Crawling.
Speakable Schema
Schema.org-Erweiterung zur Auszeichnung von Inhalts-Bereichen, die für Sprach-Ausgabe geeignet sind. Methodisch relevant für Sprach-Assistenten.
Strukturierte Daten
Sammel-Begriff für maschinell erkennbare Daten-Auszeichnungen in Web-Seiten, meist über Schema.org und JSON-LD.
TF-IDF
Term Frequency — Inverse Document Frequency: klassisches Verfahren zur Bewertung der Wortrelevanz in Dokumenten. Methodisch in modernen KI-Modellen abgelöst durch Embeddings.
Themen-Cluster
Strukturiertes Inhalts-Konzept aus einer Pillar-Page und mehreren ergänzenden Detail-Artikeln. Methodisch zentrales Format für KI-Sichtbarkeit.
Tonalität
Sprachlicher Charakter eines Inhalts (sachlich, werblich, emotional). KI-Plattformen bevorzugen sachliche Tonalität bei der Quellen-Auswahl.
TTFB (Time To First Byte)
Server-Antwort-Zeit bis zum ersten Daten-Byte. Methodisch wichtig für Crawl-Effizienz. Empfehlung: unter 200 Millisekunden.
Voice Search
Sprach-basierte Such-Anfrage. Methodisch nahe verwandt mit KI-Sichtbarkeit, da Sprach-Assistenten häufig auf KI-Antwort-Logiken zurückgreifen.
Wikidata
Strukturierte, frei zugängliche Wissens-Datenbank von Wikimedia. Eintritt in Wikidata erhöht die Citation-Wahrscheinlichkeit in Gemini und Google AIO substantiell.
Wikipedia
Frei zugängliche Online-Enzyklopädie. Erwähnung in einem Wikipedia-Artikel ist eines der stärksten externen Vertrauens-Signale für KI-Plattformen.
YouBot
Crawler-Identifier von You.com für die Inhalts-Indexierung in der You-Such-Plattform.
Zitierfähigkeit
Eigenschaft eines Inhalts, von KI-Plattformen als Quelle in Antworten verwendet werden zu können. Voraussetzung: maschinell extrahierbare Strukturen, sachliche Tonalität, faktische Verlässlichkeit, externe Vertrauens-Signale.
Verwendungs-Hinweis
Dieses Glossar ist ein offenes Nachschlage-Werk. Es wird quartalsweise erweitert um neue Begriffe, die sich aus aktuellen Plattform-Veränderungen oder Mandats-Erfahrungen ergeben. Für Mandanten stellen wir das Glossar in einer erweiterten Form mit branchen-spezifischen Begriffs-Sektionen zur Verfügung.
Eine ausführliche Methodik-Beschreibung mit den im Glossar referenzierten Verfahren finden Sie unter Unsere Methodik. Eine Übersicht der Programm-Stufen finden Sie unter Leistungen und Pakete. Eine erste Selbst-Einschätzung erhalten Sie in 60 Sekunden mit unserem KI-Sichtbarkeits-Check. Eine vollständige Sichtbarkeits-Analyse mit Live-Daten aus ChatGPT, Gemini und Perplexity erhalten Sie über die kostenlose Sichtbarkeits-Analyse.