Das Mysterium der Quellenangaben
Nutzer fragen sich oft: "Woher weiß ChatGPT das?" Die Antwort ist komplex, denn ChatGPT nutzt zwei unterschiedliche Mechanismen, um Informationen bereitzustellen: das antrainierte Wissen und das aktive Retrieval (RAG).
1. Das antrainierte Wissen (Training Data)
Das Basismodell von ChatGPT wurde mit riesigen Mengen an Textdaten trainiert. Wenn es aus diesem Wissen antwortet, gibt es oft keine explizite Quelle an, da die Information "im Modell" als Wahrscheinlichkeit gespeichert ist. Es "erinnert" sich an Fakten ähnlich wie ein Mensch, der ein Buch gelesen hat, aber nicht mehr genau weiß, auf welcher Seite was stand.
2. Retrieval Augmented Generation (Browsing)
Wenn ChatGPT explizite Quellenlinks (z.B. "Quelle: Wikipedia") anzeigt, nutzt es meist den Browser-Modus oder Retrieval-Funktionen. Hierbei sucht die KI aktiv im Internet oder in hochgeladenen Dokumenten nach aktuellen Informationen, liest diese und fasst sie zusammen. Nur in diesem Modus ist eine verlässliche Quellenangabe garantiert.
Warum Quellen manchmal fehlen
Nicht jede Antwort hat eine Fußnote. Das liegt oft daran, dass die Information als "Allgemeinwissen" im Modell verankert ist oder aus mehreren Quellen synthetisiert wurde, sodass keine einzelne Urheberschaft mehr zuweisbar ist. Für Content-Ersteller bedeutet das: Um als Quelle genannt zu werden, müssen Inhalte so einzigartig und aktuell sein, dass die KI sie explizit abrufen muss. Mehr zur technischen Auswahl von Quellen erfahren Sie hier.