Retrieval Augmented Generation
Was ist RAG und wie kann es eingesetzt werden? Welche Vorteile bietet es? In diesem Artikel erfahren Sie mehr zum Thema.
Was ist RAG?
Retrieval-Augmented Generation (RAG) ist ein KI-Ansatz, der generative Modelle mit einer externen Wissensdatenbank kombiniert, um fundiertere Antworten zu liefern. Dabei wird, vereinfacht gesagt, vor der Generierung einer Antwort zunächst relevantes Wissen abgerufen (retrieve), das als zusätzlicher Kontext dient. Diese Infos können aus Unternehmensdokumenten, Wissensdatenbanken oder dem Web stammen. Anschließend generiert das Modell (etwa ein LLM) die Ausgabe, wobei es die abgerufenen Fakten mit einbezieht. Das Ziel von RAG ist, die Stärken von Suchmethoden (Aktualität, Faktentreue) mit den Stärken von generativer KI (Sprachgewandtheit, Kontextverständnis) zu verbinden.
Funktionsweise
Das RAG-Framework besteht typischerweise aus zwei Komponenten:
Durch die Aufteilung kann das System auch aktuelle oder organisationsspezifische Daten nutzen, die nicht in den ursprünglich mit dem LLM gelernten Daten enthalten waren. Das LLM muss nicht neu trainiert werden; es wird “on the fly” mit aktuellem Wissen versorgt.
Vorteile
Herausforderungen
RAG-Systeme sind komplexer, da sie eine zuverlässige Suche voraussetzen. Der Retriever muss relevant und präzise sein; wenn er falsche oder irrelevante Abschnitte liefert, kann auch die generierte Antwort schiefgehen. Zudem muss das generative Modell lernen, den gegebenen Kontext korrekt zu verwenden und nicht zu ignorieren. Dennoch hat sich RAG als sehr effektiver Ansatz herausgestellt, um LLM-Anwendungen praxisnäher und verlässlicher zu machen – man bekommt das Beste aus beiden Welten.