Modulario by AMCEF
Demo
📖 Glossar · KI und Automatisierung

RAG

Retrieval-Augmented Generation

Technik, die ein LLM um dynamisches Suchen in Unternehmensdokumenten erweitert — die Antwort entsteht durch Kombination des gefundenen Kontexts und des generativen Modells.

Was ist RAG?

RAG (Retrieval-Augmented Generation) ist ein architektonisches Muster, das ein Large Language Model (LLM) mit dynamischer Suche in Unternehmensdokumenten und -daten kombiniert. Anstatt dass das Modell nur aus dem antwortet, was es während des Trainings gelernt hat (was zu „Halluzinationen” und veralteten Informationen führt), sucht RAG zunächst relevante Passagen in internen Dokumenten und sendet diese dann als Kontext an das Modell zur Generierung der Antwort.

Technische Architektur von RAG:

  1. Indizierung — Dokumente werden in kleinere Chunks aufgeteilt (typischerweise 200–500 Wörter)
  2. Vektorisierung (Embeddings) — jeder Chunk wird in einen numerischen Vektor umgewandelt
  3. Speicherung — Vektoren werden in einer Vektordatenbank gespeichert (Pinecone, Qdrant, pgvector)
  4. Abfrage — die Nutzerfrage wird ebenfalls in einen Vektor umgewandelt
  5. Retrieval — die Top-K ähnlichsten Chunks werden gefunden
  6. Generation — das LLM generiert eine Antwort mit dem Kontext aus den gefundenen Chunks

Im deutschen B2B-Kontext löst RAG Probleme wie „Wo haben wir die Richtlinie zu Reisekostenerstattungen?” oder „Welche Preise haben wir dem Unternehmen XYZ in den letzten 3 Jahren berechnet?” — die Antwort entsteht direkt aus Unternehmensdokumenten, mit Quellenangabe.

Wann wird es eingesetzt

RAG ist eine Schlüsseltechnologie für:

  • Unternehmens-Chatbots, die aus internen Dokumenten antworten
  • Semantische Suche in Verträgen, Richtlinien, Wiki
  • Automatisierung des Supports — erste Linie antwortet auf Basis der Wissensdatenbank
  • Analyse großer Archive (DSGVO Right-to-Erasure-Audit)

Siehe Modul Dateien, Modul Verträge und KI-Seite.

Verwandte Begriffe

  • AI Agent — ein Agent nutzt RAG oft als eines seiner Werkzeuge. Siehe /de/glossar/ai-agent.
  • MCP — Protokoll zur Verbindung eines RAG-Systems mit einem Agenten. Siehe /de/glossar/mcp.
  • OCR — gescannte Dokumente müssen vor der RAG-Indizierung OCR-verarbeitet werden. Siehe /de/glossar/ocr.

In Modulario

Modulario nutzt RAG über Dokumente im Modul Dateien und Verträge — wer eine Antwort benötigt, stellt eine Frage in natürlicher Sprache und das System antwortet mit Verweisen auf konkrete Dokumente. Die Indizierung erfolgt automatisch nach dem Hochladen einer Datei.

Die interne RAG-Infrastruktur von Modulario garantiert, dass Kundendaten nie für das Training von Modellen verwendet werden und die EU-Infrastruktur nicht verlassen. Der Kunde sieht, aus welchen Dokumenten die KI Informationen bezogen hat, und kann die Quellen über RBAC oder ReBAC einschränken.

Implementieren Sie RAG in Ihrem Unternehmen?

Modulario deckt die meisten B2B-Prozesse modular ab — setzen Sie nur das ein, was Sie jetzt brauchen, und wachsen Sie schrittweise. Buchen Sie eine kostenlose Beratung.

Dávid Bělousov

Dávid Bělousov

Sales Director

+421 902 826 802 sales@amcef.com
Beratung buchen