RAG
Retrieval-Augmented Generation
Technika, která LLM rozšiřuje o dynamické vyhledávání ve firemních dokumentech — odpověď vzniká kombinací nalezeného kontextu a generativního modelu.
Co je RAG?
RAG (Retrieval-Augmented Generation) je architektonický vzor, který kombinuje velký jazykový model (LLM) s dynamickým vyhledáváním ve firemních dokumentech a datech. Namísto aby model odpovídal jen z toho, co se naučil při tréninku (což vede k „halucinacím” a neaktuálním informacím), RAG nejprve najde relevantní pasáže v interních dokumentech a teprve potom je pošle modelu jako kontext pro generování odpovědi.
Technická architektura RAG:
- Indexace — dokumenty se rozdělí na menší chunky (typicky 200–500 slov)
- Vektorizace (embeddings) — každý chunk se převede na numerický vektor
- Uložení — vektory se uloží do vektorové databáze (Pinecone, Qdrant, pgvector)
- Query — uživatelská otázka se také převede na vektor
- Retrieval — najdou se top-K nejpodobnější chunky
- Generation — LLM vygeneruje odpověď s kontextem z nalezených chunků
V českém B2B kontextu RAG řeší bolest typu „kde máme tu směrnici o cestovních náhradách?” nebo „jaké ceny jsme účtovali firmě XYZ za poslední 3 roky?” — odpověď vzniká přímo z firemních dokumentů, s citací zdroje.
Kdy se používá
RAG je klíčová technologie pro:
- Firemní chatboty odpovídající z interních dokumentů
- Sémantické vyhledávání ve smlouvách, směrnicích, wiki
- Automatizaci podpory — první linie odpovídá na základě knowledge base
- Analýzu velkých archivů (right-to-erasure GDPR audit)
Viz modul Soubory, modul Smlouvy a stránku AI.
Související pojmy
- AI Agent — agent často používá RAG jako jeden z nástrojů. Viz /cs/slovnik/ai-agent.
- MCP — protokol pro připojení RAG systému k agentovi. Viz /cs/slovnik/mcp.
- OCR — naskenované dokumenty se před RAG indexací musí OCR-ovat. Viz /cs/slovnik/ocr.
V Modulario
Modulario používá RAG nad dokumenty v modulu Soubory a Smlouvy — kdo potřebuje odpověď, položí otázku v přirozeném jazyce a systém odpoví s odkazy na konkrétní dokumenty. Indexace probíhá automaticky po nahrání souboru.
Interní RAG infrastruktura Modulario zaručuje, že data zákazníka se nikdy nepoužívají k trénování modelů ani neopouštějí EU infrastrukturu. Zákazník vidí, z kterých dokumentů AI čerpala informace, a může omezit zdroje přes RBAC nebo ReBAC.
Související pojmy
AI Agent
Softwarový systém postavený na LLM, který autonomně řeší úlohy — plánuje kroky, používá nástroje a volá API k dosažení cíle.
MCP
Otevřený protokol od Anthropicu pro standardizované připojování AI asistentů k externím nástrojům, datům a službám.
OCR
Technologie rozpoznávání textu z obrázků nebo naskenovaných dokumentů — převádí pixelová data na textová s možností dalšího zpracování.
Workflow automation
Technologie, která řetězí jednotlivé úlohy a aplikace do automatizovaných procesů — bez lidského zásahu při rutinních krocích.
API
Rozhraní, přes které spolu komunikují různé softwarové systémy — v B2B SaaS typicky REST API nebo GraphQL nad HTTPS.
Související moduly Modulario
Implementujete RAG ve své firmě?
Modulario pokrývá většinu B2B procesů modulárně — nasaďte jen to, co teď potřebujete, a postupně rozrůstejte. Domluvte si bezplatnou konzultaci.
Domluvit konzultaci