RAG
Retrieval-Augmented Generation
Technika rozszerzająca LLM o dynamiczne wyszukiwanie w dokumentach firmowych — odpowiedź powstaje z połączenia znalezionego kontekstu i modelu generatywnego.
Czym jest RAG?
RAG (Retrieval-Augmented Generation) to wzorzec architektoniczny, który łączy duży model językowy (LLM) z dynamicznym wyszukiwaniem w dokumentach i danych firmowych. Zamiast odpowiadać tylko na podstawie tego, czego nauczył się podczas treningu (co prowadzi do „halucynacji” i nieaktualnych informacji), RAG najpierw wyszukuje odpowiednie fragmenty w dokumentach wewnętrznych, a dopiero potem wysyła je do modelu jako kontekst do generowania odpowiedzi.
Architektura techniczna RAG:
- Indeksowanie — dokumenty dzielone są na mniejsze fragmenty (typowo 200–500 słów)
- Wektoryzacja (embeddings) — każdy fragment przekształcany jest w wektor numeryczny
- Przechowywanie — wektory zapisywane są w bazie wektorowej (Pinecone, Qdrant, pgvector)
- Zapytanie — pytanie użytkownika też przekształcane jest w wektor
- Wyszukiwanie — znalezione top-K najbardziej podobnych fragmentów
- Generowanie — LLM generuje odpowiedź z kontekstem ze znalezionych fragmentów
W polskim kontekście B2B RAG rozwiązuje problem typu „gdzie mamy tę procedurę rozliczania delegacji?” lub „jakie ceny naliczaliśmy firmie XYZ przez ostatnie 3 lata?” — odpowiedź pochodzi bezpośrednio z dokumentów firmowych, z podaniem źródła.
Kiedy ma zastosowanie
RAG to kluczowa technologia dla:
- Firmowych chatbotów odpowiadających z dokumentów wewnętrznych
- Semantycznego wyszukiwania w umowach, procedurach, wiki
- Automatyzacji wsparcia — pierwsza linia odpowiada na podstawie bazy wiedzy
- Analizy dużych archiwów (audyt RODO dotyczący prawa do bycia zapomnianym)
Zob. moduł Pliki, moduł Umowy i stronę AI.
Powiązane pojęcia
- AI Agent — agent często używa RAG jako jednego z narzędzi. Zob. /pl/slownik/ai-agent.
- MCP — protokół do łączenia systemu RAG z agentem. Zob. /pl/slownik/mcp.
- OCR — zeskanowane dokumenty przed indeksowaniem RAG muszą zostać przetworzone przez OCR. Zob. /pl/slownik/ocr.
W Modulario
Modulario używa RAG nad dokumentami w module Pliki i Umowy — kto potrzebuje odpowiedzi, zadaje pytanie w języku naturalnym, a system odpowiada z odnośnikami do konkretnych dokumentów. Indeksowanie odbywa się automatycznie po wgraniu pliku.
Wewnętrzna infrastruktura RAG Modulario gwarantuje, że dane klienta nigdy nie są używane do trenowania modeli ani nie opuszczają infrastruktury UE. Klient widzi, z jakich dokumentów AI czerpała informacje, i może ograniczyć źródła przez RBAC lub ReBAC.
Powiązane pojęcia
AI Agent
System oprogramowania oparty na LLM, który autonomicznie rozwiązuje zadania — planuje kroki, korzysta z narzędzi i wywołuje API, aby osiągnąć cel.
MCP
Otwarty protokół od Anthropic do standaryzowanego łączenia asystentów AI z zewnętrznymi narzędziami, danymi i usługami.
OCR
Technologia rozpoznawania tekstu z obrazów lub zeskanowanych dokumentów — konwertuje dane pikselowe na tekst możliwy do dalszego przetwarzania.
Workflow automation
Technologia łącząca poszczególne zadania i aplikacje w zautomatyzowane procesy — bez udziału człowieka przy rutynowych krokach.
API
Interfejs, przez który komunikują się różne systemy oprogramowania — w B2B SaaS typowo REST API lub GraphQL przez HTTPS.
Powiązane moduły Modulario
Wdrażasz RAG w swojej firmie?
Modulario pokrywa większość procesów B2B modułowo — wdróż tylko to, czego teraz potrzebujesz, i rozwijaj się stopniowo. Umów bezpłatną konsultację.
Umów konsultację