📖 Słownik · AI i automatyzacja

RAG

Retrieval-Augmented Generation

Technika rozszerzająca LLM o dynamiczne wyszukiwanie w dokumentach firmowych — odpowiedź powstaje z połączenia znalezionego kontekstu i modelu generatywnego.

Czym jest RAG?

RAG (Retrieval-Augmented Generation) to wzorzec architektoniczny, który łączy duży model językowy (LLM) z dynamicznym wyszukiwaniem w dokumentach i danych firmowych. Zamiast odpowiadać tylko na podstawie tego, czego nauczył się podczas treningu (co prowadzi do „halucynacji” i nieaktualnych informacji), RAG najpierw wyszukuje odpowiednie fragmenty w dokumentach wewnętrznych, a dopiero potem wysyła je do modelu jako kontekst do generowania odpowiedzi.

Architektura techniczna RAG:

Indeksowanie — dokumenty dzielone są na mniejsze fragmenty (typowo 200–500 słów)
Wektoryzacja (embeddings) — każdy fragment przekształcany jest w wektor numeryczny
Przechowywanie — wektory zapisywane są w bazie wektorowej (Pinecone, Qdrant, pgvector)
Zapytanie — pytanie użytkownika też przekształcane jest w wektor
Wyszukiwanie — znalezione top-K najbardziej podobnych fragmentów
Generowanie — LLM generuje odpowiedź z kontekstem ze znalezionych fragmentów

W polskim kontekście B2B RAG rozwiązuje problem typu „gdzie mamy tę procedurę rozliczania delegacji?” lub „jakie ceny naliczaliśmy firmie XYZ przez ostatnie 3 lata?” — odpowiedź pochodzi bezpośrednio z dokumentów firmowych, z podaniem źródła.

Kiedy ma zastosowanie

RAG to kluczowa technologia dla:

Firmowych chatbotów odpowiadających z dokumentów wewnętrznych
Semantycznego wyszukiwania w umowach, procedurach, wiki
Automatyzacji wsparcia — pierwsza linia odpowiada na podstawie bazy wiedzy
Analizy dużych archiwów (audyt RODO dotyczący prawa do bycia zapomnianym)

Zob. moduł Pliki, moduł Umowy i stronę AI.

Powiązane pojęcia

AI Agent — agent często używa RAG jako jednego z narzędzi. Zob. /pl/slownik/ai-agent.
MCP — protokół do łączenia systemu RAG z agentem. Zob. /pl/slownik/mcp.
OCR — zeskanowane dokumenty przed indeksowaniem RAG muszą zostać przetworzone przez OCR. Zob. /pl/slownik/ocr.

W Modulario

Modulario używa RAG nad dokumentami w module Pliki i Umowy — kto potrzebuje odpowiedzi, zadaje pytanie w języku naturalnym, a system odpowiada z odnośnikami do konkretnych dokumentów. Indeksowanie odbywa się automatycznie po wgraniu pliku.

Wewnętrzna infrastruktura RAG Modulario gwarantuje, że dane klienta nigdy nie są używane do trenowania modeli ani nie opuszczają infrastruktury UE. Klient widzi, z jakich dokumentów AI czerpała informacje, i może ograniczyć źródła przez RBAC lub ReBAC.

Powiązane pojęcia

AI Agent

System oprogramowania oparty na LLM, który autonomicznie rozwiązuje zadania — planuje kroki, korzysta z narzędzi i wywołuje API, aby osiągnąć cel.

MCP

Otwarty protokół od Anthropic do standaryzowanego łączenia asystentów AI z zewnętrznymi narzędziami, danymi i usługami.

OCR

Technologia rozpoznawania tekstu z obrazów lub zeskanowanych dokumentów — konwertuje dane pikselowe na tekst możliwy do dalszego przetwarzania.

Workflow automation

Technologia łącząca poszczególne zadania i aplikacje w zautomatyzowane procesy — bez udziału człowieka przy rutynowych krokach.

API

Interfejs, przez który komunikują się różne systemy oprogramowania — w B2B SaaS typowo REST API lub GraphQL przez HTTPS.

Powiązane moduły Modulario

vytazovanie-dokladov subory zmluvy

Wdrażasz RAG w swojej firmie?

Modulario pokrywa większość procesów B2B modułowo — wdróż tylko to, czego teraz potrzebujesz, i rozwijaj się stopniowo. Umów bezpłatną konsultację.

Dávid Bělousov

Sales Director

+421 902 826 802 sales@amcef.com

Umów konsultację

Powrót do słownika