OCR
Optical Character Recognition
Technologia rozpoznawania tekstu z obrazów lub zeskanowanych dokumentów — konwertuje dane pikselowe na tekst możliwy do dalszego przetwarzania.
Czym jest OCR?
OCR (Optical Character Recognition) to technologia automatycznego rozpoznawania tekstu z obrazów — zeskanowanych dokumentów, zdjęć, plików PDF (bez maszynowo czytelnej warstwy tekstowej). OCR analizuje piksele, identyfikuje poszczególne znaki i składa z nich tekst, który można dalej przetwarzać, przeszukiwać, kopiować lub przesyłać do innych systemów.
Rozróżniamy:
- Klasyczne OCR — rozpoznawanie znaków (Tesseract, ABBYY)
- IDP (Intelligent Document Processing) — OCR + rozumienie układu przez AI, rozumie też strukturę dokumentu (tabele, nagłówki, stopki)
- ICR (Intelligent Character Recognition) — rozpoznawanie ręcznie pisanego tekstu
Nowoczesne OCR oparte na deep learningu osiąga dokładność 98–99% dla drukowanego tekstu w dobrej jakości. Problemy: przekrzywione skany, plamy, nieczytelne pieczątki, tabele bez wyraźnych linii — tu pomaga kombinacja AI/RAG.
W polskiej firmie B2B OCR najbardziej pomaga przy:
- Przychodzących fakturach w PDF — ekstrakcja NIP, kwoty, VAT, terminu płatności
- Umowach — pełnotekstowe wyszukiwanie w archiwum
- Wnioskach delegacyjnych — odczyt paragonów
Kiedy ma zastosowanie
OCR jest wejściem do praktycznie każdej automatyzacji dokumentów AI. Bez OCR model AI nie mógłby przetworzyć faktury PDF ani zeskanowanej umowy.
Zob. moduł Wyciąganie dokumentów i moduł Pliki.
Powiązane pojęcia
- Wyciąganie dokumentów — end-to-end proces OCR + ekstrakcja AI. Zob. /pl/slownik/vytazovanie-dokladov-pojem.
- e-Invoice — alternatywa, gdzie OCR nie jest potrzebne. Zob. /pl/slownik/e-invoice.
- RAG — po OCR dokumenty są typowo indeksowane do RAG. Zob. /pl/slownik/rag.
W Modulario
Moduł Wyciąganie dokumentów w Modulario łączy OCR z ekstrakcją AI — faktura PDF przychodzi e-mailem, system przeprowadza OCR, model AI ekstrahuje wszystkie istotne pola i automatycznie tworzy zapis przyjętej faktury w Księgowości.
Modulario używa architektury warstwowej: dla maszynowo czytelnych PDF tekst jest ekstrahowany bezpośrednio, dla zeskanowanych lub PDF z warstwami uruchamiany jest silnik OCR przeszkolony na polskich i czeskich znakach z polskimi literami. Dokładność ekstrakcji typowych pól faktury (NIP, kwota, data) wynosi w Modulario ok. 98%, niejednoznaczne przypadki system oznacza do ręcznej weryfikacji.
Powiązane pojęcia
Wyciąganie dokumentów
Automatyczne odczytywanie faktur, zamówień, listów przewozowych i innych dokumentów za pomocą OCR i AI — ekstrakcja danych bez ręcznego przepisywania.
RAG
Technika rozszerzająca LLM o dynamiczne wyszukiwanie w dokumentach firmowych — odpowiedź powstaje z połączenia znalezionego kontekstu i modelu generatywnego.
AI Agent
System oprogramowania oparty na LLM, który autonomicznie rozwiązuje zadania — planuje kroki, korzysta z narzędzi i wywołuje API, aby osiągnąć cel.
e-Invoice
Ustrukturyzowana faktura elektroniczna w formacie XML/UBL, która może być automatycznie przetwarzana bez ręcznego przepisywania.
P2P
End-to-end proces od wystawienia zapotrzebowania na zakup, przez zamówienie, dostawę i przyjęcie faktury, aż po zapłatę dostawcy.
Powiązane moduły Modulario
Wdrażasz OCR w swojej firmie?
Modulario pokrywa większość procesów B2B modułowo — wdróż tylko to, czego teraz potrzebujesz, i rozwijaj się stopniowo. Umów bezpłatną konsultację.
Umów konsultację