Vytěžování faktur: Srovnání AI vs OCR (a proč staré OCR pomalu umírá)
Klasické OCR umí přečíst text, ale nerozumí faktuře. Moderní AI s LLM chápe kontext, dohledá si údaje a integruje se s ERP. Detailní srovnání pro české účetní a CFO.
D
David Strejc
Apertia.ai
Sdílet:
Česká účetní agenda žije v zajímavé době. Část firem stále přepisuje faktury ručně, část používá OCR systémy z roku 2015 a třetí část už nasazuje AI agenty, kteří faktuře skutečně rozumí. Rozdíl mezi těmito třemi přístupy je dramatický — a má přímý dopad na náklady, chyby a rychlost uzávěrky.
V tomto článku rozebereme, jak se klasické OCR liší od moderního AI vytěžování, kde se peníze ztrácí, kdy se vyplatí přejít a jak vypadá realistická implementace v české firmě napojené na Pohodu, Money S5, Helios nebo ABRA.
Technologie z 90. let. Naskenuje obrázek, převede ho na text. Tečka. Nerozumí, co text znamená. Pokud chcete z faktury vytěžit dodavatele, IČO, datum splatnosti a celkovou částku, musíte na výstup OCR navázat pravidla — typicky regex výrazy, šablony nebo trénované zóny. To funguje, dokud dostáváte faktury od stejných dodavatelů ve stejném layoutu. Jakmile přijde nová faktura nebo dodavatel změní formát, systém spadne.
Moderní přístup. AIagent dostane fakturu (PDF, sken, e-mail) a sám identifikuje strukturu — najde dodavatele, čísla, položky, DPH. Nepotřebuje šablony. Když přijde úplně nový layout, který ještě nikdy neviděl, stejně to odbaví. A navíc rozumí kontextu — pozná rozdíl mezi „částka k úhradě“ a „částka před DPH“, i když jsou popsané různě.
2. Kde klasické OCR selhává — 5 reálných problémů
Problém 1: Šablonová slepota
Klasické OCR funguje na bázi šablon nebo trénovaných zón. „Dodavatel je v levém horním rohu, IČO 3 cm pod ním.“ Funguje skvěle, dokud nepřijde dodavatel, který má dodavatelské údaje v patičce. Pak se musí udělat nová šablona. U české firmy s 200+ dodavateli to je pravidelná údržba, která stojí 15–40 hodin měsíčně.
Problém 2: Ruční obrázky a fotky z mobilu
Když řidič vyfotí účtenku z benzinky pod úhlem, klasické OCR se ztratí. Fotka je pootočená, světlo na pozadí, písmo nezarovnané. Moderní AI s vision modely (GPT-4o vision, Claude vision) si s tím poradí — pochopí, že vidí účtenku, dohledá údaje a vyplní strukturovaný výstup.
Problém 3: Ne-strukturované dokumenty
Faktury z drobných dodavatelů, vyúčtování od taxíků, dohody o provedení práce, příjmové doklady — tyto dokumenty nemají standardní formát. OCR si neporadí. AI ano.
Problém 4: Chyby v rozpoznávání čísel
Klasické OCR si plete 0/O, 1/l/I, 5/S. Z faktury 5 380 Kč udělá 53 SO Kč. Při 1 000 fakturách měsíčně to znamená 30–80 chyb, které někdo musí najít a opravit. AI vytěžování má kontextovou kontrolu — pokud položka říká 53 SO, ví, že to nedává smysl, a opraví se.
Problém 5: Žádné porozumění
OCR vám vrátí surová data. Nepozná, že dvě faktury od stejného dodavatele ze stejného dne s podobnou částkou jsou s velkou pravděpodobností duplikáty. Nepozná, že dodavatel poslal fakturu s chybným IČO. Nepozná, že platba má být v EUR, ne CZK. AIagent tyto věci vidí a flaguje je.
3. Konkrétní srovnání — měřená data z reálného nasazení
V Apertii jsme v roce 2025 nasazovali AI vytěžování u středně velké české distribuční firmy. Měli předtím klasické OCR řešení od roku 2017. Měřili jsme dva měsíce paralelně.
Metrika
Klasické OCR
AI vytěžování
Přesnost rozpoznání hlavičky
91 %
98,5 %
Přesnost rozpoznání položek
74 %
96 %
Schopnost odbavit nový layout
0 %
92 %
Čas na ruční doplnění/opravu
4,2 min/fakturu
0,6 min/fakturu
Měsíční čas účetní (1200 faktur)
84 hodin
12 hodin
Ušetřené FTE
—
0,5 FTE
Při hrubé mzdě účetní 45 000 Kč to znamená roční úsporu cca 270 000 Kč jen na mzdových nákladech, plus rychlejší uzávěrka a menší riziko penále z prodlení.
Faktura přijde e-mailem, do datové schránky, sdílené složky nebo se nahraje přes web. Agent všechny zdroje sleduje a shromažďuje na jedno místo.
Krok 2: Klasifikace
AI nejdřív rozhodne — je to faktura přijatá, dobropis, objednávka, paragon, dodací list? Pak aplikuje správnou logiku.
Chcete AI řešení na míru?
Pomoháme firmám automatizovat procesy pomocí AI. Napište nám a zjistěte, jak můžeme pomoci právě vám.
Odpověď do 24 hodin
Nezávazná konzultace
Řešení na míru vaší firmě
Krok 3: Extrakce strukturovaných dat
Agent identifikuje dodavatele (IČO, DIČ, název, banka), datum vystavení, datum splatnosti, variabilní symbol, jednotlivé položky, sazby DPH, celkovou částku. Vše ve strukturovaném formátu (JSON, XML).
Krok 4: Validace a obohacení
Ověří IČO v ARES, zkontroluje, jestli je dodavatel v registru plátců DPH, dohledá historii faktur od stejného dodavatele a porovná. Pokud je něco neobvyklého (jiný bankovní účet než minule), flaguje k ruční kontrole.
Strukturovaná data jdou přímo do účetního systému — Pohoda, Money S5, Helios, ABRA, SAP. Účetní jen schvaluje, neopisuje.
5. Integrace s českým účetnictvím
Tahle část rozhoduje o úspěchu projektu. Co měřit u dodavatele:
Pohoda: Přímá XML komunikace přes mServer nebo SQL napojení. Standard.
Money S5: REST API pro Money S5, případně import přes ISDOC.
Helios: REST API + iNuvio platforma, ISDOC podpora.
ABRA: REST API, ABRA Flexi má vlastní endpointy. Nejjednodušší integrace.
SAP: Standardní BAPI / OData. Nejnáročnější, ale nejstabilnější.
Ideálně faktura jde z e-mailu rovnou do návrhového účtování v ERP, kde ji účetní jen schválí. Bez přepisování. Tady spočívá těch 80 % úspory času.
6. Cena AI vytěžování pro českou firmu
Realistické rozpočty z roku 2026:
Malá firma (do 200 faktur/měsíc): Implementace 180 000 – 320 000 Kč, provoz 4 000 – 8 000 Kč/měsíc
Středně velká firma (200–2 000 faktur/měsíc): Implementace 320 000 – 600 000 Kč, provoz 8 000 – 25 000 Kč/měsíc
Velká firma / sdílené centrum (2 000–20 000 faktur/měsíc): Implementace 600 000 – 1 200 000 Kč, provoz 25 000 – 80 000 Kč/měsíc
Návratnost u středně velké firmy typicky 6–10 měsíců. U velké firmy s SSC pod 6 měsíců.
7. Compliance: GDPR, AI Act, archivace
Při zpracování faktur řešíte i regulaci:
Faktury obsahují osobní údaje (jména, kontakty u OSVČ) — DPIA je povinná, pokud zpracováváte větší objem
Smlouva se zpracovatelem (DPA) s dodavatelem AI
Archivace 10 let podle zákona o účetnictví — AI systém musí umět dokumenty archivovat ve formátu, který je auditovatelný
EU AI Act — vytěžování faktur typicky není „high-risk“ systém, ale musí být zdokumentovaný a auditovatelný
8. Kdy NEpřecházet z OCR na AI
Buďme upřímní — ne vždy se přechod vyplatí:
Pokud máte pod 50 faktur měsíčně, ROI nevyjde
Pokud existující OCR funguje dobře a máte stabilních 20 dodavatelů s neměnnými šablonami
Pokud nemáte rozpočet na implementaci a chcete řešení za pár tisíc měsíčně — pak SaaS nástroj typu Rossum nebo iDokladovna stačí
Ale pokud zpracováváte 200+ faktur měsíčně a měníte se vám dodavatelé, AI vytěžování se vrátí jistě.
Závěr: OCR umírá, AI rozumí
Klasické OCR bylo dobré řešení v roce 2010. Dnes je to technologický dluh. Moderní AI vytěžování je o řád přesnější, levnější v provozu (nemusíte platit šablonáře) a integruje se hladce s českým účetnictvím. Pokud řešíte více než 200 faktur měsíčně, otázka už není „jestli přejít na AI“, ale „kdy a s kým“.
V Apertii nasazujeme AI vytěžování faktur a dalších dokumentů na míru českým firmám. Pokud zvažujete přechod, ozvěte se nám — uděláme audit vašeho současného řešení a navrhneme realistický plán. Kontaktujte nás přes formulář.
Pokud řešíte vytěžování dokumentů specificky pro autosalony a servisy (servisní zakázky, garanční listy, faktury od ND dodavatelů), podívejte se na sesterský projekt AutoERP, který má pro tuto doménu specializované AI agenty. Pro správu firemních znalostí a dokumentů obecně se hodí AI knihovník.
Často kladené otázky (FAQ)
Jaká je reálná přesnost AI vytěžování faktur?
Pro standardní faktury v češtině 96–99 % na hlavičce a 92–97 % na položkách. U ručně psaných nebo nekvalitně naskenovaných dokumentů 85–92 %. Vždy doporučujeme schvalovací krok účetní u faktur nad určitou částku (typicky 50 000 Kč).
Jak rychle se dá AI vytěžování nasadit?
Pilotní provoz pro jednoho dodavatele do 4 týdnů. Plné nasazení pro 50+ dodavatelů s integrací do ERP typicky 8–14 týdnů včetně testování a školení účetních. Klíčové je nepospíchat s vypnutím staré OCR cesty — paralelně 2–4 týdny minimum.
Pokud má ERP API nebo SQL přístup, ano. Pro Pohodu, Money, Helios, ABRA, SAP a iNuvio máme hotové konektory. Pro proprietární nebo legacy systémy řešíme individuálně — typicky přes generování ISDOC, e-mailové návrhy účtování nebo CSV import. Žádný systém se nedá označit za „nemožný“ — jen některé jsou dražší na napojení.