OCR branje

Sistem za prepoznavanje dokumentov oz. OCR program pretvori informacije iz slike v besedilo, ki ga nato lahko prebere bralnik besedila.
Seveda nobeno OCR orodje ni popolno, zato je treba besedilo po pretvorbi pregledati in določene napake ročno popraviti. Vseeno pa je uporaba OCR orodja veliko hitrejša kot ročno prepisovanje celotnega besedila.
OCR bralnik oz. sistem za prepoznavanje računov je vgrajen tudi v PANTHEON. Je samo-učeča se programska oprema, ki uporablja zapletene algoritme umetne inteligence za učenje in vedno boljše prepoznavanje podatkov.
Sistem za OCR branje v PANTHEON-u lahko prebere številne različne podatke, večinoma vse standardne oz. obvezne vsebine na računu, npr. davčno številko pošiljatelja, naziv pošiljatelja, neto znesek, datum valute itd.
To lahko vidimo na spodnjem primeru prejetega računa. Nabor podatkov, ki jih sistem prepozna, je odvisen tudi od kakovosti PDF oblike računa.

Pretvorba dokumentov se obračunava po paketih obdelanih računov, ne glede na to, koliko strani ima posamezen račun. Ko porabite račune v paketu, enostavno naročite novega.
Uporabniki standardne storitve lahko v PANTHEON-u izbirate med dvema možnostma:
- detajlno branje pozicij dokumentov – prebere vsako posamezno pozicijo dokumenta.
- sumarno branje pozicij dokumentov – prebere zneske, združene po davčnih stopnjah.

|
OPOZORILO
Za čim boljše prepoznavanje priporočamo uporabo barvnega skenerja z ločljivostjo 300 DPI in skeniranje naravnost, tako da lahko bralnik stran prebere od zgoraj navzdol. Najnižja sprejemljiva kakovost je 150 DPI, vendar so rezultati pri tej ločljivosti običajno do 15 % slabši. Kakršnokoli dodatno procesiranje s programi za skeniranje ni priporočljivo.
|