OCR Software

Tijdens je zoektocht naar de wereld van het scannen van documenten kom je waarschijnlijk de term “OCR” tegen. U weet misschien zelfs dat dit staat voor Optical Character Recognition. Maar wat is OCR eigenlijk, en wat moet u weten om optimaal gebruik te maken van OCR software?

Wat is OCR?

Het primaire doel van Optical Character Recognition is het snel en automatisch converteren van gescande afbeeldingen, zoals een factuur, van door machines geprinte (getypte) tekst – die naar een computer niet zinvoller zijn dan een verzameling pixels dan elke andere afbeelding, zoals een landschapsfoto – in daadwerkelijke tekst gegevens die u kunt doorzoeken en wijzigen.

De exacte mechanica van dit proces is gecompliceerd, maar het volstaat om te zeggen dat een OCR-engine naar pixeldata kijkt en naar patronen zoekt die lijken op letters, cijfers en andere symbolen en een gedigitaliseerd record van deze symbolen maakt.

Er zijn twee belangrijke typen optische tekenherkenning:

papieren facturen

Volledige pagina OCR

Converteert de hele pagina naar een van de onderstaande indelingen:

  • Platte tekst – alleen standaardtekstinformatie op de pagina wordt achtereenvolgens bewaard.
  • Opgemaakte tekst – Tekstinformatie wordt bewaard in opeenvolgende paragrafen, waardoor lettergrootte en stijl worden opgeslagen. Dit kan ook tabellen in tabelvorm behouden, zoals spreadsheets.
  • Exacte kopie – Alle informatie op de pagina blijft behouden, inclusief afbeeldingen, en wordt zodanig op de pagina geplaatst dat het originele document het dichtst wordt gerecreëerd.
  • Doorzoekbaar bestand – Tekstinformatie wordt bewaard op een verborgen laag achter de gescande afbeelding zodat het bestand kan worden doorzocht terwijl het uiterlijk van het origineel behouden blijft.

Zone OCR

Herkent tekenreeksen die zich op bepaalde delen van de pagina bevinden. Dit is meestal met het oog op indexering en documentbeheer.

De informatie kan worden gebruikt om een ​​bestand een naam te geven, het op te slaan op een bepaalde locatie of bepaalde gegevens te archiveren in een georganiseerde indeling, zoals een database.

OCR Software

OCR-software is er in veel verschillende soorten, die variëren in prijsklasse op basis van hun functies, snelheid en nauwkeurigheid. Je kunt bijvoorbeeld een freeware krijgen zoals SimpleOCR die je in een mum van tijd van dienst zal zijn, maar het zal alleen in staat zijn om BMP-, JPG- en TIF-afbeeldingen van Engelse of Franse tekst om te zetten in platte tekstdocumenten van TXT- of DOC-formaat, één pagina tegelijkertijd.

Aan de andere kant kunt u een paar honderd euro investeren in een Batch-OCR of zelfs Server OCR-software die bepaalde mappen voor binnenkomende documenten in verschillende beeldformaten en talen kan bekijken en vervolgens automatisch exacte kopieën van alle pagina’s daarin in een formaat naar keuze.

U kunt ook Desktop OCR-software vinden, die de prijskloof zal overbruggen en veel van de functies van de Corporate-edities zal omvatten, maar nog steeds enige gebruikersinvoer nodig heeft tijdens de conversie.

Een toonaangevende leverancier van OCR software is Kofax.

Accuraatheid van OCR Software

Hoewel sommige OCR-engines beter zijn dan andere, kan geen enkele software 100% nauwkeurigheid garanderen. Dit komt omdat er andere factoren spelen, waaronder de scankwaliteit. Herkenningssoftware zal zijn werk niet kunnen doen als de scanner de pagina niet goed digitaliseert.

Het wordt aanbevolen om te scannen met een resolutie van 300 dpi voor de beste resultaten. Zwart en wit (Bitonal) hebben de voorkeur boven de greyscale- of kleurmodus, en hoewel de meeste moderne scanners vrij goed uit de doos zijn geconfigureerd, kunt u uw helderheid- en contrastinstellingen voor uw specifieke documenten aanpassen.

OCR-software is ook beperkt in wat het kan herkennen. De meeste OCR-software is alleen bedoeld om door machines gedrukte tekst te herkennen, in tegenstelling tot handschriften. Hoewel er ICR-software is die handgeschreven informatie kan herkennen, zijn deze meestal oplossingen op ondernemingsniveau voor formulierenverwerkingswerkzaamheden, in plaats van volledige paginaherkenning.

Op dezelfde manier zijn de meeste OCR-software alleen in staat om traditionele machine-lettertypen te converteren, geen cursieve scripts of kalligrafie. Er zijn veel lettertypen beschikbaar en OCR-engines zijn afhankelijk van veelgebruikte, gescheiden lettervormen om de tekst te herkennen, dus lettertypen die ongewoon zijn of samenvloeien, worden niet herkend.

Verschillen in OCR Software

De belangrijkste kenmerken die OCR-software onderscheiden zijn:

  • Karakterherkenning nauwkeurigheid
  • Correctie nauwkeurigheid pagina-indeling
  • Ondersteuning voor talen
  • Gebruikersinterfaceontwerp
  • Output bestandsformaten (Word, Excel, PDF, eBook, etc.)
  • OCR-snelheid en ondersteuning voor multi-core CPU’s
  • Batch-verwerkingsmodi
  • Geavanceerde PDF-codering of compressie
  • Speciale functies voor nicheprojecten

Vanwege de oneindige combinaties van documenttypen, OCR-engines, projectvereisten en speciale functies, kan het mogelijk zijn dat één engine beter presteert met uw specifieke documenten dan met een andere.

Waarom ICreative

ICreative helpt ondernemingen, instellingen en overheden om meer controle op bedrijfsuitgaven te krijgen en het purchase-to-pay proces minder complex, en daarmee kostenefficiënter, te maken. Onze propositie:

Technologie Partner

Wij hebben veel ondernemingen geholpen met implementatie van Basware en Kofax technologie en hen aangesloten op het grootste open transactie netwerk ter wereld.

Kennis Partner

ICreative heeft in de afgelopen 15 jaar veel kennis opgedaan over purchase-to-pay en e-facturatie. Kennis die wij graag delen middels onze Academy.

Excellence Partner

Wij bieden additionele diensen aan om toe te werken naar operational (P2P) excellence, waaronder geautomatiseerde kwaliteitscontrole van inkomende facturen.

Wij staan voor u klaar!

ICreative levert als Basware en Kofax partner, e-facturatie en purchase to pay oplossingen aan omvangrijke ondernemingen, instellingen en overheden. Onze oplossingen resulteren in meer controle op bedrijfsuitgaven en minder complexiteit van het inkoop tot betalingsproces.

We houden u graag op de hoogte omtrent e-facturatie en purchase-to-pay automatisering. Wilt u liever van gedachten wisselen omtrent deze onderwerpen, neem gerust contact met ons op. We staan u graag te woord.

Wij staan voor u klaar!

Vragen over purchase-to-pay of e-facturatie? Neem gerust contact met ons op. Wij staan u graag te woord.

Alleen aanmelden voor de nieuwsbrief kan natuurlijk ook!