PURCHASE TO PAY

Wij helpen organisaties met digitale transformatie en procesoptimalisatie van purchase to pay.

TECHNOLOGIE

Wij gebruiken verschillende cloud-oplossingen die passen bij omvangrijker organisaties.

TECHNOLOGIE

Wij werken met verschillende P2P oplossingen die koppelen met toonaangevende ERP systemen.

OCR

Tijdens uw zoektocht naar de wereld van het scannen van documenten, zoals facturen, komt u waarschijnlijk de term “OCR” tegen. U weet misschien zelfs dat dit staat voor Optical Character Recognition. Maar wat is OCR eigenlijk, en wat moet u weten om optimaal gebruik te maken van OCR software?

Het primaire doel van Optical Character Recognition is het snel en automatisch converteren van gescande afbeeldingen van door machines geprinte (getypte) tekst – die naar een computer niet zinvoller zijn dan een verzameling pixels dan elke andere afbeelding, zoals een landschapsfoto – in daadwerkelijke tekst gegevens die u kunt doorzoeken en wijzigen. Dit wordt ook wel eens aangeduid als scan & herken of scan & capture.

De exacte technologie van dit proces is gecompliceerd, maar het volstaat om te zeggen dat een OCR-engine naar pixeldata kijkt en naar patronen zoekt die lijken op letters, cijfers en andere symbolen en een gedigitaliseerd record van deze symbolen maakt.

Scan en herken

Er zijn twee belangrijke typen optische tekenherkenning: volledige pagina OCR en zone OCR.

Volledige pagina OCR

Converteert de hele pagina naar een van de onderstaande indelingen:

  • Platte tekst – alleen standaardtekstinformatie op de pagina wordt achtereenvolgens bewaard.
  • Opgemaakte tekst – Tekstinformatie wordt bewaard in opeenvolgende paragrafen, waardoor lettergrootte en stijl worden opgeslagen. Dit kan ook tabellen in tabelvorm behouden, zoals spreadsheets.
  • Exacte kopie – Alle informatie op de pagina blijft behouden, inclusief afbeeldingen, en wordt zodanig op de pagina geplaatst dat het originele document het dichtst wordt gerecreëerd.
  • Doorzoekbaar bestand – Tekstinformatie wordt bewaard op een verborgen laag achter de gescande afbeelding zodat het bestand kan worden doorzocht terwijl het uiterlijk van het origineel behouden blijft.

Zone OCR

Herkent tekenreeksen die zich op bepaalde delen van de pagina bevinden. Dit is meestal met het oog op indexering en documentbeheer. De informatie kan worden gebruikt om een ​​bestand een naam te geven, het op te slaan op een bepaalde locatie of bepaalde gegevens te archiveren in een georganiseerde indeling, zoals een database.

OCR Software

OCR-software is er in veel verschillende soorten, die variëren in prijsklasse op basis van hun functies, snelheid en nauwkeurigheid. Je kunt bijvoorbeeld een freeware krijgen zoals SimpleOCR die je in een mum van tijd van dienst zal zijn, maar het zal alleen in staat zijn om BMP-, JPG- en TIF-afbeeldingen van Engelse of Franse tekst om te zetten in platte tekstdocumenten van TXT- of DOC-formaat, één pagina tegelijkertijd.

Aan de andere kant kunt u een paar honderd euro investeren in een Batch-OCR of zelfs Server OCR-software die bepaalde mappen voor binnenkomende documenten in verschillende beeldformaten en talen kan bekijken en vervolgens automatisch exacte kopieën van alle pagina’s daarin in een formaat naar keuze.

U kunt ook Desktop OCR-software vinden, die de prijskloof zal overbruggen en veel van de functies van de Corporate-edities zal omvatten, maar nog steeds enige gebruikersinvoer nodig heeft tijdens de conversie. 

Accuraatheid van OCR Software

Hoewel sommige OCR-engines beter zijn dan andere, kan geen enkele software 100% nauwkeurigheid garanderen. Dit komt omdat er andere factoren spelen, waaronder de scankwaliteit. Herkenningssoftware zal zijn werk niet kunnen doen als de scanner de pagina niet goed digitaliseert.

Het wordt aanbevolen om te scannen met een resolutie van 300 dpi voor de beste resultaten. Zwart en wit (Bitonal) hebben de voorkeur boven de greyscale- of kleurmodus, en hoewel de meeste moderne scanners vrij goed uit de doos zijn geconfigureerd, kunt u uw helderheid- en contrastinstellingen voor uw specifieke documenten aanpassen.

OCR-software is ook beperkt in wat het kan herkennen. De meeste OCR-software is alleen bedoeld om door machines gedrukte tekst te herkennen, in tegenstelling tot handschriften. Hoewel er ICR-software is die handgeschreven informatie kan herkennen, zijn deze meestal oplossingen op ondernemingsniveau voor formulierenverwerkingswerkzaamheden, in plaats van volledige paginaherkenning.

Op dezelfde manier zijn de meeste OCR-software alleen in staat om traditionele machine-lettertypen te converteren, geen cursieve scripts of kalligrafie. Er zijn veel lettertypen beschikbaar en OCR-engines zijn afhankelijk van veelgebruikte, gescheiden lettervormen om de tekst te herkennen, dus lettertypen die ongewoon zijn of samenvloeien, worden niet herkend.

Verschillen in OCR Software

De belangrijkste kenmerken die OCR-software onderscheiden zijn:

  • Karakterherkenning nauwkeurigheid
  • Correctie nauwkeurigheid pagina-indeling
  • Ondersteuning voor talen
  • Gebruikersinterfaceontwerp
  • Output bestandsformaten (Word, Excel, PDF, eBook, etc.)
  • OCR-snelheid en ondersteuning voor multi-core CPU’s
  • Batch-verwerkingsmodi
  • Geavanceerde PDF-codering of compressie
  • Speciale functies voor nicheprojecten

Vanwege de oneindige combinaties van documenttypen, OCR-engines, projectvereisten en speciale functies, kan het mogelijk zijn dat één engine beter presteert met uw specifieke documenten dan met een andere.

E-facturatie: het alternatief

Ondanks de voordelen die e-facturatie kent, is het gebruik nog alles behalve gemeengoed. E-facturatie is namelijk niet alleen een interne aangelegenheid, maar hangt af van de medewerking van leveranciers. Bovendien bestaat er niet één e-invoice standaard, maar heel veel verschillende, op XML gebaseerde standaarden, zoals HR-XML, SETU, verschillende UBL standaarden, Finvoice. Zaak dus om de inkomende facturen van leveranciers te converteren naar de gewenste standaard.

Hierin bestaan verschillende oplossingen die variëren in mate van ontzorging. Inkomende papieren facturen, bijvoorbeeld, kunnen zelf gescand worden en vervolgens online worden vertaald naar een gevalideerd data bestand (XML). Die vertaling kunt u zelf doen, door het gescande document te valideren (crediteurengegevens) en te coderen (grootboekrekeningen), om het gevalideerde data bestand vervolgens in een procuratie-workflow te sturen ter goedkeuring door budgethouders. 

 

Automatisering van factuurontvangst

Download onze white paper over automatische factuurontvangst. Van OCR tot e-facturatie.

ic-whitepaper-efacturatie-v4_Page_01

 

Oplossingen

Wij bieden een OCR-dienst aan waarmee u documenten kunt laten scannen en herkennen. Onze dienst is gebaseerd op de scan en herken software van Kofax.

Voor inkomende facturen hebben wij een kant-en-klare factuurherkenningsoplossing, dat optioneel uitgebreid kan worden met factuur validatie en factuurverwerking (coderen en matchen).


icreative-solutions-irs

 

Neem contact op