Laatste update: jan.2021.
Deze blog is een uitgebreid overzicht van het gebruik van OCR met elke RPA-tool voor het automatiseren van uw documentworkflows. We onderzoeken hoe de nieuwste op machine learning gebaseerde OCR-technologieën geen regels of sjablooninstellingen vereisen.
RPA's of Robotic Process Automation zijn softwaretools gericht op het elimineren van repetitieve zakelijke taken. Meer CIO's wenden zich tot hen om de kosten te verlagen en werknemers te helpen zich te concentreren op meer waardevol zakelijk werk. Voorbeelden zijn het reageren op opmerkingen op websites of het verwerken van bestellingen van klanten. Iets complexere taken zijn onder meer het verwerken van documenten zoals handgeschreven formulieren en facturen – deze moeten doorgaans van het ene legacy-systeem naar het andere worden verplaatst – bijvoorbeeld uw e-mailclient naar uw SAP ERP-systeem waar u gegevens moet extraheren. Dit is het problematische gedeelte.
De meeste OCR-tools die gegevens uit deze documenten vastleggen, zijn gebaseerd op sjablonen (bijvoorbeeld Abbyy Flexicapture) en schalen niet goed op semi-gestructureerde documenten. Er zijn nieuwere generatie op machine learning gebaseerde oplossingen die doorgaans API bieden
integraties die sleutel-waardeparen uit documenten kunnen vastleggen - bedrijfssystemen zijn doorgaans legacy en kunnen niet worden geïntegreerd met externe API's. Aan de andere kant zijn RPA's gebouwd om deze verouderde systeemworkflows af te handelen, zoals het opnemen van documenten uit mappen en het invoeren van resultaten in ERP's of CRM's.
Omdat Robotic Process Automation (RPA) en ML evolueren naar hyperautomatisering, kunnen we softwarebots gebruiken in combinatie met ML om complexe taken uit te voeren, zoals documentclassificatie, extractie en optische tekenherkenning. In een recent onderzoek werd gezegd dat door het automatiseren van slechts 29% van de functies voor een taak met behulp van RPA's, financiële afdelingen alleen al meer dan 25,000 uur herwerk besparen als gevolg van menselijke fouten ten koste van $ 878,000 per jaar voor een organisatie met 40 volledige personeel voor tijdregistratie [1]. In deze blog zullen we leren over het gebruik van OCR's met RPA's en dieper ingaan op workflows voor het begrijpen van documenten. Hieronder vindt u de inhoudsopgave.
Definities en overzicht
RPA is over het algemeen een technologie die helpt bij het automatiseren van administratieve taken via software-hardwarebots. Deze bots profiteren van gebruikersinterfaces; om de gegevens vast te leggen en applicaties te manipuleren zoals mensen dat doen. Een RPA kan bijvoorbeeld kijken naar een reeks taken die in een GUI worden uitgevoerd, bijvoorbeeld cursors verplaatsen, verbinding maken met API's, de gegevens kopiëren en plakken en dezelfde reeks acties formuleren in een RPA-wireframe dat zich vertaalt naar code. Verder kunnen deze taken in de toekomst zonder menselijke tussenkomst worden uitgevoerd. Optical Character Recognition (OCR) is een cruciaal kenmerk van elke functionele Robotic Process Automation (RPA)-oplossing. Deze technologie wordt gebruikt om tekst uit verschillende bronnen zoals afbeeldingen of afbeeldingen te lezen en te extraheren pdfs in een digitaal formaat zonder het handmatig vast te leggen.
Aan de andere kant is documentbegrip de term die wordt gebruikt om automatisch het lezen, interpreteren en handelen naar documentgegevens te beschrijven. Het belangrijkste in dit proces is dat softwarebots zelf alle taken uitvoeren. Deze bots maken gebruik van de kracht van kunstmatige intelligentie en machine learning om documenten te begrijpen als digitale assistenten. Op deze manier kunnen we zeggen dat documentbegrip ontstaat op het snijvlak van documentverwerking, AI en RPA.
Hoe robots de documenten kunnen leren begrijpen met OCR en ML
Voordat we eerst diep ingaan op Document Understanding, laten we het hebben over de rol van Robots for Document Understanding. Deze volkomen onzichtbare helpers maken ons leven veel comfortabeler. In tegenstelling tot films en series zijn deze robots geen fysieke apparaten of kunstmatige intelligentieprogramma's die op een desktop zitten en op knoppen drukken om taken uit te voeren. We kunnen deze beschouwen als digitale assistenten die zijn opgeleid om documenten te verwerken door applicaties te lezen en te gebruiken zoals wij dat doen. Aan de functionele kant zijn robots goed in het verbeteren van de prestaties en efficiëntie van een proces. Toch kunnen ze, omdat ze een op zichzelf staande software zijn, het proces niet evalueren en cognitieve beslissingen nemen. Als machine learning echter met succes wordt geïntegreerd, zal robotica dynamischer en adaptiever worden. Robots die worden gebruikt voor documentverwerking, gegevensbeheer en andere functies in de front- en middle-office zullen bijvoorbeeld intelligentere acties uitvoeren, zoals het elimineren van dubbele invoer of het oplossen van onbekende systeemuitzonderingen in het proces. Verder zijn de robots getraind om met behulp van kunstmatige intelligentie (AI) gegevens uit de documenten te lezen, extraheren, interpreteren en ernaar te handelen.
Hoe kunnen bedrijven intelligente OCR integreren met RPA om workflows te verbeteren
Het extraheren van documentgegevens is een cruciaal onderdeel voor het begrijpen van documenten. In dit gedeelte bespreken we hoe we OCR kunnen integreren met RPA of vice versa. Ten eerste wisten we allemaal dat er verschillende soorten documenten zijn in termen van sjablonen, stijl, opmaak en soms taal. Daarom kunnen we niet vertrouwen op een eenvoudige OCR-techniek om de gegevens uit deze documenten te extraheren. Om dit probleem aan te pakken, gebruiken we zowel regelgebaseerde benaderingen als modelgebaseerde benaderingen binnen OCR om gegevens uit verschillende documentstructuren te verwerken. Nu zullen we zien hoe bedrijven die OCR doen, RPA's in hun bestaande systeem kunnen integreren op basis van het type documenten.
Gestructureerde documenten: In dit soort documenten zijn de lay-outs en sjablonen meestal vast en bijna consistent. Overweeg bijvoorbeeld een organisatie die KYC uitvoert met door de overheid uitgegeven identiteitsbewijzen zoals een paspoort of rijbewijs. Al deze documenten zijn identiek en hebben dezelfde velden als ID-nummer, naam van de persoon, leeftijd en enkele andere op dezelfde posities. Maar alleen de details verschillen. Er kunnen enkele beperkingen zijn, zoals overvolle tabellen of niet-gearchiveerde gegevens.
Gewoonlijk gebruikt de aanbevolen aanpak een sjabloon of op regels gebaseerde engine om de informatie voor gestructureerde documenten te extraheren. Dit kunnen reguliere expressies of eenvoudige positiemapping en OCR zijn. Om softwarerobots te integreren om informatie-extractie te automatiseren, kunnen we dus bestaande sjablonen gebruiken of regels maken voor onze gestructureerde gegevens. Er is één nadeel bij het gebruik van de op regels gebaseerde benadering, aangezien deze afhankelijk is van vaste onderdelen, kunnen zelfs kleine wijzigingen in de vormstructuur ervoor zorgen dat regels niet meer werken.
Semi-gestructureerde documenten: Deze documenten bevatten dezelfde informatie, maar zijn op verschillende posities gerangschikt. Overweeg bijvoorbeeld facturen met 8-12 identieke velden. In een paar facturen, kan het handelaarsadres bovenaan staan, en in andere onderaan. Doorgaans leveren deze op regels gebaseerde benaderingen geen hoge nauwkeurigheid op; daarom brengen we machine learning en deep learning-modellen in beeld voor informatie-extractie met behulp van OCR. Als alternatief kunnen we in sommige gevallen hybride modellen gebruiken met zowel regels als ML-modellen. Enkele populaire voorgetrainde modellen zijn FastRCNN, Attention OCR, Graph Convolutions voor informatie-extractie in documenten. Ook deze modellen hebben echter weer weinig nadelen; daarom meten we de algoritmeprestaties met behulp van statistieken zoals nauwkeurigheid of betrouwbaarheidsscore. Omdat het model patronen aan het leren is, in plaats van zich te laten leiden door concrete regels, kan het in eerste instantie fouten maken direct na correcties. De oplossing voor deze nadelen is echter: hoe meer monsters het ML-model verwerkt, hoe meer patronen het leert om nauwkeurigheid te garanderen.
Ongestructureerde documenten: RPA is tegenwoordig niet in staat om ongestructureerde gegevens rechtstreeks te beheren, waardoor robots eerst gestructureerde gegevens moeten extraheren en creëren met behulp van OCR. In tegenstelling tot gestructureerde en semi-gestructureerde documenten, hebben ongestructureerde gegevens niet een paar sleutel-waardeparen. Bijvoorbeeld in een paar facturen, zien we ergens een handelaarsadres zonder enige sleutelnaam; op dezelfde manier zien we hetzelfde voor andere velden zoals datum, factuur-ID. Om ervoor te zorgen dat ML-modellen deze nauwkeurig kunnen verwerken, moeten de robots leren hoe ze geschreven tekst kunnen vertalen naar bruikbare gegevens, zoals een e-mail, telefoonnummer, adres, enz. Het model leert dan dat 7- of 10-cijferige nummerpatronen moeten worden geëxtraheerd als telefoonnummers en enorme tekst met vijfcijferige codes en verschillende zelfstandige naamwoorden als tekst. Om deze modellen nauwkeuriger te maken, kunnen we ook technieken uit Natural Language Processing (NLP) gebruiken, zoals Named Entity Recognition en Word Embedding.
Over het algemeen is het voor het begrijpen van documenten essentieel om de gegevens te begrijpen en vervolgens OCR met RPA's te implementeren. Vervolgens, in plaats van een proces stap voor stap in kaart te brengen, kunnen we een robot leren “te doen wat ik doe” door het proces vast te leggen zoals het gebeurt met krachtige OCR-mogelijkheden zoals hierboven besproken, door regels en algoritmen voor machine learning te integreren. De softwarerobot volgt uw klikken en acties op het scherm en verandert ze vervolgens in een bewerkbare workflow. Als u volledig in lokale programma's werkt, is dat zoveel als u zou moeten weten.
OCR-uitdagingen waarmee RPA-ontwikkelaars worden geconfronteerd
We hebben gezien hoe we OCRR kunnen integreren met RPA's voor verschillende documenten, maar er zijn een paar gevallen van uitdagingen waarbij de robots goed moeten omgaan. Laten we ze nu bespreken!
- Zwakke of inconsistente gegevens: Gegevens spelen een cruciale rol bij het begrijpen van documenten. In de meeste gevallen worden de documenten gescand met camera's waarbij de kans bestaat dat de documentopmaak verloren gaat tijdens het scannen van tekst (dwz vet, cursief en onderstrepen worden niet altijd herkend). Soms kan de OCR tekst op de verkeerde manier extraheren, wat leidt tot spelfouten en onregelmatige alinea-einden, wat de algehele prestaties van robots vermindert. Daarom is het van cruciaal belang om alle ontbrekende waarden te verwerken en de gegevens met een hogere precisie vast te leggen, om een hogere nauwkeurigheid voor OCR te bereiken.
- Onjuiste paginaoriëntatie in documenten: Pagina-oriëntatie en scheefheid is ook een van de meest voorkomende problemen die leiden tot onjuiste tekstcorrectie van OCR. Dit gebeurt meestal wanneer de documenten onjuist worden gescand tijdens de gegevensverzamelingsfase. Om dit te verhelpen, moeten we een aantal functies aan robots declareren, zoals automatisch aanpassen aan de pagina, automatisch filteren, zodat ze de kwaliteit van het gescande document kunnen verhogen en de juiste gegevens bij uitvoer kunnen ontvangen.
- Integratieproblemen: Niet alle RPA-tools presteren goed op externe desktopomgevingen - ze veroorzaken crashes en kritieke problemen bij automatisering. Bovendien moet de RPA-ontwikkelaar weten welke OCR-oplossing het beste is voor een specifiek geval. Om met specifieke automatiseringstools te werken, hoeft de RPA-ontwikkelaar ook slechts beperkte OCR-technologie te kiezen die is gemaakt door Microsoft, Google. Daarom is het soms een uitdaging om onze aangepaste algoritmen en modellen te integreren.
- Alle tekst is gecodeerde tekst: Voor real-life use-cases is tekst die is vastgelegd door een generieke OCR allemaal gecodeerd en bevat deze geen zinvolle informatie die de bots kunnen gebruiken om belangrijke bewerkingen uit te voeren. RPA-ontwikkelaars hebben sterke ML-ondersteuning nodig om nuttige applicaties te kunnen bouwen.
Pijplijn voor het begrijpen van de workflow van documenten
In de vorige secties hebben we gezien hoe bots helpen bij het uitvoeren van OCR voor verschillende soorten documenten. Maar OCR is slechts een techniek die afbeeldingen of andere bestanden naar tekst converteert. Nu, in dit gedeelte, zullen we de workflow Document Understanding bekijken vanaf het begin van het verzamelen van documenten tot het uiteindelijk opslaan van zinvolle informatie in het gewenste formaat.
- Neem het document op vanuit een map met uw bot: Dit is de eerste stap naar het verkrijgen van documentbegrip via bots. Hier halen we het document op op een cloudplatform (met behulp van een API) of vanaf een lokale computer. In een paar gevallen, als onze documenten op webpagina's staan, kunnen we scrapingscripts automatiseren via bots, waar ze documenten tijdig kunnen ophalen.
- Soort document: Nadat we de gegevens hebben opgehaald, is het essentieel om het type document en de indeling waarin ze in onze systemen zijn opgeslagen te begrijpen, aangezien we soms gegevens ontvangen van verschillende bronnen in verschillende bestandsindelingen, zoals PDF, PNG en JPG. Niet alleen de bestandstypen, soms wanneer de documenten worden gescand met telefooncamera's, moeten soms ook enkele uitdagende problemen zoals scheve afbeeldingen, rotatie, helderheid of lage resolutie worden aangepakt. Daarbij moeten we ervoor zorgen dat bots deze documenten classificeren in de gestructureerde, semi-gestructureerde of ongestructureerde categorie, waardoor ze in een generiek formaat worden opgeslagen. De classificatietaak wordt bereikt door de documenten te vergelijken met sjablonen en functies zoals lettertypen, taal, aanwezigheid van sleutel-waardeparen, tabellen, enz. te analyseren.
- De gegevens extraheren met OCR: Goed, nu de bots onze documenten in een algemeen formaat hebben gerangschikt en geclassificeerd, is het tijd voor ons om ze te digitaliseren met behulp van de OCR-techniek. Hiermee hebben we de tekst, de locatie in co-coördinaten van de afbeeldingen. Dit helpt om de documenten en gegevens voor de volgende stappen te standaardiseren. We komen er ook een paar tegen wanneer OCR-software niet correct onderscheid kan maken tussen tekens, zoals 't' versus 'i' of '0' versus 'O'. Juist de fouten die u wilt ontwijken met behulp van OCR-software, kunnen nieuwe kopzorgen worden wanneer de OCR-technologie niet in staat is om de nuances van een document te analyseren op basis van de kwaliteit of de oorspronkelijke vorm. Dit is waar Machine Learning in beeld komt, die we in de volgende stap zullen bespreken.
- ML / DL benutten voor intelligente OCR met behulp van bots: Nadat de gegevens zijn gedigitaliseerd, moet de OCR-software begrijpen met welk soort document het werkt en wat relevant is. Maar de traditionele OCR-software kan moeite hebben om de inspanningen voor documentclassificatie te schalen. Daarom moeten softwarebots worden getraind met cognitieve vaardigheden door gebruik te maken van machine learning en deep learning-technieken om de OCR's intelligenter te maken. ML-gebaseerde OCR-oplossingen kunnen een documenttype identificeren en vergelijken met een bekend documenttype dat door uw bedrijf wordt gebruikt. Ze kunnen ook tekstblokken in ongestructureerde documenten ontleden en begrijpen. Zodra de oplossing meer over het document zelf weet, kan het beginnen met het extraheren van relevante informatie op basis van intentie en betekenis.
- Betere gegevensextractie en classificatie: Gegevensextractie is de kern van Document Understanding. Zoals besproken in de vorige sectie over het integreren van RPA's met OCR in deze stap, kiest u de gegevensextractietechniek op basis van het type document. Via RPA's kunnen we eenvoudig configureren welke extractor we moeten gebruiken, of het nu een rule-based of ML-based of een hybride model-OCR-techniek is. Op basis van de betrouwbaarheids- en prestatiestatistieken die worden geretourneerd na de informatie-extractie, zullen de softwarerobots ze in het door ons gewenste formaat opslaan voor verdere analyse. Hieronder ziet u een afbeelding van hoe we extractors kunnen configureren en het betrouwbaarheidsniveau kunnen instellen in een RPA-tool door UIPath.
6. Validatie en empowerment van inzichten: OCR- en Machine Learning-modellen zijn niet honderd procent nauwkeurig in termen van informatie-extractie, dus het toevoegen van een laag menselijke tussenkomst met behulp van robots kan het probleem oplossen. De manier waarop deze validatie werkt, is dat wanneer de robots omgaan met lage nauwkeurigheid en uitzonderingen, het onmiddellijk een melding naar het actiecentrum stuurt, waar een medewerker een verzoek kan ontvangen om gegevens te valideren of uitzonderingen af te handelen en eventuele onzekerheden met een paar klikken kan oplossen. Verder kunnen we het potentieel van kunstmatige intelligentie ontsluiten om gegevens in de loop van de tijd te documenteren om voorspellingen te doen en mogelijke afwijkingen te identificeren die kunnen duiden op fraude, duplicatie en andere fouten.
Voordelen van het integreren van robots met Document Understanding
- Automatiseer proces: De belangrijkste reden om bots te integreren voor het begrijpen van documenten, is om het hele proces van begin tot eind te automatiseren. Het enige wat we hoeven te doen is een workflow creëren zodat de bots kunnen leren, achterover leunen en ontspannen. Tijdens het validatieproces moeten we mogelijk de problemen aanpakken die worden gemeld door de bots waar fouten of fraude worden vastgesteld.
- Bots met machine learning: Tijdens het automatiseringsproces kunnen we de bots weerbaar maken voor machine learning. Dit betekent dat de robots ook kunnen leren hoe Machine Learning-modellen presteren en daardoor de modellen verbeteren om een hogere nauwkeurigheid en prestaties te bereiken voor het extraheren van tekst en informatie van documenten.
- Verwerk een breed scala aan documentverwerking: Voor algemene taken zoals het extraheren van tabellen en informatie, zullen we verschillende deep learning-pijplijnen moeten maken voor verschillende soorten documenten. Dit leidt tot het bouwen van meerdere applicaties en het implementeren van verschillende modellen op verschillende servers, wat veel moeite en tijd kost. Wanneer de bots in beeld zijn voor een breed scala aan documenten, zouden we maar één pijplijn kunnen hebben waarin de bots ze kunnen classificeren en vervolgens het juiste model voor verschillende taken kunnen gebruiken. We kunnen ook verschillende services integreren via API's en communiceren met andere organisaties in termen van het ophalen van de gegevens.
- Makkelijk te implementeren: Om het document te begrijpen nadat de pijplijnen zijn gemaakt, duurt het implementatieproces slechts een minuut. We kunnen API's laten exporteren door bots na de training, of we kunnen een aangepaste RPA-oplossing laten bouwen die kan worden gebruikt in onze lokale systemen. Dit type inzet kan ook de ondernemingen optimaliseren en kan de uitgaven met zeer minimale risico's verminderen.
Voer Nanonets in
NanoNets is een Machine Learning-platform waarmee gebruikers gegevens kunnen vastleggen van facturen, kwitanties en andere documenten zonder sjablooninstellingen. We hebben state-of-the-art deep learning- en computervisie-algoritmen aan de achterkant die alle soorten documentbegriptaken aankunnen, zoals OCR, tabelextractie, extractie van sleutel-waardeparen. Ze worden meestal geëxporteerd als API's of kunnen on-premises worden geïmplementeerd op basis van verschillende gebruiksscenario's. Hier zijn een paar voorbeelden,
- Factuurmodel: Identificeer sleutelvelden uit Facturen zoals de naam van de koper, factuur-ID, datum, bedrag enz.
- Ontvangstenmodel: identificeer sleutelvelden van ontvangsten zoals naam verkoper, nummer, datum, bedrag enz.
- Rijbewijs (VS): identificeer sleutelvelden zoals licentienummer, geboortedatum, vervaldatum, uitgiftedatum enz.
- CV's: extraheer ervaring, opleiding, vaardigheden, kandidaat-informatie enz.
Om deze workflows sneller en robuuster te maken, gebruiken we UiPath, een RPA-tool voor naadloze automatisering van uw documenten zonder enig sjabloon. In het volgende gedeelte bespreken we hoe u UiPath Connect met Nanonets kunt gebruiken om documenten te begrijpen. De 3 grootste spelers op de RPA-markt zijn UiPath, Automation Anywhere en Blue Prism. Deze blog richt zich op Uipath.
NanoNets met UiPath
We hebben in onze vorige secties geleerd om een pijplijn voor documentbegrip te maken. Het vereist basiskennis van OCR, RPA's en Machine learning, aangezien er op verschillende punten verschillende benaderingen en algoritmen zijn voor verschillende taken. We moeten ook veel moeite besteden aan het bouwen van neurale netwerken die onze sjablonen begrijpen, trainen en implementeren. Om comfortabel te zijn en alles te automatiseren, van het uploaden van documenten, het classificeren, het bouwen van OCR, het integreren van ML-modellen, werken we bij Nanonets aan Ui Path om een naadloze pijplijn te creëren voor Document Understanding. Hieronder ziet u een afbeelding van hoe dit werkt.
Laten we nu elk van deze bekijken en leren hoe we Nanonets kunnen integreren met UiPath.
Stap 1: Meld u aan bij UiPath en download UiPath Studio
Om een workflow te maken, moeten we eerst een account aanmaken in UiPath. Als u een bestaande gebruiker bent, kunt u direct inloggen op uw account en uw UiPath-dashboard omleiden. Vervolgens moet u de UiPath Studio (Community-editie) downloaden en installeren, die gratis is.
Stap 2: Download de Nanonets-component
Vervolgens om uw pijplijn voor factuurverwerking, moet u de Nanonets-connector downloaden via de onderstaande link.
-> NanoNets OCR - RPA-component
Hieronder ziet u een screenshot van de UiPath Marketplace en de Nanonets-component. Om dit te downloaden, moet u zich ook aanmelden bij UiPath vanaf een Windows-besturingssysteem.
Uw gedownloade bestanden moeten de onderstaande bestanden bevatten,
UiPath OCR Predict ├── Main.xaml
└── project.json
Stap 3: Open het Main.xaml-bestand Nanonets Component
Om te controleren of de Nanonets UiPath werkt of niet, kunt u uw Main.xml-bestand openen vanuit de gedownloade Nanonets-component met behulp van de Ui Path Studio. Vervolgens kunt u zien dat uw pijplijn al voor u is gemaakt voor documentverwerking.
Stap 4: Verzamel uw model-ID, API-sleutel en API-eindpunt van de Nanonets APP
Vervolgens kunt u elk van de getrainde OCR-modellen van Nanonets APP gebruiken en de model-ID, API-sleutel en het eindpunt verzamelen. Hieronder vindt u meer details zodat u ze snel kunt vinden.
Model-ID: Log in op uw Nanonets-account en ga naar "Mijn modellen". U kunt een nieuw model trainen of de toepassings-ID van een bestaand model kopiëren.
API-eindpunt: U kunt elk bestaand model kiezen en op Integreren klikken om uw API-eindpunt te vinden. Hieronder ziet u een voorbeeld van hoe uw eindpunten eruit zien.
https://app.nanonets.com/api/v2/OCR/Model/XXXXXXX-4840-4c27-8940-d3add200779e/LabelUrls/
3. API-sleutel: Navigeer naar het tabblad API-sleutel en u kunt een bestaande API-sleutel kopiëren of een nieuwe maken.
Stap 5: voeg een HTTP-verzoek toe om uw methode en variabelen in het UI-pad te krijgen
Om nu uw model van Nanonets in het UI-pad te integreren, moet u voor het eerst op HTTP Request klikken en het EndPoint toevoegen, dat u kunt vinden in de linkernavigatie onder het gedeelte Invoer. Hieronder ziet u een screenshot.
Voeg later al uw variabelen toe om een verbinding tot stand te brengen van uw UiPath-studio naar de Nanonets API. U vindt dit gedeelte in het onderste deelvenster op het tabblad 'Variabelen'. Hieronder ziet u de schermafbeelding, u moet uw API-sleutel, eindpunt en de model-ID van uw model hier bijwerken / kopiëren.
Stap 6: voeg een bestandslocatie toe voor voorspellingen
Ten slotte kunt u uw bestandslocatie toevoegen onder het tabblad attributen, zoals weergegeven in de onderstaande schermafbeelding, en op de afspeelknop op uw navigatie bovenaan klikken om uw uitvoer te voorspellen.
Voila! Dit zijn onze resultaten voor het document dat we hebben aangevraagd in de onderstaande schermafbeelding. Om meer te verwerken, kunt u eenvoudig uw bestandslocaties toevoegen en op de knop Uitvoeren drukken.
Stap 7 - Push output naar CSV / ERP
Ten slotte kunnen we, om onze uitvoer aan te passen naar uw gewenste formaat, nieuwe blokken aan uw pijplijn toevoegen in het bestand Main.XML. We kunnen dit ook in bestaande ERP-systemen pushen via offline bestanden of API-oproepen.
Neem voor hulp contact met ons op via support@nanonets.com
Webinar
Kom volgende dinsdag naar een webinar over OCR met RPA, Registreer hier.
Referenties
[2] Document begrijpen - AI-documentverwerking
[3] RPA OCR - procesautomatisering verbeteren | LEUK
[4] Hoe AI te gebruiken om het begrip van documenten te optimaliseren
[5] https://www.uipath.com/product/document-understanding
[6] NanoNets gebruiken in UiPath Workflow voor OCR van facturen
Verder lezen
Mogelijk bent u geïnteresseerd in onze laatste berichten over:
update:
Meer leesmateriaal toegevoegd over het gebruik en de impact van OCR, RPA op het begrijpen van documenten.
Bron: https://nanonets.com/blog/ocr-with-rpa-and-document-understanding-uipath/
- '
- &
- 000
- 2021
- 7
- Account
- Accounting
- Actie
- Voordeel
- AI
- algoritme
- algoritmen
- Alles
- analyse
- api
- APIs
- gebruiken
- Aanvraag
- toepassingen
- Kunst
- kunstmatige intelligentie
- Kunstmatige intelligentie (AI)
- Kunstmatige intelligentie en machine learning
- Automatisering
- automatisering overal
- BEST
- Grootste
- Blog
- Bot
- bots
- bouw
- Gebouw
- bedrijfsdeskundigen
- camera's
- gevallen
- Veroorzaken
- veroorzaakt
- tekenherkenning
- classificatie
- Cloud
- Cloud Platform
- code
- cognitieve
- Het verzamelen van
- opmerkingen
- Gemeen
- gemeenschap
- Bedrijven
- bestanddeel
- Computer visie
- vertrouwen
- inhoud
- Correcties
- Kosten
- dashboards
- gegevens
- gegevensbeheer
- transactie
- diepgaand leren
- Ontwikkelaar
- ontwikkelaars
- systemen
- digitaal
- documenten
- Ontwijken
- aandrijving
- Onderwijs
- doeltreffendheid
- medewerkers
- Endpoint
- Enterprise
- etc
- extraheer de gegevens
- extractie
- Kenmerk
- Voordelen
- Velden
- Tot slot
- financiën
- Voornaam*
- Focus
- formulier
- formaat
- bedrog
- Gratis
- toekomst
- Gartner
- Algemeen
- gif
- goed
- Kopen Google Reviews
- gids
- Behandeling
- hoofdpijn
- hier
- Hoge
- Hoe
- How To
- HTTPS
- reusachtig
- Mensen
- Hybride
- identificeren
- beeld
- Impact
- Laat uw omzet
- info
- informatie
- informatie-extractie
- Intelligentie
- aandachtig
- problemen
- IT
- sleutel
- kennis
- KYC
- taal
- laatste
- leiden
- leidend
- LEARN
- geleerd
- leren
- Niveau
- Hefboomwerking
- Vergunning
- Beperkt
- LINK
- lokaal
- plaats
- machine learning
- management
- Markt
- markt
- Match
- maatregel
- Koopman
- Metriek
- Microsoft
- ML
- model
- Films
- Natuurlijke taal
- Natural Language Processing
- Navigatie
- netwerken
- Neural
- neurale netwerken
- nlp
- notificatie
- nummers
- OCR
- open
- werkzaam
- besturingssysteem
- Operations
- optische tekenherkenning
- bestellen
- Overige
- Overig
- paspoort
- prestatie
- beeld
- platform
- Populair
- Berichten
- energie
- precisie
- Voorspellingen
- Process Automation
- Programma's
- project
- kwaliteit
- verhoogt
- reeks
- RE
- lezing
- verminderen
- Resultaten
- beoordelen
- robot
- Automatisering van robotprocessen
- robotica
- robots
- Zuid-Afrika
- reglement
- lopen
- lopend
- sap
- besparing
- Scale
- het scannen
- schrapen
- scherm
- naadloos
- Verkopers
- -Series
- Diensten
- reeks
- Eenvoudig
- So
- Software
- Softwarebots
- Oplossingen
- OPLOSSEN
- besteden
- begin
- Land
- Studie
- ondersteuning
- system
- Systems
- tafel extractie
- Technologies
- Technologie
- De toekomst
- niet de tijd of
- top
- Trainingen
- ui
- UiPath
- bijwerken
- us
- USA
- gebruiksgevallen
- gebruikers
- waarde
- Tegen
- visie
- web
- webinar
- websites
- WIE
- ruiten
- binnen
- Mijn werk
- workflow
- Bedrijven
- XML
- jaar
- youtube