Viimane värskendus: jaanuar 2021.
See ajaveeb on põhjalik ülevaade OCR-i kasutamisest mis tahes RPA-tööriistaga, et automatiseerida teie dokumendi töövooge. Uurime, kuidas uusimad masinõppel põhinevad OCR-tehnoloogiad ei vaja reegleid ega malli seadistamist.
RPA-d ehk robotprotsesside automatiseerimine on tarkvaratööriistad, mille eesmärk on kõrvaldada korduvad äriülesanded. Üha enam IT-juhte pöördub nende poole, et vähendada kulusid ja aidata töötajatel keskenduda suurema väärtusega äritööle. Näited hõlmavad veebisaitide kommentaaridele vastamist või klientide tellimuste töötlemist. Veidi keerulisemate ülesannete hulka kuulub näiteks dokumentide käsitlemine käsitsi kirjutatud vormid ja arved – need tuleb tavaliselt ühest pärandsüsteemist teise teisaldada – öelge, et teie meiliklient on teie SAP ERP-süsteemis, kus peate andmed eraldama. See on probleemne osa.
Enamik OCR-tööriistu, mis koguvad andmeid nendest dokumentidest, on mallipõhised (nt Abby Flexicapture) ja poolstruktureeritud dokumentide puhul ei skaleerita hästi. On uuema põlvkonna masinõppepõhiseid lahendusi, mis tavaliselt pakuvad API-t
integratsioonid, mis suudavad jäädvustada dokumentidest võtme-väärtuste paare – ettevõttesüsteemid on tavaliselt pärand ega ole avatud integreerimiseks väliste API-dega. Teisest küljest on RPA-d loodud nende pärandsüsteemi töövoogude haldamiseks, nagu dokumentide allaneelamine kaustadest ja tulemuste sisestamine ERP-i või CRM-i.
Kuna robotprotsesside automatiseerimine (RPA) ja ML arenevad hüperautomaatika suunas, saame koos ML-iga kasutada tarkvararotte, et lahendada keerulisi ülesandeid, nagu dokumentide klassifitseerimine, ekstraheerimine ja optiline märgituvastus. Hiljutises uuringus öeldi, et automatiseerides ainult 29% funktsioonidest RPA-de abil, säästavad finantsosakonnad ainuüksi inimlikest vigadest põhjustatud ümbertöötamist rohkem kui 25,000 878,000 tundi, mis maksab 40 1 dollarit aastas organisatsioonis, kus on XNUMX täismahut. ajaarvestuse töötajad [XNUMX]. Selles ajaveebis õpime OCR-ide kasutamist RPA-dega ja sukeldume põhjalikult dokumentide mõistmise töövoogudesse. Allpool on sisukord.
Definitsioonid ja ülevaade
RPA on üldiselt tehnoloogia, mis aitab tarkvara-riistvararobotite kaudu haldustoiminguid automatiseerida. Need robotid kasutavad kasutajaliideseid; andmete kogumiseks ja rakendustega manipuleerimiseks nagu inimesed seda teevad. Näiteks saab RPA vaadata GUI-s tehtud ülesandeid, näiteks liigutada kursoreid, luua ühenduse API-dega, kopeerida-kleepida andmed ja formuleerida sama toimingute jada RPA traatraamis, mis tõlgitakse koodiks. Lisaks saab neid ülesandeid tulevikus täita ilma inimese sekkumiseta. Optiline märgituvastus (OCR) on iga funktsionaalse robotprotsesside automatiseerimise (RPA) lahenduse oluline funktsioon. Seda tehnoloogiat kasutatakse teksti lugemiseks ja eraldamiseks erinevatest allikatest, näiteks piltidest või pdfs digitaalsesse vormingusse ilma seda käsitsi salvestamata.
Teisest küljest on dokumendi mõistmine termin, mida kasutatakse dokumendiandmete lugemise, tõlgendamise ja nende alusel tegutsemise automaatseks kirjeldamiseks. Kõige olulisem selles protsessis on see, et tarkvararobotid ise täidavad kõiki ülesandeid. Need robotid kasutavad tehisintellekti ja masinõppe võimsust, et mõista dokumente digiassistentidena. Nii võime öelda, et dokumendi mõistmine tekib dokumenditöötluse, AI ja RPA ristumiskohas.
Kuidas robotid saavad õppida OCR-i ja ML-i abil dokumente mõistma
Enne kui sukeldume põhjalikult dokumentide mõistmisse, räägime dokumentide mõistmise robotite rollist. Need täiesti nähtamatud abilised muudavad meie elu palju mugavamaks. Erinevalt filmidest ja seriaalidest ei ole need robotid füüsilised seadmed ega tehisintellekti programmid, mis istuvad töölaual ja vajutavad nuppe, et ülesandeid täita. Me võime neid mõelda kui digiassistente, kes on koolitatud dokumente töötlema, lugedes ja kasutades rakendusi nagu meiegi. Funktsionaalse poole pealt on robotid head protsessi jõudluse ja tõhususe parandamisel. Siiski, kuna nad on eraldiseisev tarkvara, ei saa nad protsessi hinnata ega kognitiivseid otsuseid teha. Kui masinõpe on aga edukalt integreeritud, muutub robootika dünaamilisemaks ja kohanemisvõimelisemaks. Näiteks robotid, mida kasutatakse esi- ja keskkontoris dokumentide töötlemiseks, andmehalduseks ja muudeks funktsioonideks, teevad intelligentsemaid toiminguid, nagu dubleerivate kirjete kõrvaldamine või tundmatute süsteemierandite lahendamine protsessis. Lisaks õpetatakse roboteid tehisintellekti (AI) abil dokumentidest andmeid lugema, eraldama, tõlgendama ja nende alusel toimima.
Kuidas saavad ettevõtted integreerida intelligentse OCR-i RPA-ga töövoogude parandamiseks?
Dokumendiandmete väljavõtmine on dokumentide mõistmise jaoks ülioluline komponent. Selles jaotises arutame, kuidas integreerida OCR-i RPA-ga või vastupidi. Esiteks teadsime kõik, et on olemas erinevat tüüpi dokumente mallide, stiili, vormingu ja mõnikord ka keele osas. Seetõttu ei saa me nendest dokumentidest andmete eraldamiseks toetuda lihtsale OCR-tehnikale. Selle probleemi lahendamiseks kasutame OCR-is nii reeglipõhiseid kui ka mudelipõhiseid lähenemisviise, et käsitleda erinevatest dokumendistruktuuridest pärit andmeid. Nüüd näeme, kuidas OCR-iga tegelevad ettevõtted saavad integreerida RPA-sid oma olemasolevasse süsteemi, lähtudes dokumentide tüübist.
Struktureeritud dokumendid: Seda tüüpi dokumentide puhul on paigutused ja mallid tavaliselt fikseeritud ja peaaegu järjepidevad. Mõelge näiteks organisatsioonile, mis teeb KYC-d valitsuse väljastatud isikutunnistustega, nagu pass või juhiluba. Kõik need dokumendid on identsed ja neil on samad väljad nagu ID-number, Isiku nimi, Vanus ja mõned teised samadel kohtadel. Kuid ainult üksikasjad on erinevad. Võib esineda vähe piiranguid, nagu tabeli ületäitumine või esitamata andmed.
Tavaliselt kasutab soovitatav lähenemisviis struktureeritud dokumentide teabe eraldamiseks malli või reeglipõhist mootorit. Need võivad hõlmata regulaaravaldisi või lihtsat asukoha kaardistamist ja OCR-i. Seetõttu võime tarkvararobotite integreerimiseks teabe ammutamise automatiseerimiseks kasutada kas juba olemasolevaid malle või luua oma struktureeritud andmete jaoks reegleid. Reeglipõhise lähenemisviisi kasutamisel on üks puudus, kuna see põhineb fikseeritud osadel, isegi väikesed muudatused vormi struktuuris võivad põhjustada reeglite lagunemise.
Poolstruktureeritud dokumendid: Nendel dokumentidel on sama teave, kuid need on paigutatud erinevatesse kohtadesse. Näiteks kaaluge arved sisaldab 8-12 identset välja. Paar arved, võib kaupmehe aadressi asuda ülaosas ja teiste puhul leiate selle alt. Tavaliselt ei anna need reeglipõhised lähenemisviisid suurt täpsust; seetõttu toome OCR-i abil teabe hankimiseks pildile masinõppe ja süvaõppe mudelid. Teise võimalusena saame mõnel juhul kasutada hübriidmudeleid, mis hõlmavad nii reegleid kui ka ML-mudeleid. Mõned populaarsed eelkoolitatud mudelid on FastRCNN, Attention OCR, Graph Convolutions dokumentidest teabe hankimiseks. Kuid jällegi on neil mudelitel vähe puudusi; seetõttu mõõdame algoritmi toimivust selliste mõõdikute abil nagu täpsus või usaldusskoor. Kuna mudel õpib mustreid, mitte ei tööta konkreetsete reeglite järgi, võib see teha vigu alguses kohe pärast parandusi. Kuid lahendus nendele puudustele – mida rohkem näidiseid ML-mudel töötleb, seda rohkem mustreid õpib, et tagada täpsus.
Struktureerimata dokumendid: RPA ei suuda tänapäeval struktureerimata andmeid otse hallata, mistõttu peavad robotid esmalt struktureeritud andmeid OCR-i abil eraldama ja looma. Erinevalt struktureeritud ja poolstruktureeritud dokumentidest ei ole struktureerimata andmetel paar võtmeväärtuste paari. Näiteks mõnes arved, näeme kuskil kaupmehe aadressi ilma võtmenimeta; Samamoodi jälgime sama ka muude väljade puhul, nagu kuupäev, arve ID. ML-mudelite täpseks töötlemiseks peavad robotid õppima, kuidas tõlkida kirjutatud teksti kasutatavateks andmeteks, nagu e-posti aadress, telefoninumber, aadress jne. Seejärel õpib mudel, et tuleks eraldada 7- või 10-kohalised numbrimustrid. telefoninumbritena ja tohutu tekstina, mis sisaldab viiekohalisi koode ja erinevaid nimisõnu tekstina. Nende mudelite täpsemaks muutmiseks saame kasutada ka loomuliku keele töötlemise (NLP) tehnikaid, nagu nimega olemi tuvastamine ja sõna manustamine.
Üldiselt on dokumentide mõistmiseks esmatähtis andmete mõistmine ja seejärel OCR-i rakendamine RPA-dega. Järgmisena saame protsessi samm-sammult kaardistamise asemel õpetada robotit tegema nii, nagu mina teen, salvestades protsessi nii, nagu see toimub, kasutades ülalpool kirjeldatud võimsaid optilise tekstituvastuse võimalusi, integreerides reegleid ja masinõppe algoritme. Tarkvararobot jälgib teie klikke ja toiminguid ekraanil ning muudab need seejärel redigeeritavaks töövooks. Kui töötate täielikult kohalike programmidega, on see nii palju, kui teil on vaja teada.
OCR väljakutsed, millega RPA arendajad silmitsi seisavad
Oleme näinud, kuidas saame integreerida OCRR-i RPA-dega erinevate dokumentide jaoks, kuid on mõned väljakutsed, mille puhul robotid peavad hästi hakkama saama. Arutame neid nüüd!
- Nõrgad või vastuolulised andmed: Andmed mängivad dokumentide mõistmisel otsustavat rolli. Enamasti skannitakse dokumente kaameratega, mille puhul on võimalus, et teksti skannimisel kaotatakse dokumendi vorming (st paks, kaldkiri ja allakriipsutus on alati äratuntud). Mõnikord võib OCR välja võtta teksti valel viisil, mis põhjustab õigekirjavigu, ebakorrapäraseid lõigukatkeid, mis vähendab robotite üldist jõudlust. Seetõttu on OCR-i suurema täpsuse saavutamiseks ülioluline kõigi puuduvate väärtuste käsitlemine ja andmete suurema täpsusega hõivamine.
- Vale lehekülje suund dokumentides: Lehekülje orientatsioon ja kalduvus on samuti üks levinumaid probleeme, mis põhjustavad OCR-i vale tekstiparanduse. Tavaliselt juhtub see siis, kui dokumente skannitakse andmete kogumise etapis valesti. Sellest ülesaamiseks peame robotitele deklareerima mõned funktsioonid, nagu automaatne lehele sobitamine, automaatne filtreerimine, et nad saaksid võimaldada skannitud dokumendi kvaliteedi tõstmist ja õigete andmete saamist väljundis.
- Integratsiooniprobleemid: Kõik RPA tööriistad ei tööta kaugtöölaua keskkondades hästi – need põhjustavad kokkujooksmisi ja kriitilisi probleeme automatiseerimisel. Veelgi enam, RPA arendaja peab teadma, milline OCR-lahendus on konkreetse juhtumi jaoks parim. Samuti peab RPA arendaja konkreetsete automatiseerimistööriistadega töötamiseks valima ainult piiratud OCR-tehnoloogia, mille on loonud Microsoft, Google. Seetõttu on meie kohandatud algoritmide ja mudelite integreerimine mõnikord keeruline.
- Kogu tekst on skrambleeritud tekst: Reaalses elus on üldise OCR-iga jäädvustatud tekst skrambleeritud ja sellel puudub sisuline teave, mida robotid saaksid kasutada oluliste toimingute tegemiseks. RPA arendajad vajavad kasulike rakenduste loomiseks tugevat ML-i tuge.
Dokumentide mõistmise töövoo kanal
Eelmistes jaotistes oleme näinud, kuidas robotid aitavad OCR-i läbi viia erinevat tüüpi dokumentide jaoks. Kuid OCR on lihtsalt tehnika, mis teisendab pildid või muud failid tekstiks. Nüüd käsitleme selles jaotises dokumentide mõistmise töövoogu alates dokumentide kogumise algusest kuni nende sisulise teabe soovitud vormingusse salvestamiseni.
- Sisestage dokument kaustast oma roboti abil: See on esimene samm dokumendist arusaamise saavutamiseks robotite kaudu. Siin toome dokumendi, mis asub kas pilveplatvormil (kasutades API-d) või kohalikust masinast. Mõnel juhul, kui meie dokumendid on veebilehtedel, saame automatiseerida skriptide kraapimist robotite kaudu, kust nad saavad dokumente õigeaegselt tuua.
- Dokumendi tüüp: Pärast andmete toomist on oluline mõista dokumendi tüüpi ja vormingut, millega need meie süsteemidesse salvestatakse, kuna mõnikord saame andmeid erinevatest allikatest erinevates failivormingutes, näiteks pDF, PNG ja JPG. Lisaks failitüüpidele tuleks mõnikord telefonikaameraga dokumentide skannimisel lahendada ka mõned keerulised probleemid, nagu pildi kalduvus, pööramine, heledus või madal eraldusvõime. Seetõttu peame tagama, et robotid liigitavad need dokumendid struktureeritud, poolstruktureeritud või struktureerimata kategooriasse, salvestades need seega üldises vormingus. Klassifitseerimisülesanne saavutatakse, võrreldes dokumente mallidega ja analüüsides selliseid funktsioone nagu fondid, keel, võtme-väärtuspaaride olemasolu, tabelid jne.
- Andmete ekstraheerimine OCR-iga: Olgu, nüüd, kui robotid korraldasid meie dokumendid üldisesse vormingusse ja klassifitseerisid, on aeg need OCR-tehnika abil digitaliseerida. Sellega saame teksti ja selle asukoha piltide koordinaatides. See aitab dokumente ja andmeid järgmiste sammude jaoks standardida. Samuti kohtame mõningaid olukordi, kus OCR-tarkvara ei suutnud õigesti eristada märke, näiteks "t" versus "i" või "0" versus "O". Just vead, millest soovite optilise tekstituvastuse tarkvara abil kõrvale hiilida, võivad muutuda uueks peavaluks, kui OCR-tehnoloogia ei suuda analüüsida dokumendi nüansse selle kvaliteedi või algse vormi alusel. Siin tuleb pildile masinõpe, mida arutame järgmises etapis.
- ML/DL-i kasutamine intelligentse OCR-i jaoks, kasutades roboteid: Pärast andmete digiteerimist peaks OCR-tarkvara mõistma, millise dokumendiga see töötab ja mis on asjakohane. Kuid traditsiooniline OCR-tarkvara võib dokumentide klassifitseerimisega seotud jõupingutusi suurendada. Seetõttu tuleks tarkvararoboteid koolitada kognitiivsete võimetega, kasutades masinõpet ja süvaõppe tehnikaid, et muuta OCR-id intelligentsemaks. ML-põhised OCR-lahendused suudavad tuvastada dokumendi tüübi ja sobitada seda teie ettevõttes kasutatava teadaoleva dokumenditüübiga. Samuti saavad nad sõeluda ja mõista struktureerimata dokumentide tekstiplokke. Kui lahendus on dokumendi enda kohta rohkem teada saanud, võib see hakata kavatsuse ja tähenduse põhjal asjakohast teavet välja võtma.
- Parem andmete ekstraheerimine ja klassifitseerimine: Andmete ekstraheerimine on dokumendi mõistmise tuum. Nagu arutati eelmises jaotises RPA-de integreerimine OCR-iga selles etapis, valige andmete eraldamise tehnika dokumendi tüübi alusel. RPA-de kaudu saame hõlpsasti konfigureerida, millist ekstraktorit kasutada, kas reeglipõhist või ML-põhist või hübriidmudeli OCR-tehnikat. Pärast teabe väljavõtmist tagastatud usaldus- ja jõudlusmõõdikute põhjal salvestavad tarkvararobotid need edasiseks analüüsiks meie soovitud vormingus. Allpool on pilt sellest, kuidas saame UIPathi RPA tööriistas konfigureerida ekstraktorid ja määrata usaldustaseme.
6. Valideerimine ja volitused: OCR- ja masinõppe mudelid ei ole teabe hankimisel sada protsenti täpsed, seega võib probleemi lahendada inimese sekkumise kihi lisamine robotite abil. See valideerimine toimib nii, et alati, kui robotid tegelevad madala täpsuse ja eranditega, saadavad nad koheselt teatise tegevuskeskusesse, kus töötaja saab andmete kinnitamise või erandite käsitlemise taotluse ning saab kõik ebakindlused ühe klikiga lahendada. Lisaks saame avada tehisintellekti potentsiaali dokumenteerida andmeid aja jooksul, et teha ennustusi ja tuvastada võimalikke kõrvalekaldeid, mis võivad viidata pettusele, dubleerimisele ja muudele vigadele.
Dokumendi mõistmisega robotite integreerimise eelised
- Protsessi automatiseerimine: Peamine põhjus robotite integreerimiseks dokumentide mõistmiseks on kogu protsessi automatiseerimine algusest lõpuni. Peame vaid looma töövoo, et robotid saaksid õppida, istuda ja lõõgastuda. Valideerimisprotsessi ajal peame võib-olla tegelema probleemidega, millest robotid teavitavad, kui tuvastatakse vigu või pettusi.
- Masinõppega robotid: Automatiseerimisprotsessi käigus saame muuta robotid masinõppele vastupidavaks. See tähendab, et robotid saavad ka õppida, kuidas masinõppe mudelid toimivad, ja seeläbi täiustada mudeleid, et saavutada dokumentide teksti ja teabe ekstraheerimisel suurem täpsus ja jõudlus.
- Protsessi laia valikut dokumentide töötlemist: Üldiste ülesannete jaoks, nagu tabelite ja teabe eraldamine, peame looma erinevat tüüpi dokumentide jaoks erinevad süvaõppe torujuhtmed. See toob kaasa mitme rakenduse loomise ja erinevate mudelite juurutamise erinevates serverites, mis nõuab palju vaeva ja aega. Kui robotid on pildil paljude dokumentide jaoks, võib meil olla ainult üks konveier, kus robotid saavad neid klassifitseerida ja seejärel kasutada erinevate ülesannete jaoks sobivat mudelit. Samuti saame API-de kaudu integreerida erinevaid teenuseid ja suhelda andmete toomise osas teiste organisatsioonidega.
- Lihtne juurutada: Dokumentide mõistmiseks pärast torujuhtmete loomist kulub juurutamisprotsess vaid minutiks. Võime lasta robotite poolt pärast koolitust API-sid eksportida või koostada kohandatud RPA-lahendus, mida saab kasutada meie kohalikes süsteemides. Seda tüüpi kasutuselevõtt võib optimeerida ka ettevõtteid ja vähendada kulusid väga minimaalsete riskidega.
Sisestage Nanonets
NanoNets on masinõppeplatvorm, mis võimaldab kasutajatel andmeid koguda arved, kviitungid ja muud dokumendid ilma malli seadistamata. Meil on nüüdisaegsed süvaõppe ja arvutinägemise algoritmid, mis töötavad taga, mis saavad hakkama igasuguste dokumentide mõistmise ülesannetega, nagu OCR, tabeli ekstraheerimine, võtme-väärtuspaari eraldamine. Tavaliselt eksporditakse need API-dena või neid saab erinevate kasutusjuhtude põhjal kohapeal juurutada. Siin on mõned näited,
- Arve mudel: tuvastage võtmeväljad Arved nagu ostja nimi, arve ID, kuupäev, summa jne.
- Laekumiste mudel: tuvastage kviitungite võtmeväljad, nagu müüja nimi, number, kuupäev, summa jne.
- Juhiloa (USA): tuvastage võtmeväljad, nagu juhiloa number, DOB, aegumiskuupäev, väljaandmise kuupäev jne.
- CV: hankige kogemusi, haridust, oskusi, kandidaaditeavet jne.
Nende töövoogude kiiremaks ja töökindlamaks muutmiseks kasutame UiPathi, RPA-tööriista teie dokumentide sujuvaks automatiseerimiseks ilma mallita. Järgmises jaotises käsitleme seda, kuidas saate UiPath Connecti koos Nanonetsiga dokumentide mõistmiseks kasutada. 3 suurimat tegijat RPA turul on UiPath, Automation Anywhere ja Sinine prisma. See blogi keskendub Uipathile.
NanoNets koos UiPathiga
Oleme oma eelmistes jaotistes õppinud looma dokumentide mõistmise konveieri. See nõuab algteadmisi OCR-i, RPA-de ja masinõppe kohta, kuna erinevate ülesannete jaoks on erinevates punktides erinevad lähenemisviisid ja algoritmid. Samuti peame kulutama palju vaeva, et luua närvivõrke, mis mõistavad meie malle, koolitust ja nende juurutamist. Seetõttu töötame Nanonetsis Ui Pathi kallal, et luua dokumentide mõistmiseks sujuv torujuhe, et oleks mugav ja automatiseerida kõike alates dokumentide üleslaadimisest, klassifitseerimisest, OCR-i loomisest ja ML-mudelite integreerimisest. Allpool on pilt selle toimimisest.
Vaatame nüüd kõik need üle ja õpime, kuidas saame nanonette UiPathiga integreerida.
1. samm: registreeruge UiPathis ja laadige alla UiPath Studio
Töövoo loomiseks peame esmalt looma UiPathis konto. Kui olete olemasolev kasutaja, saate otse oma kontole sisse logida, suunates oma UiPathi armatuurlaua ümber. Järgmisena peate alla laadima ja installima UiPath Studio (Community Edition), mis on tasuta.
2. samm: laadige alla Nanonetsi komponent
Järgmiseks seadistage oma arvete töötlemise torujuhe, peate allolevalt lingilt alla laadima Nanonets Connectori.
-> NanoNets OCR – RPA komponent
Allpool on ekraanipilt UiPathi turuplatsist ja Nanonetsi komponendist. Samuti veenduge selle allalaadimiseks, et logiksite UiPathi sisse Windowsi operatsioonisüsteemist.
Teie allalaaditud failid peaksid sisaldama allpool loetletud faile,
UiPath OCR Predict ├── Main.xaml
└── project.json
3. samm: avage fail Main.xaml Nanonets Component
Kontrollimaks, kas Nanonets UiPath töötab või mitte, saate Ui Path Studio abil avada oma Main.xml faili allalaaditud Nanonetsi komponendist. Seejärel näete oma dokumentide töötlemiseks juba loodud konveieri.
4. toiming: koguge oma mudeli ID, API võti ja API lõpp-punkt rakendusest Nanonets APP
Järgmisena saate kasutada mis tahes väljaõppinud OCR-mudeleid rakendusest Nanonets APP ja koguda mudeli ID, API võtme ja lõpp-punkti. Allpool on rohkem üksikasju, et saaksite need kiiresti leida.
Mudeli ID: Logige sisse oma Nanonetsi kontole ja navigeerige jaotisse "Minu mudelid". Saate koolitada uue mudeli või kopeerida olemasoleva mudeli rakenduse ID.
API lõpp-punkt: Saate valida mis tahes olemasoleva mudeli ja klõpsata oma API lõpp-punkti leidmiseks nuppu Integreeri. Allpool on näide sellest, kuidas teie lõpp-punktid välja näevad.
https://app.nanonets.com/api/v2/OCR/Model/XXXXXXX-4840-4c27-8940-d3add200779e/LabelUrls/
3. API võti: navigeerige vahekaardile API võti ja saate kopeerida mis tahes olemasoleva API võtme või luua uue.
5. samm: lisage HTTP-päring, et saada oma meetod ja muutujad kasutajaliidese teele
Nüüd, et integreerida oma mudel nanonetidest kasutajaliidese teele, peate esmalt klõpsama HTTP-päringut ja lisama lõpp-punkti, mille leiate vasakpoolsest navigeerimisribast jaotises Sisend. Allpool on ekraanipilt.
Hiljem lisage kõik muutujad, et luua ühendus oma UiPathi stuudiost Nanonetsi API-ga. Selle jaotise leiate vahekaardi „Muutujad” alumisel paanil. Allpool on ekraanipilt, siin peate värskendama/kopeerima oma API-võtit, lõpp-punkti ja mudeli ID-d.
6. samm: lisage ennustuste jaoks faili asukoht
Lõpuks saate lisada oma faili asukoha atribuutide vahekaardile, nagu on näidatud alloleval ekraanipildil, ja vajutada oma väljundi ennustamiseks ülemisel navigeerimispaneelil esitusnuppu.
Voila! Siin on meie väljundid dokumendile, mida taotlesime alloleval ekraanipildil. Lisateabe töötlemiseks saate lihtsalt lisada failide asukohad ja vajutada käivitamisnuppu.
7. samm – lükake väljund CSV-sse/ERP-i
Lõpuks saame väljundi kohandamiseks soovitud vormingusse lisada faili Main.XML konveierile uusi plokke. Samuti saame selle edastada mis tahes olemasolevatesse ERP-süsteemidesse võrguühenduseta failide või API-kõnede kaudu.
Abi saamiseks võtke meiega ühendust aadressil support@nanonets.com
Veebi aari
Liituge meiega järgmisel teisipäeval RPA-ga OCR-i veebiseminaril, registreeru siin.
viited
[2] Dokumendi mõistmine – tehisintellekti dokumentide töötlemine
[3] RPA OCR – protsesside automatiseerimise tõstmine | TORE
[4] Kuidas kasutada tehisintellekti dokumentide mõistmise optimeerimiseks
[5] https://www.uipath.com/product/document-understanding
[6] NanoNetside kasutamine UiPathi töövoos arvete optilise tekstituvastuse jaoks
Lisalugemist
Teid võivad huvitada meie viimased postitused teemal:
Värskenda:
Lisatud on rohkem lugemismaterjali OCR, RPA kasutamise ja mõju kohta dokumentide mõistmisel.
Allikas: https://nanonets.com/blog/ocr-with-rpa-and-document-understanding-uipath/
- '
- &
- 000
- 2021
- 7
- konto
- raamatupidamine
- tegevus
- ADEelis
- AI
- algoritm
- algoritme
- Materjal: BPA ja flataatide vaba plastik
- analüüs
- API
- API-liidesed
- app
- taotlus
- rakendused
- kunst
- tehisintellekti
- Tehisintellekt (AI)
- Tehisintellekt ja masinõpe
- Automaatika
- automatiseerimine kõikjal
- BEST
- suurim
- Blogi
- Bot
- eest
- ehitama
- Ehitus
- äri
- Kaamerad
- juhtudel
- Põhjus
- põhjustatud
- tegelase äratundmine
- klassifikatsioon
- Cloud
- Pilveplatvorm
- kood
- tunnetuslik
- Kollektsioneerimine
- kommentaarid
- ühine
- kogukond
- Ettevõtted
- komponent
- Arvuti visioon
- usaldus
- sisu
- Parandused
- kulud
- armatuurlaud
- andmed
- andmehaldus
- tegelema
- sügav õpe
- arendaja
- Arendajad
- seadmed
- digitaalne
- dokumendid
- Põikama
- sõidu
- Käsitöö
- efektiivsus
- töötajad
- Lõpp-punkt
- ettevõte
- jms
- eraldada andmed
- kaevandamine
- tunnusjoon
- FUNKTSIOONID
- Valdkonnad
- Lõpuks
- rahastama
- esimene
- Keskenduma
- vorm
- formaat
- pettus
- tasuta
- tulevik
- Gartner
- Üldine
- gif
- hea
- suunata
- Käsitsemine
- peavalu
- siin
- Suur
- Kuidas
- Kuidas
- HTTPS
- tohutu
- Inimestel
- hübriid
- identifitseerima
- pilt
- mõju
- Suurendama
- info
- info
- teabe väljavõtmine
- Intelligentsus
- tahtlus
- küsimustes
- IT
- Võti
- teadmised
- KYC
- keel
- hiljemalt
- viima
- juhtivate
- Õppida
- õppinud
- õppimine
- Tase
- Finantsvõimendus
- litsents
- piiratud
- LINK
- kohalik
- liising
- masinõpe
- juhtimine
- Turg
- turul
- Vastama
- mõõtma
- Kaupmees
- Meetrika
- Microsoft
- ML
- mudel
- Filmid
- Loomulik keel
- Natural Language Processing
- NAVIGATSIOON
- võrgustikud
- Neural
- närvivõrgud
- nlp
- teade
- numbrid
- OCR
- avatud
- tegutsevad
- operatsioonisüsteemi
- Operations
- optiline märkide tuvastamine
- et
- Muu
- teised
- pass
- jõudlus
- pilt
- inimesele
- populaarne
- Postitusi
- võim
- Täpsus
- Ennustused
- Protsessi automatiseerimine
- Programmid
- projekt
- kvaliteet
- tõstab
- valik
- RE
- Lugemine
- vähendama
- Tulemused
- läbi
- robot
- Robotprotsesside automatiseerimine
- robootika
- robotid
- Lõuna-Aafrika
- eeskirjade
- jooks
- jooksmine
- mahl
- säästmine
- Skaala
- skaneerimine
- kraapides
- Ekraan
- sujuv
- Sellers
- Seeria
- Teenused
- komplekt
- lihtne
- So
- tarkvara
- Tarkvarabotid
- Lahendused
- LAHENDAGE
- kulutama
- algus
- riik
- Uuring
- toetama
- süsteem
- süsteemid
- laua väljatõmbamine
- Tehnoloogiad
- Tehnoloogia
- Tulevik
- aeg
- ülemine
- koolitus
- ui
- UiPath
- Värskendused
- us
- USA
- kasutamise juhtumid
- Kasutajad
- väärtus
- Versus
- nägemus
- web
- veebiseminari
- veebilehed
- WHO
- aknad
- jooksul
- Töö
- töövoog
- töötab
- XML
- aasta
- youtube