Zadnja posodobitev: januar 2021.
Ta spletni dnevnik je obsežen pregled uporabe OCR s katerim koli orodjem RPA za avtomatizacijo delovnih tokov dokumentov. Raziskujemo, kako najnovejše tehnologije OCR, ki temeljijo na strojnem učenju, ne zahtevajo pravil ali nastavitve predloge.
RPA ali avtomatizacija robotskih procesov so programska orodja, namenjena odpravljanju ponavljajočih se poslovnih nalog. Več informacijskih direktorjev se obrača nanje, da bi zmanjšali stroške in zaposlenim pomagali, da se osredotočijo na poslovno delo višje vrednosti. Primeri vključujejo odgovarjanje na komentarje na spletnih mestih ali obdelavo naročil strank. Nekoliko bolj zapletena opravila vključujejo delo z dokumenti, kot je ročno napisani obrazci in računi – these typically need to be moved from one legacy system to the other – say your email client to your SAP ERP system where you need to extract data. To je problematičen del.
Večina orodij OCR, ki zajemajo podatke iz teh dokumentov, temelji na predlogah (recimo abby Flexicapture) and don’t scale well on semi-structured documents. There are newer generation machine learning based solutions that typically provide API
integracije, ki lahko zajamejo pare ključ-vrednost iz dokumentov – sistemi podjetja so običajno podedovani in niso odprti za integracijo z zunanjimi API-ji. Po drugi strani so RPA zgrajeni za obvladovanje teh podedovanih sistemskih delovnih tokov, kot je vnos dokumentov iz map in vnašanje rezultatov v ERP ali CRM.
Ker se avtomatizacija robotskih procesov (RPA) in ML razvijata v smeri hiperavtomatizacije, lahko uporabljamo programske robote v povezavi z ML za reševanje kompleksnih nalog, kot so klasifikacija dokumentov, ekstrakcija in optično prepoznavanje znakov. V nedavni študiji je bilo rečeno, da z avtomatizacijo le 29 % funkcij za nalogo z uporabo RPA samo finančni oddelki prihranijo več kot 25,000 ur predelave, ki jo povzročijo človeške napake, kar stane 878,000 USD na leto za organizacijo s 40 polnimi osebje za obračun časa [1]. V tem blogu se bomo učili o uporabi OCR-jev z RPA-ji in se poglobili v poteke dela za razumevanje dokumentov. Spodaj je kazalo.
Definicije in pregled
RPA je na splošno tehnologija, ki pomaga avtomatizirati skrbniška opravila prek botov programske in strojne opreme. Ti boti izkoriščajo prednosti uporabniških vmesnikov; zajemati podatke in manipulirati z aplikacijami, kot to počnejo ljudje. RPA si lahko na primer ogleda niz nalog, opravljenih v GUI, na primer premikanje kazalcev, povezovanje z API-ji, kopiranje in lepljenje podatkov ter oblikuje isto zaporedje dejanj v žičnem okvirju RPA, ki se prevede v kodo. Poleg tega se lahko te naloge v prihodnosti izvajajo brez človeškega posredovanja. Optično prepoznavanje znakov (OCR) je ključna lastnost katere koli rešitve funkcionalne robotske avtomatizacije procesov (RPA). Ta tehnologija se uporablja za branje in pridobivanje besedila iz različnih virov, kot so slike ali pdf v digitalno obliko brez ročnega zajemanja.
Po drugi strani pa je razumevanje dokumenta izraz, ki se uporablja za samodejni opis branja, tolmačenja in delovanja na podlagi podatkov dokumenta. Najpomembnejše v tem procesu je, da programski boti sami opravljajo vse naloge. Ti boti izkoriščajo moč umetne inteligence in strojnega učenja za razumevanje dokumentov kot digitalnih pomočnikov. Na ta način lahko rečemo, da se razumevanje dokumentov pojavi na presečišču obdelave dokumentov, umetne inteligence in RPA.
Kako se lahko roboti naučijo razumeti dokumente z OCR in ML
Preden se najprej poglobimo v razumevanje dokumentov, se pogovorimo o vlogi robotov za razumevanje dokumentov. Ti povsem nevidni pomočniki naredijo naše življenje veliko bolj udobno. Za razliko od filmov in serij ti roboti niso fizične naprave ali programi umetne inteligence, ki sedijo na namizju in pritiskajo gumbe za opravljanje nalog. Te si lahko predstavljamo kot digitalne pomočnike, ki so usposobljeni za obdelavo dokumentov z branjem in uporabo aplikacij, kot to počnemo mi. S funkcionalne strani so roboti dobri pri izboljšanju zmogljivosti in učinkovitosti procesa. Kljub temu, ker so samostojna programska oprema, ne morejo oceniti procesa in sprejemati kognitivnih odločitev. Če pa bo strojno učenje uspešno integrirano, bo robotika postala bolj dinamična in prilagodljiva. Na primer, roboti, ki se uporabljajo za obdelavo dokumentov, upravljanje podatkov in druge funkcije v sprednji in srednji pisarni, bodo izvajali bolj inteligentna dejanja, kot je odstranjevanje podvojenih vnosov ali reševanje neznanih sistemskih izjem v procesu. Poleg tega so roboti usposobljeni za branje, ekstrahiranje, interpretacijo in ukrepanje na podlagi podatkov iz dokumentov z uporabo umetne inteligence (AI).
Kako lahko podjetja integrirajo inteligentni OCR z RPA za izboljšanje delovnih tokov
Ekstrahiranje podatkov iz dokumenta je ključna komponenta za razumevanje dokumenta. V tem razdelku bomo razpravljali o tem, kako lahko integriramo OCR z RPA ali obratno. Prvič, vsi smo vedeli, da obstajajo različne vrste dokumentov v smislu predlog, sloga, oblikovanja in včasih jezika. Zato se ne moremo zanesti na preprosto tehniko OCR za pridobivanje podatkov iz teh dokumentov. Da bi rešili to težavo, bomo znotraj OCR uporabljali tako pristope, ki temeljijo na pravilih, kot pristope, ki temeljijo na modelih, za obdelavo podatkov iz različnih struktur dokumentov. Zdaj bomo videli, kako lahko podjetja, ki izvajajo OCR, integrirajo RPA v svoj obstoječi sistem glede na vrsto dokumentov.
Strukturirani dokumenti: V tej vrsti dokumentov so postavitve in predloge običajno fiksne in skoraj dosledne. Na primer, pomislite na organizacijo, ki opravi KYC z identifikacijskimi dokumenti, ki jih je izdal državni organ, kot je potni list ali vozniško dovoljenje. Vsi ti dokumenti bodo enaki in bodo imeli enaka polja kot osebna številka, ime osebe, starost in nekaj drugih na istih mestih. Razlikujejo pa se le podrobnosti. Morda bo nekaj omejitev, kot je prepolna tabela ali nepopolnjeni podatki.
Običajno priporočeni pristop uporablja predlogo ali mehanizem, ki temelji na pravilih, za pridobivanje informacij za strukturirane dokumente. Ti lahko vključujejo regularne izraze ali preprosto preslikavo položaja in OCR. Zato lahko za integracijo programskih robotov za avtomatizacijo pridobivanja informacij uporabimo že obstoječe predloge ali ustvarimo pravila za naše strukturirane podatke. Uporaba pristopa, ki temelji na pravilih, ima eno pomanjkljivost, ker se zanaša na fiksne dele, že manjše spremembe strukture obrazca lahko povzročijo, da se pravila porušijo.
Polstrukturirani dokumenti: Ti dokumenti imajo enake informacije, vendar so razporejeni na različnih mestih. Na primer, upoštevajte računi ki vsebuje 8-12 enakih polj. V nekaj računi, se lahko naslov trgovca nahaja na vrhu, pri drugih pa na dnu. Običajno ti pristopi, ki temeljijo na pravilih, ne zagotavljajo visoke natančnosti; zato v sliko vključimo modele strojnega učenja in globokega učenja za pridobivanje informacij z OCR. Druga možnost je, da v nekaterih primerih uporabimo hibridne modele, ki vključujejo tako pravila kot modele ML. Nekaj priljubljenih vnaprej usposobljenih modelov je FastRCNN, Attention OCR, Graph Convolutions za pridobivanje informacij v dokumentih. Vendar pa imajo ti modeli spet nekaj pomanjkljivosti; zato merimo delovanje algoritma z metrikami, kot sta natančnost ali ocena zaupanja. Ker se model uči vzorcev in ne deluje po konkretnih pravilih, lahko na začetku naredi napake takoj po popravkih. Vendar pa je rešitev za te pomanjkljivosti – več vzorcev kot model ML obdela, več vzorcev se nauči, da zagotovi natančnost.
Nestrukturirani dokumenti: RPA, today is unable to manage unstructured data directly, hence requiring robots first to extract and create structured data using OCR. Unlike structured and semi-structured documents, unstructured data doesn’t have a few key-values pairs. For example, in a few računi, nekje vidimo naslov trgovca brez kakršnega koli ključnega imena; podobno velja za druga polja, kot so datum, ID računa. Da jih lahko modeli ML natančno obdelajo, se morajo roboti naučiti, kako prevesti napisano besedilo v podatke, ki jih je mogoče uporabiti, kot so e-pošta, telefonska številka, naslov itd. Model se bo nato naučil, da je treba izluščiti 7- ali 10-mestne vzorce številk. kot telefonske številke in ogromno besedilo, ki vsebuje petmestne kode in različne samostalnike kot besedilo. Da bi bili ti modeli natančnejši, lahko uporabimo tudi tehnike iz obdelave naravnega jezika (NLP), kot sta prepoznavanje imenovanih entitet in vdelava besed.
Na splošno je za razumevanje dokumenta najprej bistveno razumeti podatke in nato implementirati OCR z RPA. Nato lahko robota naučimo, da »dela kot jaz«, namesto da načrtujemo postopek korak za korakom, tako da posnamemo proces, kot se dogaja, z zmogljivimi zmožnostmi OCR, kot je opisano zgoraj, z integracijo pravil in algoritmov strojnega učenja. Programski robot sledi vašim klikom in dejanjem na zaslonu ter jih nato spremeni v potek dela, ki ga je mogoče urejati. Če v celoti delate v lokalnih programih, je to toliko, kar bi morali vedeti.
Izzivi OCR, s katerimi se soočajo razvijalci RPA
Videli smo, kako lahko integriramo OCRR z RPA za različne dokumente, vendar obstaja nekaj primerov izzivov, ki jih morajo roboti dobro obvladati. Razpravljajmo o njih zdaj!
- Šibki ali nedosledni podatki: Podatki igrajo ključno vlogo pri razumevanju dokumenta. V večini primerov se dokumenti skenirajo s kamerami, kjer obstaja možnost izgube oblikovanja dokumenta med skeniranjem besedila (tj. krepko, ležeče in podčrtano ni vedno prepoznano). Včasih lahko OCR izvleče besedilo na napačen način, kar povzroči črkovalne napake, nepravilne prelome odstavkov, kar zmanjša splošno učinkovitost robotov. Zato je obravnavanje vseh manjkajočih vrednosti in zajemanje podatkov z višjo natančnostjo bistvenega pomena za doseganje višje natančnosti za OCR.
- Nepravilna usmerjenost strani v dokumentih: Usmerjenost in poševnost strani sta prav tako ena od pogostih težav, ki vodijo do nepravilnega popravka besedila OCR. To se običajno zgodi, ko so dokumenti med fazo zbiranja podatkov nepravilno skenirani. Da bi to premagali, bomo morali robotom prijaviti nekaj funkcij, kot je samodejno prilagajanje strani, samodejni filter, da lahko omogočijo povečanje kakovosti skeniranega dokumenta in prejemanje pravilnih podatkov na izpisu.
- Težave pri integraciji: Vsa orodja RPA ne delujejo dobro v okoljih oddaljenega namizja – povzročajo zrušitve in kritične težave pri avtomatizaciji. Še več, razvijalec RPA mora vedeti, katera rešitev OCR bo najboljša za določen primer. Poleg tega mora razvijalec RPA za delo s posebnimi orodji za avtomatizacijo izbrati samo omejeno tehnologijo OCR, ki sta jo ustvarila Microsoft, Google. Zato je integracija naših prilagojenih algoritmov in modelov včasih zahtevna.
- Vse besedilo je premešano: Za primere uporabe v resničnem življenju je besedilo, ki ga zajame generični OCR, vse kodirano in nima pomembnih informacij, ki bi jih roboti lahko uporabili za izvajanje pomembnih operacij. Razvijalci RPA potrebujejo močno podporo ML, da lahko gradijo uporabne aplikacije.
Cevovod za potek dela za razumevanje dokumenta
V prejšnjih razdelkih smo videli, kako roboti pomagajo izvajati OCR za različne vrste dokumentov. Toda OCR je le tehnika, ki pretvori slike ali druge datoteke v besedilo. Zdaj si bomo v tem razdelku ogledali potek dela Razumevanje dokumentov vse od začetka zbiranja dokumentov do končnega shranjevanja teh pomembnih informacij v želeno obliko.
- Zaužijte dokument iz mape s svojim Botom: To je prvi korak pri doseganju razumevanja dokumentov prek botov. Tukaj bomo pridobili dokument, ki se nahaja na platformi v oblaku (z uporabo API-ja) ali iz lokalnega računalnika. V nekaj primerih, če so naši dokumenti na spletnih straneh, lahko avtomatiziramo strganje skriptov prek botov, kjer lahko pravočasno pridobijo dokumente.
- Vrsta dokumenta: After we fetch the data, it’s essential to understand the type of document and the format with which they are saved in our systems, as sometimes, we receive data from different sources in various file formats such as PDF, PNG, and JPG. Not just the file types, sometimes when the documents are scanned with phone cameras, a few challenging problems like image skewness, rotation, brightness, or low-resolution should also be handled. Thereby, we’ll have to make sure that bots classify these documents into the structured, semi-structured, or unstructured category, thus saving it in a generic format. The classification task is achieved by comparing the documents with templates and analyzing features like fonts, language, presence of key-value pairs, tables, etc.
- Ekstrahiranje podatkov z OCR: V redu, zdaj ko so boti naše dokumente uredili v generično obliko in jih klasificirali, je čas, da jih digitaliziramo s tehniko OCR. S tem bomo imeli besedilo, njegovo lokacijo v koordinatah slik. To pomaga standardizirati dokumente in podatke za naslednje korake. Nekaj jih srečamo tudi, ko programska oprema OCR ni mogla pravilno razlikovati med znaki, na primer 't' proti 'i' ali '0' proti 'O'. Prav napake, ki se jim želite izogniti s programsko opremo OCR, lahko postanejo novi glavoboli, če tehnologija OCR ne more analizirati odtenkov dokumenta na podlagi njegove kakovosti ali izvirne oblike. Tu nastopi strojno učenje, o katerem bomo razpravljali v naslednjem koraku.
- Izkoriščanje ML/DL za inteligentno OCR z uporabo botov: Ko so podatki digitalizirani, mora programska oprema OCR razumeti, s kakšno vrsto dokumenta dela in kaj je pomembno. Toda tradicionalna programska oprema za optično prepoznavanje znakov ima težave pri razvrščanju dokumentov. Zato je treba programske robote usposobiti za kognitivne sposobnosti z uporabo strojnega učenja in tehnik globokega učenja, da bodo OCR bolj inteligentni. Rešitve OCR, ki temeljijo na ML, lahko identificirajo vrsto dokumenta in jo primerjajo z znano vrsto dokumenta, ki ga uporablja vaše podjetje. Lahko tudi razčlenijo in razumejo bloke besedila v nestrukturiranih dokumentih. Ko rešitev ve več o samem dokumentu, lahko začne pridobivati ustrezne informacije na podlagi namena in pomena.
- Boljše pridobivanje in razvrščanje podatkov: Pridobivanje podatkov je jedro razumevanja dokumenta. Kot je razloženo v prejšnjem razdelku o integraciji RPA z OCR v tem koraku, izberite tehniko ekstrakcije podatkov glede na vrsto dokumenta. Prek RPA lahko preprosto konfiguriramo, kateri ekstraktor naj uporabimo, bodisi tehniko OCR, ki temelji na pravilih, ML ali hibridni model. Na podlagi meritev zaupanja in uspešnosti, ki se vrnejo po ekstrakciji informacij, jih bodo programski roboti shranili v naši želeni obliki za nadaljnjo analizo. Spodaj je slika, kako lahko konfiguriramo ekstraktorje in nastavimo stopnjo zaupanja v orodju RPA z UIPath.
6. Validacija in krepitev vpogledov: modeli OCR in strojnega učenja niso stoodstotno natančni v smislu pridobivanja informacij, zato lahko dodajanje sloja človeškega posredovanja s pomočjo robotov reši težavo. To preverjanje veljavnosti deluje tako, da vsakič, ko se roboti spopadejo z nizko natančnostjo in izjemami, nemudoma pošljejo obvestilo centru za ukrepanje, kjer lahko zaposleni prejme zahtevo za potrditev podatkov ali obravnavo izjem in lahko z nekaj kliki reši vse negotovosti. Poleg tega lahko sprostimo potencial umetne inteligence za dokumentiranje podatkov skozi čas, da naredimo napovedi in prepoznamo morebitne anomalije, ki lahko kažejo na goljufijo, podvajanje in druge napake.
Prednosti integracije robotov z razumevanjem dokumentov
- Avtomatiziraj postopek: Ključni razlog za integracijo botov za razumevanje dokumentov je avtomatizacija celotnega procesa od začetka do konca. Vse, kar moramo storiti, je ustvariti potek dela, da se boti učijo, usedejo in sprostijo. Med postopkom preverjanja bomo morda morali obravnavati težave, o katerih so obvestili roboti, kjer so ugotovljene kakršne koli napake ali goljufije.
- Boti s strojnim učenjem: Med postopkom avtomatizacije lahko robote naredimo odporne na strojno učenje. To pomeni, da se lahko roboti tudi naučijo, kako delujejo modeli strojnega učenja, in s tem izboljšajo modele, da dosežejo višjo natančnost in zmogljivost za črpanje besedila in informacij iz dokumentov.
- Proces Širok obseg obdelave dokumentov: Za splošne naloge, kot je pridobivanje tabel in informacij, bomo morali ustvariti različne cevovode globokega učenja za različne vrste dokumentov. To vodi v gradnjo več aplikacij in uvajanje različnih modelov na različne strežnike, kar zahteva veliko truda in časa. Ko so roboti na sliki za široko paleto dokumentov, bi lahko imeli samo en cevovod, v katerem jih lahko roboti razvrstijo in nato uporabijo ustrezen model za različne naloge. Prav tako lahko integriramo različne storitve prek API-jev in komuniciramo z drugimi organizacijami v smislu pridobivanja podatkov.
- Enostaven za namestitev: Za razumevanje dokumenta po tem, ko so cevovodi ustvarjeni, je postopek uvajanja le minuta. API-je lahko izvozimo z roboti po usposabljanju ali pa zgradimo rešitev RPA po meri, ki jo lahko uporabimo v naših lokalnih sistemih. Ta vrsta uvajanja lahko tudi optimizira podjetja in lahko zmanjša izdatke z zelo minimalnimi tveganji.
Vstopite v Nanonets
NanoNets je platforma strojnega učenja, ki uporabnikom omogoča zajemanje podatkov iz računi, potrdila in druge dokumente brez kakršne koli nastavitve predloge. Imamo najsodobnejše algoritme globokega učenja in računalniškega vida, ki delujejo na zadnji strani in lahko obravnavajo vse vrste nalog razumevanja dokumentov, kot je OCR, ekstrakcija tabel, ekstrakcija parov ključ-vrednost. Običajno se izvozijo kot API-ji ali pa jih je mogoče namestiti na mestu uporabe na podlagi različnih primerov uporabe. Tukaj je nekaj primerov,
- Model računa: določite ključna polja iz Računi kot so ime kupca, ID računa, datum, znesek itd.
- Model potrdil: Prepoznajte ključna polja iz potrdil, kot so ime prodajalca, številka, datum, znesek itd.
- Vozniško dovoljenje (ZDA): določite ključna polja, kot so številka dovoljenja, DOB, datum poteka, datum izdaje itd.
- Življenjepisi: izvleček izkušenj, izobrazbe, nabora spretnosti, podatkov o kandidatih itd.
Da bi bili ti delovni tokovi hitrejši in robustnejši, uporabljamo UiPath, orodje RPA za brezhibno avtomatizacijo vaših dokumentov brez kakršne koli predloge. V naslednjem razdelku bomo preučili, kako lahko uporabite UiPath Connect z Nanoneti za razumevanje dokumentov. Trije največji igralci na trgu RPA so UiPath, Automation Anywhere in Modra prizma. Ta blog se osredotoča na Uipath.
NanoNets z UiPath
V prejšnjih razdelkih smo se naučili ustvariti cevovod za razumevanje dokumentov. Zahteva osnovno poznavanje OCR, RPA in strojnega učenja, saj obstajajo različni pristopi in algoritmi za različne naloge na različnih točkah. Prav tako moramo vložiti veliko truda v izgradnjo nevronskih mrež, ki razumejo naše predloge, usposabljanje in njihovo uvajanje. Zato, da bi bili udobni in avtomatizirali vse, od nalaganja dokumentov, njihovega razvrščanja, gradnje OCR, integracije modelov ML, v Nanonetsu delamo na Ui Path, da bi ustvarili brezšivni cevovod za razumevanje dokumentov. Spodaj je slika, kako to deluje.
Zdaj pa si oglejmo vsakega od teh in se naučimo, kako lahko Nanonets integriramo z UiPath.
1. korak: Prijavite se pri UiPath in prenesite UiPath Studio
Če želite ustvariti potek dela, bomo morali najprej ustvariti račun v UiPath. Če ste obstoječi uporabnik, se lahko neposredno prijavite v svoj račun in preusmerite svojo nadzorno ploščo UiPath. Nato boste morali prenesti in namestiti UiPath Studio (Community Edition), ki je brezplačen.
2. korak: Prenesite komponento Nanonets
Nato nastavite svoj cevovod za obdelavo računov, boste morali Nanonets Connector prenesti s spodnje povezave.
-> NanoNets OCR – komponenta RPA
Spodaj je posnetek zaslona UiPath Marketplace in komponente Nanonets. Če želite to prenesti, se prepričajte, da ste prijavljeni v UiPath iz operacijskega sistema Windows.
Vaše prenesene datoteke morajo vsebovati spodaj navedene datoteke,
UiPath OCR Predict ├── Main.xaml
└── project.json
3. korak: Odprite datoteko Main.xaml Nanonets Component
Če želite preveriti, ali Nanonets UiPath deluje ali ne, lahko odprete svojo datoteko Main.xml iz prenesene komponente Nanonets s programom Ui Path Studio. Nato lahko vidite svoj cevovod, ki je že ustvarjen za vas za obdelavo dokumentov.
4. korak: Zberite svoj ID modela, ključ API in končno točko API iz aplikacije Nanonets APP
Nato lahko uporabite katerega koli od usposobljenih modelov OCR iz aplikacije Nanonets APP in zberete ID modela, ključ API-ja in končno točko. Spodaj je več podrobnosti, da jih boste hitro našli.
ID modela: Prijavite se v svoj račun Nanonets in pojdite na »Moji modeli«. Lahko usposobite nov model ali kopirate ID aplikacije obstoječega modela.
Končna točka API-ja: Izberete lahko kateri koli obstoječi model in kliknete Integriraj, da poiščete svojo končno točko API. Spodaj je primer, kako so videti vaše končne točke.
https://app.nanonets.com/api/v2/OCR/Model/XXXXXXX-4840-4c27-8940-d3add200779e/LabelUrls/
3. Ključ API: Pomaknite se do zavihka Ključ API in lahko kopirate kateri koli obstoječi ključ API ali ustvarite novega.
5. korak: dodajte zahtevo HTTP, da dobite svojo metodo in spremenljivke v poti uporabniškega vmesnika
Zdaj, da integrirate svoj model iz Nanonetov v pot uporabniškega vmesnika, morate najprej klikniti Zahtevo HTTP in dodati Končno točko, ki jo najdete na levi navigaciji pod razdelkom Vnos. Spodaj je posnetek zaslona.
Pozneje dodajte vse svoje spremenljivke, da vzpostavite povezavo iz studia UiPath z API-jem Nanonets. Ta razdelek najdete v spodnjem podoknu na zavihku »Spremenljivke«. Spodaj je posnetek zaslona, tukaj boste morali posodobiti/kopirati ključ API-ja, končno točko in ID modela vašega modela.
6. korak: dodajte lokacijo datoteke za napovedi
Nazadnje lahko dodate lokacijo svoje datoteke pod zavihek z atributi, kot je prikazano na spodnjem posnetku zaslona, in pritisnete gumb za predvajanje na zgornji vrstici za krmarjenje, da predvidite rezultate.
Voila! Tukaj so naši rezultati za dokument, ki smo ga zahtevali na spodnjem posnetku zaslona. Če želite obdelati več, lahko preprosto dodate svoje lokacije datotek in pritisnete gumb za zagon.
Korak 7 – Potisnite izhod v CSV / ERP
Nazadnje, za prilagoditev našega izhoda vaši želeni obliki lahko dodamo nove bloke v vaš cevovod v datoteki Main.XML. To lahko potisnemo tudi v vse obstoječe sisteme ERP prek datotek brez povezave ali API klicev.
Za kakršno koli pomoč nas kontaktirajte na support@nanonets.com
Webinar
Pridružite se nam na spletnem seminarju naslednji torek o OCR z RPA, registriraj se tukaj.
Reference
[2] Razumevanje dokumentov – obdelava dokumentov z umetno inteligenco
[3] RPA OCR – dvig avtomatizacije procesov | LEPO
[4] Kako uporabiti AI za optimizacijo razumevanja dokumenta
[5] https://www.uipath.com/product/document-understanding
[6] Uporaba NanoNets v delovnem toku UiPath za OCR na računih
Nadaljnje branje
Morda vas bodo zanimale naše zadnje objave na:
Posodobitev:
Dodano več gradiva za branje o uporabi in vplivu OCR, RPA pri razumevanju dokumentov.
Vir: https://nanonets.com/blog/ocr-with-rpa-and-document-understanding-uipath/
- '
- &
- 000
- 2021
- 7
- Račun
- računovodstvo
- Ukrep
- Prednost
- AI
- algoritem
- algoritmi
- vsi
- Analiza
- API
- API-ji
- aplikacija
- uporaba
- aplikacije
- Umetnost
- Umetna inteligenca
- Umetna inteligenca (AI)
- Umetna inteligenca in strojno učenje
- Avtomatizacija
- avtomatizacija kjerkoli
- BEST
- največji
- Blog
- Bot
- bote
- izgradnjo
- Building
- poslovni
- kamere
- primeri
- Vzrok
- povzročilo
- prepoznavanje znakov
- Razvrstitev
- Cloud
- Platforma v oblaku
- Koda
- kognitivni
- Zbiranje
- komentarji
- Skupno
- skupnost
- Podjetja
- komponenta
- Računalniška vizija
- zaupanje
- Vsebina
- Popravki
- stroški
- Armaturna plošča
- datum
- Upravljanje podatkov
- ponudba
- globoko učenje
- Razvojni
- Razvijalci
- naprave
- digitalni
- Dokumenti
- Dodge
- vožnjo
- Izobraževanje
- učinkovitosti
- E-naslov
- Zaposleni
- Končna točka
- Podjetje
- itd
- izvlecite podatke
- pridobivanje
- Feature
- Lastnosti
- Področja
- končno
- financiranje
- prva
- Osredotočite
- obrazec
- format
- goljufija
- brezplačno
- Prihodnost
- Gartner
- splošno
- gif
- dobro
- vodi
- Ravnanje
- glavoboli
- tukaj
- visoka
- Kako
- Kako
- HTTPS
- velika
- Ljudje
- Hybrid
- identificirati
- slika
- vpliv
- Povečajte
- info
- Podatki
- pridobivanje informacij
- Intelligence
- namen
- Vprašanja
- IT
- Ključne
- znanje
- KYC
- jezik
- Zadnji
- vodi
- vodi
- UČITE
- naučili
- učenje
- Stopnja
- Vzvod
- Licenca
- Limited
- LINK
- lokalna
- kraj aktivnosti
- strojno učenje
- upravljanje
- Tržna
- tržnica
- Stave
- merjenje
- Trgovec
- Meritve
- Microsoft
- ML
- Model
- filmi
- Naravni jezik
- Obdelava Natural Language
- ostalo
- omrežij
- Nevronski
- nevronske mreže
- nlp
- Obvestilo
- številke
- OCR
- odprite
- deluje
- operacijski sistem
- operacije
- optično prepoznavanje znakov
- Da
- Ostalo
- drugi
- potni list
- performance
- slika
- platforma
- Popular
- Prispevkov
- moč
- Precision
- Napovedi
- Avtomatizacija procesov
- programi
- Projekt
- kakovost
- povečuje
- območje
- RE
- reading
- zmanjša
- Rezultati
- pregleda
- robot
- Robotska procesna avtomatizacija
- robotika
- roboti
- rpa
- pravila
- Run
- tek
- sap
- shranjevanje
- Lestvica
- skeniranje
- strganje
- Zaslon
- brezšivne
- Prodajalci
- Serija
- Storitve
- nastavite
- Enostavno
- So
- Software
- Programska oprema
- rešitve
- SOLVE
- preživeti
- Začetek
- Država
- študija
- podpora
- sistem
- sistemi
- tabela ekstrakcija
- Tehnologije
- Tehnologija
- Prihodnost
- čas
- vrh
- usposabljanje
- ui
- UiPath
- Nadgradnja
- us
- ZDA
- primeri uporabe
- Uporabniki
- vrednost
- Proti
- Vizija
- web
- Webinar
- spletne strani
- WHO
- okna
- v
- delo
- potek dela
- deluje
- XML
- leto
- youtube