Átfogó útmutató az OCR-hez RPA-val és a dokumentumok megértésével

Újra kiadta Platón

Követő: 0

Utolsó frissítés: 2021. január.

Ez a blog átfogó áttekintést nyújt az OCR használatáról bármely RPA-eszközzel a dokumentum-munkafolyamatok automatizálására. Megvizsgáljuk, hogy a legújabb, gépi tanuláson alapuló OCR-technológiákhoz nincs szükség szabályokra vagy sablonbeállításra.

Az RPA-k vagy a Robotic Process automatizálás olyan szoftvereszközök, amelyek célja az ismétlődő üzleti feladatok kiküszöbölése. Egyre több informatikai igazgató fordul hozzájuk, hogy csökkentse a költségeket, és segítse az alkalmazottakat abban, hogy a magasabb értékű üzleti munkára összpontosítsanak. Ilyen például a webhelyeken tett megjegyzésekre adott válasz vagy az ügyfelek megrendelésének feldolgozása. Valamivel összetettebb feladatok közé tartozik a dokumentumok kezelése, mint pl kézzel írt nyomtatványok és a számlák – ezeket általában egyik örökölt rendszerből a másikba kell áthelyezni – mondjuk az e-mail klienst az SAP ERP rendszerébe, ahol adatokat kell kinyernie. Ez a problémás rész.

A legtöbb OCR-eszköz, amely adatokat rögzít ezekből a dokumentumokból, sablon alapú (mondjuk Abby Flexicapture), és nem méretezhető jól a félig strukturált dokumentumokon. Vannak újabb generációs gépi tanuláson alapuló megoldások, amelyek jellemzően API-t biztosítanak
olyan integrációk, amelyek kulcs-érték párokat képesek rögzíteni a dokumentumokból – a vállalati rendszerek általában örököltek, és nem nyitottak a külső API-kkal való integrációra. Másrészt az RPA-k úgy vannak kialakítva, hogy kezeljék ezeket a régebbi rendszer-munkafolyamatokat, mint például a dokumentumok beolvasása mappákból és az eredmények bevitele az ERP-kbe vagy a CRM-ekbe.

Mivel a Robotic Process Automation (RPA) és az ML a hiperautomatizálás felé fejlődik, az ML-szel együtt szoftverbotokat is használhatunk olyan összetett feladatok kezelésére, mint a dokumentumok osztályozása, kibontása és az optikai karakterfelismerés. Egy nemrégiben készült tanulmányban azt mondták, hogy a funkciók mindössze 29%-ának automatizálásával egy feladathoz RPA-k segítségével a pénzügyi osztályok önmagukban több mint 25,000 878,000 órányi utómunkálatot takarítanak meg, ami emberi hibák okozta 40 1 dollár költséget jelent évente egy olyan szervezetnél, ahol XNUMX teljes időszámító személyzet [XNUMX]. Ebben a blogban az OCR-ek RPA-kkal való használatáról fogunk tanulni, és mélyrehatóan belemerülünk a dokumentummegértési munkafolyamatokba. Alább látható a tartalomjegyzék.

Definíciók és áttekintés

Az RPA általában egy olyan technológia, amely segít automatizálni az adminisztrációs feladatokat szoftver-hardveres robotokon keresztül. Ezek a robotok kihasználják a felhasználói felület előnyeit; az adatok rögzítéséhez és az alkalmazások kezeléséhez, ahogyan az emberek teszik. Például egy RPA megtekintheti a grafikus felhasználói felületen végrehajtott feladatok sorozatát, például mozgathatja a kurzorokat, csatlakozhat API-khoz, másolhatja és beillesztheti az adatokat, és ugyanazt a műveletsort fogalmazhatja meg egy RPA drótvázban, amely kódra fordítódik. Továbbá ezek a feladatok a jövőben emberi beavatkozás nélkül is elvégezhetők. Az optikai karakterfelismerés (OCR) minden funkcionális robotizált folyamatautomatizálási (RPA) megoldás kulcsfontosságú jellemzője. Ezt a technológiát szövegek olvasására és kinyerésére használják különböző forrásokból, például képekből vagy pdfs digitális formátumba manuális rögzítés nélkül.

Másrészt a Dokumentummegértés az a kifejezés, amely automatikusan leírja a dokumentumadatok olvasását, értelmezését és az azokon végzett műveleteket. Ebben a folyamatban a legfontosabb az, hogy a szoftverbotok maguk hajtanak végre minden feladatot. Ezek a robotok kihasználják a mesterséges intelligencia és a gépi tanulás erejét, hogy digitális asszisztensként értelmezzék a dokumentumokat. Így elmondhatjuk, hogy a dokumentumértés a dokumentumfeldolgozás, az AI és az RPA metszéspontjában jelenik meg.

A dokumentumértés a dokumentumfeldolgozás, az AI és az RPA metszéspontjában jelenik meg. [Kép forrása: Ui Path Document Understanding [2] ]

Hogyan tanulhatják meg a robotok a dokumentumok megértését OCR és ML segítségével

Mielőtt mélyebben belemerülnénk a dokumentumértésbe, beszéljünk a Robots for Document Understanding szerepéről. Ezek a teljesen láthatatlan segítők sokkal kényelmesebbé teszik az életünket. A filmekkel és sorozatokkal ellentétben ezek a robotok nem fizikai eszközök vagy mesterséges intelligencia programok, amelyek az asztalon ülnek és gombokat nyomnak a feladatok elvégzéséhez. Tekinthetjük őket digitális asszisztenseknek, akik képzettek arra, hogy a dokumentumokat úgy dolgozzák fel, olvassák és használják az alkalmazásokat, mint mi. A funkcionális oldalon a robotok jók a folyamatok teljesítményének és hatékonyságának javításában. Ennek ellenére önálló szoftverként nem tudják értékelni a folyamatot és kognitív döntéseket hozni. Ha azonban a gépi tanulást sikeresen integrálják, a robotika dinamikusabbá és alkalmazkodóbbá válik. Például a dokumentumfeldolgozáshoz, adatkezeléshez és egyéb funkciókhoz használt robotok az első és a középső irodában intelligensebb műveleteket hajtanak végre, mint például a duplikált bejegyzések kiküszöbölése vagy az ismeretlen rendszerkivételek megoldása a folyamat során. Ezenkívül a robotokat arra tanítják, hogy mesterséges intelligencia (AI) segítségével olvassák, kinyerjék, értelmezzék a dokumentumokból származó adatokat, és azokra reagáljanak.

Hogyan integrálhatják a vállalatok az intelligens OCR-t az RPA-val a munkafolyamatok javítása érdekében?

A dokumentumadatok kinyerése a dokumentum megértésének döntő összetevője. Ebben a részben azt fogjuk megvitatni, hogyan integrálhatjuk az OCR-t RPA-val és fordítva. Először is mindannyian tudtuk, hogy sablonok, stílusok, formázások és néha nyelvek tekintetében is különböző típusú dokumentumok léteznek. Ezért nem hagyatkozhatunk egyszerű OCR-technikára az adatok kinyerésére ezekből a dokumentumokból. A probléma megoldása érdekében az OCR-en belül szabályalapú megközelítéseket és modellalapú megközelítéseket is alkalmazunk a különböző dokumentumstruktúrákból származó adatok kezelésére. Most meglátjuk, hogy az OCR-t végző vállalatok hogyan integrálhatják az RPA-kat meglévő rendszerükbe a dokumentumok típusa alapján.

Strukturált dokumentumok: Az ilyen típusú dokumentumokban az elrendezések és a sablonok általában rögzítettek és szinte konzisztensek. Vegyünk például egy olyan szervezetet, amely államilag kibocsátott személyi igazolványokkal, például útlevéllel vagy jogosítvánnyal végez KYC-t. Ezek a dokumentumok azonosak lesznek, és ugyanazokkal a mezőkkel rendelkeznek, mint az azonosítószám, a személy neve, az életkor és néhány más, ugyanazon pozícióban. De csak a részletek változnak. Lehetséges, hogy néhány megszorítás létezik, például a tábla túlcsordulása vagy a nem iktatott adatok.

Az ajánlott megközelítés általában sablont vagy szabályalapú motort használ a strukturált dokumentumok információinak kinyerésére. Ezek közé tartozhatnak a reguláris kifejezések vagy az egyszerű pozícióleképezés és az OCR. Ezért a szoftverrobotok integrálásához az információkinyerés automatizálása érdekében használhatunk már meglévő sablonokat, vagy létrehozhatunk szabályokat strukturált adatainkhoz. A szabályalapú megközelítésnek van egy hátránya, mivel rögzített részekre támaszkodik, még az űrlapszerkezet kisebb változtatásai is a szabályok meghibásodását okozhatják.

Félig strukturált dokumentumok: Ezek a dokumentumok ugyanazokat az információkat tartalmazzák, de különböző pozíciókban vannak elrendezve. Például fontolja meg számlák 8-12 azonos mezőt tartalmaz. Néhány számlák, a kereskedő címe felül, másoknál pedig alul található. Ezek a szabályalapú megközelítések jellemzően nem adnak nagy pontosságot; ezért a gépi tanulási és a mély tanulási modelleket beépítjük a képbe az OCR segítségével történő információkinyeréshez. Alternatív megoldásként bizonyos esetekben használhatunk hibrid modelleket, amelyek egyaránt tartalmaznak szabályokat és ML modelleket. Néhány népszerű előre betanított modell a FastRCNN, az Attention OCR, a Graph Convolutions a dokumentumokból való információ kinyerésére. Ezeknek a modelleknek azonban ismét van néhány hátránya; ezért az algoritmus teljesítményét olyan mérőszámok segítségével mérjük, mint a pontosság vagy a megbízhatósági pontszám. Mivel a modell mintákat tanul, nem pedig konkrét szabályok alapján működik, kezdetben a javítások után hibákat követhet el. Azonban a megoldás ezekre a hátrányokra – minél több mintát dolgoz fel az ML modell, annál több mintát tanul meg a pontosság biztosítása érdekében.

Strukturálatlan dokumentumok: Az RPA ma nem képes közvetlenül kezelni a strukturálatlan adatokat, ezért a robotoknak először OCR segítségével kell strukturált adatokat kivonniuk és létrehozniuk. A strukturált és félig strukturált dokumentumokkal ellentétben a strukturálatlan adatokhoz nem tartozik néhány kulcs-érték pár. Például néhányban számlák, látunk valahol egy kereskedő címet kulcsnév nélkül; hasonlóképpen ugyanezt figyeljük meg más mezőknél is, például dátum, számlaazonosító. Ahhoz, hogy az ML modellek ezeket pontosan feldolgozhassák, a robotoknak meg kell tanulniuk, hogyan fordítsák le az írott szöveget használható adatokká, például e-mail címekké, telefonszámokká, címekké stb. A modell ezután megtanulja, hogy 7 vagy 10 jegyű számmintákat kell kivonni. telefonszámként és hatalmas szövegként, amely ötjegyű kódokat és különböző főneveket tartalmaz szövegként. A modellek pontosabbá tételéhez a Natural Language Processing (NLP) technikáit is használhatjuk, például a Névleges entitás felismerést és a Word Beágyazást.

Összességében a dokumentumok megértéséhez először elengedhetetlen az adatok megértése, majd az OCR megvalósítása az RPA-kkal. Ezután ahelyett, hogy lépésről lépésre feltérképeznénk egy folyamatot, megtaníthatjuk a robotot arra, hogy „csináljon úgy, ahogy én csinálom”, úgy, hogy a folyamatot úgy rögzíti, ahogyan az történik, hatékony OCR-képességekkel, amint azt fentebb tárgyaltuk, szabályok és gépi tanulási algoritmusok integrálásával. A szoftverrobot követi kattintásait és műveleteit a képernyőn, majd szerkeszthető munkafolyamattá alakítja azokat. Ha teljes egészében helyi programokban dolgozik, ez annyi, amennyit tudnia kell.

OCR Az RPA fejlesztői előtt álló kihívások

Láttuk, hogyan integrálhatjuk az OCRR-t az RPA-kkal különböző dokumentumokhoz, de van néhány olyan kihívás, ahol a robotoknak jól kell kezelniük. Most beszéljük meg őket!

Gyenge vagy inkonzisztens adatok: Az adatok döntő szerepet játszanak a dokumentumértésben. A legtöbb esetben a dokumentumokat olyan kamerákkal szkennelik, amelyeknél fennáll az esély a dokumentum formázásának elvesztésére a szövegbeolvasás során (azaz a félkövér, dőlt és aláhúzott betűket nem mindig ismeri fel a rendszer). Előfordulhat, hogy az OCR nem megfelelő módon bontja ki a szöveget, ami helyesírási hibákhoz, szabálytalan bekezdéstörésekhez vezethet, ami csökkenti a robotok általános teljesítményét. Ezért az összes hiányzó érték kezelése és az adatok nagyobb pontosságú rögzítése elengedhetetlen az OCR nagyobb pontosságának eléréséhez.
Helytelen oldaltájolás a dokumentumokban: Az oldaltájolás és a ferdeség szintén az egyik gyakori probléma, amely az OCR helytelen szövegjavításához vezet. Ez általában akkor fordul elő, ha a dokumentumokat hibásan szkennelik be az adatgyűjtési szakaszban. Ennek kiküszöbölése érdekében néhány funkciót deklarálnunk kell a robotoknak, mint például az automatikus oldalhoz igazítás, az automatikus szűrés, hogy lehetővé tegyék a szkennelt dokumentum minőségének javítását és a helyes adatok fogadását a kimeneten.
Integrációs problémák: Nem minden RPA-eszköz teljesít jól távoli asztali környezetekben – összeomlásokat és kritikus problémákat okoznak az automatizálásban. Sőt, az RPA fejlesztőjének tudnia kell, hogy egy adott esetre melyik OCR megoldás a legjobb. Ezenkívül az RPA fejlesztőjének bizonyos automatizálási eszközökkel való munkához csak korlátozott OCR technológiát kell választania a Microsoft és a Google által. Ezért egyéni algoritmusaink és modelljeink integrálása néha kihívást jelent.
Az egész szöveg kódolt szöveg: Valós felhasználási esetekben az általános OCR-rel rögzített szöveg össze van kódolva, és nem tartalmaz olyan érdemi információt, amelyet a botok felhasználhatnának jelentős műveletek végrehajtására. Az RPA fejlesztőknek erős ML támogatásra van szükségük ahhoz, hogy hasznos alkalmazásokat készíthessenek.

A dokumentummegértési munkafolyamat folyamata

Az előző részekben láthattuk, hogy a robotok hogyan segítik az OCR végrehajtását a különböző típusú dokumentumokhoz. De az OCR csak egy technika, amely képeket vagy más fájlokat alakít át szöveggé. Ebben a részben a Dokumentummegértés munkafolyamatával fogunk foglalkozni, a dokumentumok összegyűjtésének kezdetétől egészen a végső elmentéséig a megfelelő információk kívánt formátumba történő elmentéséig.

Foglalja be a dokumentumot egy mappából a Bot segítségével: Ez az első lépés a dokumentumok botokon keresztüli megértésének elérésében. Itt vagy egy felhőplatformon (API segítségével), vagy egy helyi gépről fogjuk lekérni a dokumentumot. Néhány esetben, ha a dokumentumaink weboldalakon vannak, automatizálhatjuk a szkriptek lekaparását a botokon keresztül, ahol a dokumentumokat időben lekérhetik.
Dokumentum típus: Az adatok lekérése után elengedhetetlen, hogy megértsük a dokumentum típusát és formátumát, amellyel a rendszerünkben mentésre kerülnek, mivel néha különböző forrásokból kapunk adatokat különböző fájlformátumokban, mint pl. PDF, PNG és JPG. Nem csak a fájltípusok, hanem néha, amikor a dokumentumokat telefonkamerával szkenneljük, néhány kihívást jelentő problémát is kezelni kell, mint például a kép ferdesége, elforgatása, fényereje vagy alacsony felbontása. Ezáltal meg kell győződnünk arról, hogy a robotok ezeket a dokumentumokat strukturált, félig strukturált vagy strukturálatlan kategóriába sorolják, így általános formátumba mentik. Az osztályozási feladat a dokumentumok sablonokkal való összehasonlításával és olyan jellemzők elemzésével valósul meg, mint a betűtípusok, nyelv, kulcs-érték párok jelenléte, táblázatok stb.
Az adatok kinyerése OCR-rel: Rendben, most, hogy a robotok általános formátumba rendezték a dokumentumainkat és besorolták őket, itt az ideje, hogy OCR technikával digitalizáljuk őket. Ezzel megkapjuk a szöveget, annak elhelyezkedését a képek koordinátáiban. Ez segít a dokumentumok és adatok szabványosításában a következő lépésekhez. Olyan esetekkel is találkozunk, amikor az OCR-szoftver nem tudta megfelelően megkülönböztetni a karaktereket, például a „t” és az „i” vagy a „0” és az „O” között. Éppen azok a hibák, amelyeket ki akar kerülni az OCR-szoftver használatával, új fejtörést okozhat, amikor az OCR technológia nem képes elemezni a dokumentum árnyalatait annak minősége vagy eredeti formája alapján. Itt jön a képbe a gépi tanulás, amelyet a következő lépésben tárgyalunk.
Az ML/DL kihasználása az intelligens OCR-hez botokkal: Az adatok digitalizálása után az OCR-szoftvernek meg kell értenie, hogy milyen dokumentummal dolgozik, és mi a lényeges. A hagyományos OCR-szoftver azonban nehezen tudja növelni a dokumentumosztályozási erőfeszítéseket. Ezért a szoftverbotokat kognitív képességekkel kell kiképezni a gépi tanulás és a mély tanulási technikák felhasználásával, hogy az OCR-eket intelligensebbé tegyék. Az ML-alapú OCR-megoldások azonosíthatják a dokumentumtípust, és összevethetik azt a vállalkozása által használt ismert dokumentumtípusokkal. A strukturálatlan dokumentumok szövegblokkjait is képesek elemezni és megérteni. Ha a megoldás többet tud magáról a dokumentumról, megkezdheti a releváns információk kinyerését a szándék és a jelentés alapján.
Jobb adatkinyerés és osztályozás: Az adatkinyerés a Dokumentumértés magja. Az RPA-k integrálása az OCR-rel ebben a lépésben című előző szakaszban leírtak szerint válassza ki az adatkinyerési technikát a dokumentum típusa alapján. Az RPA-kon keresztül egyszerűen beállíthatjuk, hogy melyik kivonatot használjuk, legyen az szabályalapú vagy ML alapú vagy hibrid modell OCR technika. Az információkinyerés után visszaküldött megbízhatósági és teljesítménymutatók alapján a szoftverrobotok a kívánt formátumban mentik el azokat további elemzés céljából. Az alábbiakban egy kép látható arról, hogyan konfigurálhatunk kivonatokat és állíthatunk be megbízhatósági szintet egy RPA-eszközben az UIPath segítségével.

*A szükséges kivonatolók kiválasztása a felhasználói felület elérési útjában található dokumentummegértéshez*

6. Validálás és felhatalmazást biztosító betekintések: Az OCR és a Machine Learning modellek nem száz százalékig pontosak az információ kinyerése szempontjából, ezért a robotok segítségével egy réteg emberi beavatkozással megoldható a probléma. Ennek az érvényesítésnek az a módja, hogy amikor a robotok alacsony pontossággal és kivételekkel foglalkoznak, azonnal értesítik az akcióközpontot, ahol az alkalmazott adatérvényesítési vagy kivételkezelési kérelmet kaphat, és az esetleges bizonytalanságokat egy kattintással megoldhatja. Továbbá felszabadíthatjuk a mesterséges intelligencia azon lehetőségét, hogy idővel adatokat dokumentáljon, hogy előrejelzéseket készíthessünk, és azonosítsuk azokat a lehetséges anomáliákat, amelyek csalásra, duplikációra és egyéb hibákra utalhatnak.

A robotok Dokumentumértelmezéssel való integrálásának előnyei

A folyamat automatizálása: A dokumentummegértés érdekében a robotok integrálásának fő oka a teljes folyamat automatizálása az elejétől a végéig. Csak annyit kell tennünk, hogy létrehozunk egy munkafolyamatot, ahol a robotok tanulhatnak, hátradőlhetnek és pihenhetnek. Az érvényesítési folyamat során előfordulhat, hogy meg kell oldanunk azokat a problémákat, amelyeket a robotok jeleznek, ha hibákat vagy csalásokat észlelnek.
Botok gépi tanulással: Az automatizálási folyamat során a robotokat rugalmassá tehetjük a gépi tanulással szemben. Ez azt jelenti, hogy a robotok megtanulhatják a gépi tanulási modellek teljesítményét is, és ezáltal javíthatják a modelleket, hogy nagyobb pontosságot és teljesítményt érjenek el a dokumentumok szöveg- és információkinyerése során.
Dokumentumfeldolgozás széles skálája: Az általános feladatokhoz, mint például a táblázatok és információk kinyerése, különböző mély tanulási folyamatokat kell létrehoznunk a különböző típusú dokumentumokhoz. Ez több alkalmazás létrehozásához és különféle modellek különböző szervereken történő telepítéséhez vezet, ami sok erőfeszítést és időt igényel. Amikor a botok képben vannak a dokumentumok széles skálájához, akkor csak egyetlen csővezetékünk lehet, amelyben a botok osztályozhatják őket, majd a megfelelő modellt használhatják a különböző feladatokhoz. Különféle szolgáltatásokat is integrálhatunk API-kon keresztül, és kommunikálhatunk más szervezetekkel az adatok lekérése terén.
Könnyen telepíthető: A folyamatok létrehozása utáni dokumentumok megértéséhez a telepítési folyamat mindössze egy percet vesz igénybe. A képzés után botok exportálhatják az API-kat, vagy készíthetünk egyedi RPA-megoldást, amelyet a helyi rendszereinkben is használhatunk. Ez a fajta telepítés optimalizálhatja a vállalkozásokat, és minimális kockázattal csökkentheti a kiadásokat.

Írja be a Nanonets-t

A NanoNets egy gépi tanulási platform, amely lehetővé teszi a felhasználók számára, hogy adatokat rögzítsenek számlák, nyugták és egyéb dokumentumok sablonbeállítás nélkül. Korszerű mélytanulási és számítógépes látási algoritmusaink vannak hátul, amelyek bármilyen dokumentumértési feladatot képesek kezelni, mint például az OCR, a tábla kivonása, a kulcs-érték pár kinyerése. Általában API-kként exportálják őket, vagy a különböző használati esetek alapján a helyszínen is üzembe helyezhetők. Íme néhány példa,

Számlamodell: A kulcsmezők azonosítása innen Számlák például a vevő neve, számlaazonosítója, dátuma, összege stb.
Nyugtamodell: Azonosítsa a nyugták kulcsmezőit, például az eladó neve, száma, dátuma, összege stb.
Vezetői engedély (USA): Azonosítsa a kulcsmezőket, mint például a jogosítvány száma, DOB, lejárati dátuma, kiadásának dátuma stb.
Önéletrajz: Kivonat tapasztalatokról, végzettségről, készségekről, jelöltekről stb.

Ahhoz, hogy ezek a munkafolyamatok gyorsabbak és robusztusabbak legyenek, az UiPath-ot, egy RPA-eszközt használunk a dokumentumok zökkenőmentes automatizálására sablon nélkül. A következő részben áttekintjük, hogyan használhatja az UiPath Connect with Nanonets szolgáltatást a dokumentumok megértéséhez. Az RPA piac 3 legnagyobb szereplője a UiPath, az Automation Anywhere és Kék prizma. Ez a blog Uipathra összpontosít.

NanoNets UiPath-tal

Korábbi részeinkben megtanultuk létrehozni a dokumentumértelmezési folyamatot. Ehhez alapvető ismeretekre van szükség az OCR-ről, az RPA-ról és a gépi tanulásról, mivel a különböző feladatokhoz különböző megközelítések és algoritmusok vannak különböző pontokon. Emellett sok erőfeszítést kell költenünk a sablonjainkat megértő neurális hálózatok kiépítésére, a képzésre és azok telepítésére. Ezért, hogy kényelmes legyen és automatizálhassuk a dokumentumok feltöltését, osztályozását, az OCR felépítését és az ML modellek integrálását, mi, a Nanonets az Ui Path-en dolgozunk, hogy egy zökkenőmentes folyamatot hozzunk létre a Dokumentumértéshez. Az alábbiakban egy kép látható ennek működéséről.

Most tekintsük át mindegyiket, és tanuljuk meg, hogyan integrálhatjuk a nanoneteket az UiPath-szal.

1. lépés: Regisztráljon az UiPath webhelyen, és töltse le az UiPath Studio-t

Munkafolyamat létrehozásához először létre kell hoznunk egy fiókot az UiPathban. Ha Ön már meglévő felhasználó, közvetlenül bejelentkezhet fiókjába, átirányítva az UiPath irányítópultját. Ezután le kell töltenie és telepítenie kell az ingyenes UiPath Studio-t (Community Edition).

2. lépés: Töltse le a Nanonets komponenst

Ezután a saját beállításához számlafeldolgozási folyamat, le kell töltenie a Nanonets Connectort az alábbi linkről.

-> NanoNets OCR – RPA komponens

Az alábbiakban egy képernyőkép látható az UiPath Marketplace-ről és a Nanonets komponensről. Ezenkívül a letöltéshez győződjön meg arról, hogy Windows operációs rendszerből jelentkezett be az UiPath szolgáltatásba.

A letöltött fájloknak az alább felsorolt fájlokat kell tartalmazniuk,

UiPath OCR Predict ├── Main.xaml
└── project.json

3. lépés: Nyissa meg a Main.xaml fájlt, a Nanonets Component

Ha ellenőrizni szeretné, hogy a Nanonets UiPath működik-e vagy sem, nyissa meg a Main.xml fájlt a letöltött Nanonets összetevőből az Ui Path Studio segítségével. Ezután láthatja a már elkészített folyamatot az Ön számára dokumentumfeldolgozáshoz.

4. lépés: Gyűjtse össze modellazonosítóját, API-kulcsát és API-végpontját a Nanonets APP-ból

Ezután használhatja a Nanonets APP bármelyik betanított OCR-modelljét, és összegyűjtheti a modellazonosítót, az API-kulcsot és a végpontot. Az alábbiakban további részleteket talál, hogy gyorsan megtalálja őket.

Modell azonosító: Jelentkezzen be Nanonets-fiókjába, és navigáljon a „Saját modellek” oldalra. Betaníthat egy új modellt, vagy másolhat egy meglévő modell alkalmazásazonosítóját.

API végpont: Bármely meglévő modellt kiválaszthat, és az Integrálás gombra kattintva megtalálhatja az API-végpontját. Az alábbiakban egy példa látható a végpontok megjelenésére.

https://app.nanonets.com/api/v2/OCR/Model/XXXXXXX-4840-4c27-8940-d3add200779e/LabelUrls/

3. API-kulcs: Lépjen az API-kulcs fülre, és másolhat bármilyen meglévő API-kulcsot, vagy létrehozhat újat.

5. lépés: Adja hozzá a HTTP-kérelmet, hogy a metódusát és a változóit a felhasználói felület elérési útjára kapja

Most, hogy integrálja modelljét a nanonetekből a felhasználói felület elérési útjába, először kattintson a HTTP-kérésre, és adja hozzá az EndPoint-ot, amely a bal oldali navigációs panelen található a Bemenet szakaszban. Alább egy képernyőkép látható.

Később adja hozzá az összes változót, hogy kapcsolatot létesítsen az UiPath stúdió és a Nanonets API között. Ez a szakasz a „Változók lap” alsó paneljén található. Az alábbiakban látható a képernyőkép, ide kell frissítenie/másolnia a modell API-kulcsát, végpontját és modellazonosítóját.

6. lépés: Adja hozzá a fájl helyét az előrejelzésekhez

Végül hozzáadhatja a fájl helyét az Attribútumok fül alatt, amint az az alábbi képernyőképen látható, és megnyomja a lejátszás gombot a felső navigációs panelen a kimenetek előrejelzéséhez.

Voálá! Íme az általunk kért dokumentum kimenetei az alábbi képernyőképen. További feldolgozáshoz egyszerűen adja hozzá a fájl helyét, és nyomja meg a Futtatás gombot.

7. lépés – Nyomja meg a kimenetet a CSV/ERP-be

Végül, hogy a kimenetünket a kívánt formátumra szabjuk, új blokkokat adhatunk a folyamathoz a Main.XML fájlban. Ezt offline fájlokon vagy API-hívásokon keresztül bármely meglévő ERP-rendszerbe is betolhatjuk.

Bármilyen segítségért forduljon hozzánk a support@nanonets.com címen

Webinar

Csatlakozzon hozzánk egy webináriumra jövő kedden az OCR-ről az RPA-val, itt regisztrálj.

Referenciák

[1] A Gartner szerint a robotizált folyamatautomatizálás évente 25,000 XNUMX elkerülhető munkaórát takaríthat meg a pénzügyi osztályoknak

[2] Dokumentumértés – AI dokumentumfeldolgozás

[3] RPA OCR – folyamatautomatizálás emelése | SZÉP

[4] Az AI használata a dokumentumok megértésének optimalizálására

[5] https://www.uipath.com/product/document-understanding

[6] NanoNets használata a UiPath munkafolyamatban a számla OCR-hez

További olvasnivalók

Érdekelhetik legújabb bejegyzéseink itt:

Frissítés:‌
‌ További olvasnivalók hozzáadva az OCR, RPA használatáról és hatásáról a dokumentumok megértésében.

Forrás: https://nanonets.com/blog/ocr-with-rpa-and-document-understanding-uipath/

Időbélyeg: May 19, 2021

Időbélyeg: 8. június 2023.

Átfogó útmutató az OCR-hez az RPA-val és a dokumentumok megértésével

Újra kiadta Platón

Definíciók és áttekintés

Hogyan tanulhatják meg a robotok a dokumentumok megértését OCR és ML segítségével

Hogyan integrálhatják a vállalatok az intelligens OCR-t az RPA-val a munkafolyamatok javítása érdekében?

OCR Az RPA fejlesztői előtt álló kihívások

A dokumentummegértési munkafolyamat folyamata

A robotok Dokumentumértelmezéssel való integrálásának előnyei

Írja be a Nanonets-t

NanoNets UiPath-tal

Webinar

Referenciák

További olvasnivalók

Érdekelhetik legújabb bejegyzéseink itt:

Még több AI és gépi tanulás

Mennyibe kerül egy számla feldolgozása?

Digitális megrendelés 101

Hogyan lehet XML fájlokat elemezni python segítségével?

Hogyan lehet PDF képeket szöveggé konvertálni online?

Mi az a Blanket PO?

Az 5 legjobb OCR szoftver Mac-hez 2022-ben

Szervitaens partnerek a Nanonets-szel, hogy az AI-t a toborzási munkafolyamatokhoz felhasználják

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók