Kattava OCR-opas RPA:n ja asiakirjan ymmärtämisen avulla

Julkaissut Platon

seuraajia: 0

Viimeisin päivitys: tammikuu 2021.

Tämä blogi on kattava yleiskatsaus OCR: n käytöstä minkä tahansa RPA-työkalun kanssa asiakirjojen työnkulkujen automatisointiin. Tutkimme, kuinka uusimmat koneoppimiseen perustuvat OCR-tekniikat eivät vaadi sääntöjä tai mallin määritystä.

RPA: t tai robottiprosessiautomaatio ovat ohjelmistotyökaluja, joiden tarkoituksena on poistaa toistuvat liiketoiminnan tehtävät. Lisää tietohallintojohtajia kääntyy kohti heitä vähentämään kustannuksia ja auttamaan työntekijöitä keskittymään arvokkaampaan liiketoimintaan. Esimerkkejä ovat vastaaminen verkkosivustojen kommentteihin tai asiakkaiden tilausten käsittely. Hieman monimutkaisempiin tehtäviin kuuluu mm käsinkirjoitetut lomakkeet ja laskut – ne on yleensä siirrettävä vanhasta järjestelmästä toiseen – sano sähköpostiohjelmasi SAP ERP -järjestelmääsi, josta sinun on poimittava tiedot. Tämä on ongelmallinen osa.

Useimmat OCR-työkalut, jotka sieppaavat tietoja näistä asiakirjoista, ovat mallipohjaisia (esim Abbyy Flexicapture) eivätkä skaalaudu hyvin puolistrukturoiduissa asiakirjoissa. On olemassa uudemman sukupolven koneoppimiseen perustuvia ratkaisuja, jotka tarjoavat tyypillisesti API:n
integraatiot, jotka voivat siepata avainarvopareja asiakirjoista - yritysjärjestelmät ovat tyypillisesti vanhoja eivätkä ole avoimia integroitaviksi ulkoisten sovellusliittymien kanssa. Toisaalta RPA: t on rakennettu käsittelemään näitä vanhoja järjestelmän työnkulkuja, kuten asiakirjojen noutaminen kansioista ja tulosten syöttäminen ERP- tai CRM-tiedostoihin.

Kun robottiprosessiautomaatio (RPA) ja ML ovat kehittymässä kohti hyperautomaatiota, voimme käyttää ohjelmistobotteja yhdessä ML: n kanssa monimutkaisten tehtävien, kuten asiakirjojen luokittelu, purkaminen ja optinen merkintunnistus, käsittelemiseksi. Äskettäin tehdyssä tutkimuksessa sanottiin, että automatisoimalla vain 29% tehtävän toiminnoista RPA: n avulla pelkästään rahoitusosastot säästävät yli 25,000 878,000 tuntia inhimillisten virheiden aiheuttamaa työstämistä 40 1 dollaria vuodessa organisaatiolle, jolla on XNUMX täyttä palvelua. aikakirjanpitäjät [XNUMX]. Tässä blogissa opimme OCR: ien käytöstä RPA: n kanssa ja syvennämme dokumenttien ymmärtämisen työnkulkuja. Alla on sisällysluettelo.

Määritelmät ja yleiskatsaus

RPA on yleensä tekniikka, joka auttaa automatisoimaan hallinnollisia tehtäviä ohjelmisto-laitteistobottien kautta. Nämä robotit hyödyntävät käyttöliittymiä; kaapata dataa ja käsitellä sovelluksia ihmisten tavoin. RPA voi esimerkiksi tarkastella graafisessa käyttöliittymässä tehtyjä tehtäviä, esimerkiksi siirtää kohdistimia, muodostaa yhteyden API-liittymiin, kopioida ja liittää tiedot ja muotoilla saman toimintosarjan RPA-langalliseen kehikkoon, joka muuttuu koodiksi. Lisäksi nämä tehtävät voidaan suorittaa tulevaisuudessa ilman ihmisen puuttumista. Optinen merkintunnistus (OCR) on olennainen ominaisuus kaikissa toiminnallisissa robottiprosessiautomaatioratkaisuissa (RPA). Tätä tekniikkaa käytetään tekstin lukemiseen ja poimimiseen eri lähteistä, kuten kuvista tai pdfs digitaaliseen muotoon kaappaamatta sitä manuaalisesti.

Toisaalta Asiakirjan ymmärtäminen on termi, jota käytetään kuvaamaan automaattisesti asiakirjan tietojen lukemista, tulkintaa ja niihin vaikuttamista. Tärkein tässä prosessissa on ohjelmistobotit, jotka itse suorittavat kaikki tehtävät. Nämä robotit hyödyntävät tekoälyn ja koneoppimisen voimaa ymmärtääksesi asiakirjoja digitaalisina avustajina. Tällä tavoin voimme sanoa, että asiakirjojen ymmärtäminen syntyy asiakirjojen käsittelyn, tekoälyn ja RPA: n risteyksessä.

Asiakirjojen ymmärtäminen syntyy asiakirjojen käsittelyn, tekoälyn ja RPA: n risteyksessä. [Kuvalähde: Ui Path Document Understanding [2]]

Kuinka robotit voivat oppia ymmärtämään asiakirjoja OCR: n ja ML: n avulla

Ennen kuin syventymme ensin asiakirjaymmärrykseen, puhutaan robottien roolista asiakirjojen ymmärtämisessä. Nämä täysin näkymättömät avustajat tekevät elämästämme paljon mukavampaa. Toisin kuin elokuvat ja sarjat, nämä robotit eivät ole fyysisiä laitteita tai tekoälyohjelmia, jotka istuvat työpöydällä ja painavat tehtäviä. Voimme ajatella näitä digitaalisina avustajina, jotka on koulutettu käsittelemään asiakirjoja lukemalla ja käyttämällä sovelluksia kuten me. Toiminnallisella puolella robotit parantavat prosessin suorituskykyä ja tehokkuutta. Silti ne ovat itsenäinen ohjelmisto, eivät voi arvioida prosessia ja tehdä kognitiivisia päätöksiä. Jos koneoppiminen integroidaan onnistuneesti, robotiikasta tulee dynaamisempaa ja mukautuvampaa. Esimerkiksi asiakirjojen käsittelyyn, tiedonhallintaan ja muihin toimintoihin etu- ja keskitoimistossa käytettävät robotit suorittavat älykkäämpiä toimintoja, kuten kaksoiskappaleiden poistamisen tai tuntemattomien järjestelmäpoikkeusten ratkaisemisen prosessissa. Lisäksi robotteja koulutetaan lukemaan, purkamaan, tulkitsemaan ja toimimaan asiakirjoista saatujen tietojen avulla tekoälyn avulla.

Kuinka yritykset voivat integroida älykkään OCR: n RPA: n kanssa työnkulun parantamiseksi

Asiakirjatietojen poiminta on tärkeä osa asiakirjojen ymmärtämistä. Tässä osiossa keskustelemme siitä, miten voimme integroida tekstintunnistuksen RPA: n kanssa tai päinvastoin. Ensinnäkin, me kaikki tiesimme, että asiakirjoja on erilaisia mallien, tyylin, muotoilun ja joskus kielen suhteen. Siksi emme voi luottaa yksinkertaiseen tekstintunnistustekniikkaan tietojen poimimiseksi näistä asiakirjoista. Tämän ongelman ratkaisemiseksi käytämme OCR: ssä sekä sääntö- että mallipohjaisia lähestymistapoja käsittelemään tietoja erilaisista asiakirjarakenteista. Nyt näemme, kuinka OCR: ää tekevät yritykset voivat integroida RPA: t nykyiseen järjestelmäänsä asiakirjatyypin perusteella.

Strukturoidut asiakirjat: Tämän tyyppisissä asiakirjoissa asettelut ja mallit ovat yleensä kiinteitä ja melkein yhdenmukaisia. Harkitse esimerkiksi organisaatiota, joka tekee KYC: tä valtion myöntämillä henkilötodistuksilla, kuten passi tai ajokortti. Kaikki nämä asiakirjat ovat identtisiä ja niillä on samat kentät kuin henkilötunnuksella, henkilön nimellä, iällä ja muutamilla muilla samoissa paikoissa. Mutta vain yksityiskohdat vaihtelevat. Rajoituksia, kuten taulukon täynnä olevia tai tiedostamattomia tietoja, voi olla vähän.

Yleensä suositeltu lähestymistapa käyttää mallia tai sääntöpohjaista moottoria strukturoitujen asiakirjojen tietojen poimimiseksi. Näitä voivat olla säännölliset lausekkeet tai yksinkertainen sijainnin kartoitus ja OCR. Ohjelmistorobottien integroimiseksi tiedonkeruun automatisoimiseksi voimme joko käyttää jo olemassa olevia malleja tai luoda sääntöjä jäsennellylle datallemme. Sääntöihin perustuvassa lähestymistavassa on yksi haitta, koska se perustuu kiinteisiin osiin, jopa pienet muutokset lomakkeen rakenteessa voivat aiheuttaa sääntöjen hajoamisen.

Puolirakenteiset asiakirjat: Näissä asiakirjoissa on samat tiedot, mutta ne on järjestetty eri paikkoihin. Mieti esimerkiksi laskut sisältää 8-12 identtistä kenttää. Muutamassa laskut, kauppiaan osoite löytyy ylhäältä, ja muissa se löytyy alhaalta. Tyypillisesti nämä sääntöihin perustuvat lähestymistavat eivät anna suurta tarkkuutta; siksi tuomme kuvaan koneoppimis- ja syväoppimismalleja tiedon poimimista varten OCR:n avulla. Vaihtoehtoisesti joissain tapauksissa voimme käyttää hybridimalleja, jotka sisältävät sekä sääntöjä että ML-malleja. Muutamia suosittuja esikoulutettuja malleja ovat FastRCNN, Attention OCR, Graph Convolutions tietojen poimimiseen asiakirjoista. Kuitenkin jälleen näillä malleilla on muutamia haittoja; siksi mittaamme algoritmin suorituskykyä käyttämällä mittareita, kuten tarkkuus tai luottamuspisteet. Koska malli oppii malleja, ei toimi konkreettisten sääntöjen mukaan, se voi tehdä virheitä aluksi heti korjausten jälkeen. Kuitenkin ratkaisu näihin haittoihin – mitä enemmän näytteitä ML-malli käsittelee, sitä enemmän kuvioita se oppii varmistamaan tarkkuuden.

Rakentamattomat asiakirjat: RPA ei nykyään pysty hallitsemaan strukturoimatonta dataa suoraan, minkä vuoksi robottien on ensin poimittava ja luotava strukturoituja tietoja OCR:n avulla. Toisin kuin jäsennellyt ja puolistrukturoidut asiakirjat, jäsentämättömällä tiedolla ei ole muutamaa avainarvoparia. Esimerkiksi muutamassa laskut, näemme jossain kauppiaan osoitteen ilman avaimen nimeä; Samoin havaitsemme saman muille kentille, kuten päivämäärä, laskun tunnus. Jotta ML-mallit pystyvät käsittelemään nämä tarkasti, robottien on opittava kääntämään kirjoitettu teksti käyttökelpoiseksi dataksi, kuten sähköpostiksi, puhelinnumeroksi, osoitteeksi jne. Malli oppii sitten, että 7- tai 10-numeroiset numeromallit tulee poimia puhelinnumeroina ja valtavana tekstinä, joka sisältää viisinumeroisia koodeja ja erilaisia substantiiveja tekstinä. Näiden mallien tarkentamiseksi voimme myös käyttää Natural Language Processingin (NLP) tekniikoita, kuten nimettyjen entiteettien tunnistusta ja sanan upottamista.

Asiakirjojen ymmärtämisen kannalta on ensinnäkin välttämätöntä ymmärtää tiedot ja sitten toteuttaa OCR RPA: n kanssa. Seuraavaksi, sen sijaan, että kartoittaisimme prosessia askel askeleelta, voimme opettaa robotin "tekemään niin kuin minä" tallentamalla prosessin, kuten tapahtuu yllä mainittujen tehokkaiden OCR-ominaisuuksien kanssa, integroimalla säännöt ja koneoppimisalgoritmit. Ohjelmistorobotti seuraa napsautuksiasi ja toimintojasi näytöllä ja muuttaa ne sitten muokattavaksi työnkuluksi. Jos työskentelet kokonaan paikallisissa ohjelmissa, se on niin paljon kuin sinun tarvitsee tietää.

RPA-kehittäjien kohtaamat OCR-haasteet

Olemme nähneet, kuinka voimme integroida OCRR: n RPA: hin eri asiakirjoille, mutta on olemassa muutamia tapauksia, joissa robottien on käsiteltävä hyvin. Keskustellaan niistä nyt!

Heikot tai epäjohdonmukaiset tiedot: Datalla on ratkaiseva rooli asiakirjojen ymmärtämisessä. Useimmissa tapauksissa asiakirjat skannataan kameroilla, joissa on mahdollisuus menettää asiakirjan muotoilu tekstiskannauksen aikana (ts. Lihavoitua, kursivoitua ja alleviivausta ei aina tunnisteta). Joskus OCR saattaa poimia tekstiä väärällä tavalla, mikä johtaa kirjoitusvirheisiin, epäsäännöllisiin kappaleiden katkeamiin, mikä heikentää robottien yleistä suorituskykyä. Kaikkien puuttuvien arvojen käsittely ja tietojen tarkempi tallentaminen on siis välttämätöntä OCR-tarkkuuden parantamiseksi.
Virheellinen sivun suunta dokumenteissa: Sivun suuntaus ja vinous ovat myös yksi yleisimmistä ongelmista, jotka johtavat OCR: n virheelliseen tekstinkorjaukseen. Tämä tapahtuu yleensä, kun asiakirjat skannataan väärin tiedonkeruun aikana. Tämän ratkaisemiseksi meidän on ilmoitettava robotille muutama toiminto, kuten automaattinen sovittaminen sivulle, automaattinen suodatus, jotta ne voivat parantaa skannatun asiakirjan laatua ja saada oikeaa tietoa tulostuksessa.
Integrointiongelmat: Kaikki RPA-työkalut eivät toimi hyvin etätyöpöytäympäristöissä - ne aiheuttavat kaatumisia ja kriittisiä ongelmia automaatiossa. Lisäksi RPA-kehittäjän on tiedettävä, mikä OCR-ratkaisu on paras yksittäistapauksessa. RPA-kehittäjän on myös työskenneltävä tiettyjen automaatiotyökalujen kanssa valitsemalla vain rajoitettu OCR-tekniikka, jonka ovat luoneet Microsoft, Google. Siksi mukautettujen algoritmiemme ja malliemme integrointi on joskus haastavaa.
Koko teksti on salattua tekstiä: Tosielämän käyttötapauksissa yleisen OCR: n sieppaama teksti salataan, eikä sillä ole mitään merkityksellistä tietoa, jota botit voivat käyttää merkittävien toimintojen suorittamiseen. RPA-kehittäjät tarvitsevat vahvan ML-tuen voidakseen rakentaa hyödyllisiä sovelluksia.

Putki asiakirjojen ymmärtämistä varten

Edellisissä osioissa olemme nähneet, kuinka botit auttavat suorittamaan OCR: n erityyppisille asiakirjoille. Mutta OCR on vain tekniikka, joka muuntaa kuvat tai muut tiedostot tekstiksi. Nyt tässä osassa tarkastelemme Asiakirjojen ymmärtäminen -työnkulkuja heti asiakirjojen keräämisen alusta ja lopulta tallentamalla heille merkitykselliset tiedot haluttuun muotoon.

Nosta asiakirja kansiosta Botilla: Tämä on ensimmäinen vaihe asiakirjojen ymmärtämisen aikaansaamiseksi bottien kautta. Täältä haemme joko pilvialustalla (API: n avulla) tai paikallisesta koneesta sijaitsevan asiakirjan. Joissakin tapauksissa, jos dokumenttimme ovat verkkosivuilla, voimme automatisoida komentosarjojen kaapimisen bottien kautta, joista ne voivat hakea asiakirjoja ajoissa.
Dokumentti tyyppi: Kun olemme noutaneet tiedot, on tärkeää ymmärtää asiakirjan tyyppi ja muoto, jolla ne tallennetaan järjestelmiimme, koska joskus saamme tietoja eri lähteistä eri tiedostomuodoissa, kuten esim. PDF, PNG ja JPG. Tiedostotyyppien lisäksi joskus, kun asiakirjoja skannataan puhelimen kameroilla, tulee käsitellä myös muutamia haastavia ongelmia, kuten kuvan vinoutumista, kiertoa, kirkkautta tai matalaa resoluutiota. Näin ollen meidän on varmistettava, että botit luokittelevat nämä asiakirjat jäsenneltyihin, puolirakenteisiin tai jäsentelemättömiin kategorioihin, jolloin ne tallennetaan yleiseen muotoon. Luokittelutehtävä suoritetaan vertaamalla asiakirjoja malleihin ja analysoimalla ominaisuuksia, kuten kirjasimia, kieliä, avainarvoparien olemassaoloa, taulukoita jne.
Tietojen purkaminen OCR: llä: Selvä, nyt kun robotit järjestivät asiakirjat yleiseen muotoon ja luokittelivat ne, on meidän aika digitalisoida ne OCR-tekniikalla. Tämän avulla meillä on teksti, sen sijainti kuvien koordinaateissa. Tämä auttaa standardoimaan asiakirjat ja tiedot seuraavia vaiheita varten. Lisäksi kohtaamme muutamia, kun OCR-ohjelmisto ei voinut erottaa merkkejä oikein, kuten 't' vastaan 'i' tai '0' vastaan 'O.' Ne virheet, joista haluat välttyä OCR-ohjelmiston avulla, voivat olla uusia päänsärkyä, kun OCR-tekniikka ei kykene analysoimaan asiakirjan vivahteita sen laadun tai alkuperäisen muodon perusteella. Tällöin koneoppiminen tulee kuvaan, josta keskustelemme seuraavassa vaiheessa.
ML / DL: n hyödyntäminen älykkäässä tekstintunnistuksessa botteja käyttämällä: Kun tiedot on digitalisoitu, OCR-ohjelmiston tulisi ymmärtää, millaista asiakirjaa se käyttää ja mikä on merkityksellistä. Mutta perinteinen OCR-ohjelmisto voi taistella asiakirjojen luokittelun laajentamiseksi. Siksi ohjelmistobotit tulisi kouluttaa kognitiivisilla kyvyillä hyödyntämällä koneoppimista ja syvällisiä oppimistekniikoita OCR: ien älykkäämmäksi. ML-pohjaiset OCR-ratkaisut voivat tunnistaa asiakirjatyypin ja sovittaa sen yritykseesi tunnetun tunnetun asiakirjatyypin kanssa. He voivat myös jäsentää ja ymmärtää tekstilohkoja strukturoimattomissa asiakirjoissa. Kun ratkaisu tietää enemmän itse dokumentista, se voi alkaa kerätä asiaankuuluvia tietoja tarkoituksen ja tarkoituksen perusteella.
Parempi tietojen poiminta ja luokittelu: Tiedonkeruu on asiakirjaymmärryksen ydin. Kuten edellisessä osassa RPA: n integrointi OCR: ään tässä vaiheessa on valittu, valitse tietojen purkutekniikka asiakirjatyypin perusteella. RPA: n avulla voimme helposti määrittää, mitä puristinta käytetään, joko sääntö- tai ML-pohjaista tai hybridimallin OCR-tekniikkaa. Tietojen poiminnan jälkeen palautettujen luotettavuus- ja suorituskykymittareiden perusteella ohjelmistorobotit tallentavat ne haluttuun muotoon jatkoanalyysiä varten. Alla on kuva siitä, kuinka voimme määrittää puristimet ja asettaa luottamustason RPA-työkalussa UIPathin avulla.

*Tarvittavien poimijoiden valinta asiakirjaymmärrykseen käyttöliittymän polussa*

6. Vahvistus ja vahvistavat oivallukset: OCR- ja koneoppimismallit eivät ole sataprosenttisen tarkkoja tiedonkeruun kannalta, joten ongelman voi ratkaista lisäämällä kerroksen ihmisen toimia robottien avulla. Tämä vahvistus toimii siten, että aina kun robotit käsittelevät heikkoa tarkkuutta ja poikkeuksia, se antaa välittömästi ilmoituksen toimintakeskukselle, jossa työntekijä voi vastaanottaa pyynnön tietojen validoimiseksi tai poikkeusten käsittelemiseksi ja ratkaista mahdolliset epävarmuustekijät napsautuksella. Lisäksi voimme vapauttaa tekoälyn potentiaalin dokumentoida tietoja ajan myötä ennusteiden tekemiseksi ja tunnistaa mahdolliset poikkeamat, jotka saattavat viitata petoksiin, päällekkäisyyteen ja muihin virheisiin.

Edut robottien integroinnista asiakirjaymmärrykseen

Automatisoi prosessi: Tärkein syy robottien integrointiin asiakirjojen ymmärtämistä varten on automatisoida koko prosessi alusta loppuun. Ainoa mitä meidän on tehtävä, on luoda työnkulku botille oppimiseen, istumiseen ja rentoutumiseen. Vahvistusprosessin aikana meidän on ehkä käsiteltävä bottien ilmoittamia ongelmia, joissa havaitaan virheitä tai petoksia.
Botit koneoppimisen kanssa: Automaatioprosessin aikana voimme tehdä robotit joustaviksi koneoppimiseen. Robotit voivat myös oppia, kuinka koneoppimismallit toimivat, ja siten parantaa malleja, jotta saavutettaisiin parempi tarkkuus ja suorituskyky asiakirjojen tekstin ja tiedon saannissa.
Käsittele laaja asiakirjakäsittely: Yleisten tehtävien, kuten taulukoiden ja tietojen purkamisen, osalta meidän on luotava erilaiset syvälliset oppimisputket erityyppisille asiakirjoille. Tämä johtaa useiden sovellusten rakentamiseen ja erilaisten mallien käyttöönottamiseen eri palvelimille, mikä vaatii paljon vaivaa ja aikaa. Kun botit ovat kuvassa monenlaisille asiakirjoille, meillä voisi olla vain yksi putki, jossa botit voivat luokitella ne ja käyttää sitten sopivaa mallia erilaisiin tehtäviin. Voimme myös integroida erilaisia palveluita sovellusliittymien kautta ja kommunikoida muiden organisaatioiden kanssa tietojen hakemisessa.
Helppo ottaa käyttöön: Asennusprosessi on vain minuutti asiakirjojen ymmärtämistä varten putkilinjojen luomisen jälkeen. Voimme joko viedä botit viedä sovellusliittymät koulutuksen jälkeen, tai muuten voimme rakentaa mukautetun RPA-ratkaisun, jota voidaan käyttää paikallisissa järjestelmissämme. Tämän tyyppinen käyttöönotto voi myös optimoida yritykset ja vähentää menoja erittäin pienillä riskeillä.

Syötä Nanonets

NanoNets on koneoppimisalusta, jonka avulla käyttäjät voivat kaapata tietoja laskut, kuitit ja muut asiakirjat ilman mallin asetuksia. Meillä on takana käynnissä huippuluokan syväoppimis- ja tietokonenäköalgoritmit, jotka pystyvät käsittelemään kaikenlaisia asiakirjan ymmärtämiseen liittyviä tehtäviä, kuten tekstintunnistus, taulukon purkaminen, avain-arvoparien purkaminen. Ne viedään yleensä sovellusliittyminä tai ne voidaan ottaa käyttöön paikan päällä eri käyttötapausten perusteella. Tässä muutama esimerkki,

Laskumalli: Tunnista avainkentät Laskut kuten ostajan nimi, laskun tunnus, päivämäärä, summa jne.
Kuittimalli: Tunnista avainkentät kuiteista, kuten myyjän nimi, numero, päivämäärä, määrä jne.
Ajokortti (USA): Tunnista avainkentät, kuten lisenssinumero, DOB, viimeinen voimassaolopäivä, myöntämispäivä jne.
Jatka: Poimi kokemus, koulutus, taitojoukot, ehdokkaatiedot jne.

Tehdäksemme näistä työnkuluista nopeampia ja kestävämpiä, käytämme UiPathia, RPA-työkalua asiakirjojen saumattomaan automatisointiin ilman mallia. Seuraavassa osiossa käymme läpi, kuinka voit käyttää UiPath Connectia nanonettien kanssa dokumenttien ymmärtämiseen. RPA-markkinoiden kolme suurinta toimijaa ovat UiPath, Automation Anywhere ja Sininen prisma. Tämä blogi keskittyy Uipathiin.

NanoNets UiPathin kanssa

Olemme oppineet luomaan asiakirjaa ymmärtävän putken edellisissä osioissamme. Se vaatii perustiedot OCR: stä, RPA: sta ja koneoppimisesta, koska eri tehtävissä on erilaisia lähestymistapoja ja algoritmeja eri kohdissa. Lisäksi meidän on käytettävä paljon työtä sellaisten hermoverkkojen rakentamiseen, jotka ymmärtävät mallimme, koulutukseen ja niiden käyttöönottoon. Siksi, jotta voimme olla mukavia ja automatisoida kaiken asiakirjojen lähettämisestä, luokittelusta, OCR: n rakentamisesta, ML-mallien integroinnista, me Nanonetsissä työskentelemme Ui Path -työkalun kanssa saumattoman putken luomiseksi asiakirjojen ymmärtämistä varten. Alla on kuva siitä, miten tämä toimii.

Tarkastellaan nyt kaikkia näitä ja opitaan, miten voimme integroida Nanonets UiPathiin.

Vaihe 1: Rekisteröidy UiPathiin ja lataa UiPath Studio

Työnkulun luomiseksi meidän on ensin luotava tili UiPathissa. Jos olet nykyinen käyttäjä, voit kirjautua suoraan tiliisi ohjaamalla UiPath-hallintapaneelin. Seuraavaksi sinun on ladattava ja asennettava UiPath Studio (Community Edition), joka on ilmainen.

Vaihe 2: Lataa Nanonets-komponentti

Seuraavaksi voit määrittää laskujen käsittelyputki, sinun on ladattava Nanonets-liitin alla olevasta linkistä.

-> NanoNets OCR - RPA-komponentti

Alla on kuvakaappaus UiPath Marketplacesta ja Nanonets Componentista. Jos haluat ladata tämän, varmista, että olet kirjautunut UiPathiin Windows-käyttöjärjestelmästä.

Ladattujen tiedostojen tulisi sisältää alla luetellut tiedostot,

UiPath OCR Predict ├── Main.xaml
└── project.json

Vaihe 3: Avaa Main.xaml-tiedosto Nanonets Component

Voit tarkistaa, toimiiko Nanonets UiPath vai ei, avaamalla Main.xml -tiedostosi ladatusta Nanonets-komponentista Ui Path Studion avulla. Sitten näet putkilinjan, joka on jo luotu sinulle asiakirjojen käsittelyä varten.

Vaihe 4: Kerää mallitunnuksesi, API-avain ja API-päätepiste Nanonets APP -sovelluksesta

Seuraavaksi voit käyttää mitä tahansa Nanonets APP: n koulutettua OCR-mallia ja kerätä mallin tunnuksen, API-avaimen ja päätepisteen. Alla on lisätietoja, jotta löydät ne nopeasti.

Mallitunnus: Kirjaudu Nanonets-tilillesi ja siirry kohtaan Omat mallit. Voit kouluttaa uuden mallin tai kopioida olemassa olevan mallin sovellustunnuksen.

API-päätepiste: Voit valita minkä tahansa olemassa olevan mallin ja napsauttaa Integroi löytääksesi API-päätepisteen. Alla on esimerkki siitä, miltä päätepisteesi näyttävät.

https://app.nanonets.com/api/v2/OCR/Model/XXXXXXX-4840-4c27-8940-d3add200779e/LabelUrls/

3. API-avain: Siirry API-avain-välilehteen ja voit kopioida minkä tahansa olemassa olevan API-avaimen tai luoda uuden.

Vaihe 5: Lisää HTTP-pyyntö saadaksesi menetelmän ja muuttujat käyttöliittymän polkuun

Nyt voit integroida mallisi Nanonetsistä käyttöliittymän polkuun, sinun on ensin napsautettava HTTP-pyyntöä ja lisättävä EndPoint, joka löytyy vasemmasta navigointijärjestelmästä Syöttö-osiosta. Alla on kuvakaappaus.

Lisää myöhemmin kaikki muuttujat muodostaaksesi yhteyden UiPath-studiosta Nanonets-sovellusliittymään. Löydät tämän osan Muuttujat-välilehden alaruudusta. Alla on kuvakaappaus, sinun on päivitettävä / kopioitava API-avain, päätepiste ja mallisi Model-ID täältä.

Vaihe 6: Lisää tiedoston sijainti ennusteita varten

Lopuksi voit lisätä tiedostosi sijainnin attribuutit-välilehdelle, kuten alla olevassa kuvakaappauksessa näkyy, ja napsauttaa toistonäppäintä yläosassa navigoidaksesi tuotoksesi.

Voila! Tässä ovat tuotoksemme alla olevasta kuvakaappauksesta pyytämälle asiakirjalle. Jos haluat käsitellä enemmän, voit yksinkertaisesti lisätä tiedostosi sijainnit ja painaa Suorita-painiketta.

Vaihe 7 - Työnnä lähtö CSV / ERP: hen

Viimeiseksi, jotta voimme mukauttaa tuotoksemme haluamaasi muotoon, voimme lisätä uusia lohkoja putkistoon Main.XML-tiedostossa. Voimme myös työntää tämän mihin tahansa olemassa olevaan ERP-järjestelmään offline-tiedostojen tai API-kutsujen kautta.