Panduan Komprehensif Untuk OCR Dengan RPA Dan Pemahaman Dokumen

Diterbitkan Ulang Oleh Plato

Followers: 0

Pembaruan terakhir: Jan, 2021.

Blog ini adalah ikhtisar komprehensif tentang penggunaan OCR dengan alat RPA apa pun untuk mengotomatiskan alur kerja dokumen Anda. Kami mempelajari bagaimana teknologi OCR berbasis pembelajaran mesin terbaru tidak memerlukan aturan atau penyiapan template.

RPA atau otomatisasi Proses Robotik adalah alat perangkat lunak yang ditujukan untuk menghilangkan tugas bisnis yang berulang. Semakin banyak CIO beralih ke mereka untuk mengurangi biaya dan membantu karyawan fokus pada pekerjaan bisnis yang bernilai lebih tinggi. Contohnya termasuk menanggapi komentar di situs web atau pemrosesan pesanan pelanggan. Tugas yang sedikit lebih kompleks termasuk menangani dokumen seperti formulir tulisan tangan dan faktur – ini biasanya perlu dipindahkan dari satu sistem lama ke yang lain – misalnya klien email Anda ke sistem SAP ERP tempat Anda perlu mengekstrak data. Ini adalah bagian yang bermasalah.

Sebagian besar alat OCR yang menangkap data dari dokumen-dokumen ini berbasis template (katakanlah abbyy Flexicapture) dan tidak menskalakan dengan baik pada dokumen semi-terstruktur. Ada solusi berbasis pembelajaran mesin generasi baru yang biasanya menyediakan API
integrasi yang dapat menangkap pasangan nilai kunci dari dokumen - sistem perusahaan biasanya sudah lama dan tidak terbuka untuk diintegrasikan dengan API eksternal. Di sisi lain, RPA dibuat untuk menangani alur kerja sistem lama seperti menyerap dokumen dari folder dan memasukkan hasil ke dalam ERP atau CRM.

Saat Robotic Process Automation (RPA) dan ML berkembang menuju otomatisasi hiper, kita dapat menggunakan bot perangkat lunak bersama dengan ML untuk menangani tugas-tugas kompleks seperti Klasifikasi Dokumen, Ekstraksi, dan Pengenalan Karakter Optik. Dalam sebuah studi baru-baru ini, dikatakan bahwa dengan mengotomatiskan hanya 29% fungsi untuk tugas menggunakan RPA, departemen keuangan saja dapat menghemat lebih dari 25,000 jam pengerjaan ulang yang disebabkan oleh kesalahan manusia dengan biaya $ 878,000 per tahun untuk organisasi dengan 40 jam kerja penuh. staf akuntansi waktu [1]. Di blog ini, kita akan belajar tentang menggunakan OCR dengan RPA dan mendalami alur kerja pemahaman dokumen. Di bawah ini adalah daftar isi.

Definisi dan Gambaran Umum

RPA, secara umum, adalah teknologi yang membantu mengotomatiskan tugas administratif melalui bot perangkat lunak-perangkat keras. Bot ini memanfaatkan antarmuka pengguna; untuk menangkap data dan memanipulasi aplikasi seperti yang dilakukan manusia. Misalnya, RPA dapat melihat serangkaian tugas yang diambil dalam GUI, katakanlah memindahkan kursor, terhubung ke API, menyalin-menempelkan data, dan merumuskan urutan tindakan yang sama dalam gambar rangka RPA yang diterjemahkan ke kode. Selanjutnya, tugas-tugas ini dapat dilakukan tanpa campur tangan manusia di masa depan. Optical Character Recognition (OCR) adalah fitur penting dari setiap solusi otomatisasi proses robotik (RPA) fungsional. Teknologi ini digunakan untuk membaca dan mengekstrak teks dari berbagai sumber seperti gambar atau pdf ke dalam format digital tanpa menangkapnya secara manual.

Di sisi lain, Pengertian dokumen adalah istilah yang digunakan untuk mendeskripsikan secara otomatis membaca, menafsirkan, dan bertindak pada data dokumen. Yang terpenting dalam proses ini adalah bot perangkat lunak itu sendiri melakukan semua tugas. Bot ini memanfaatkan kekuatan Kecerdasan Buatan dan Pembelajaran Mesin untuk memahami dokumen sebagai asisten digital. Dengan cara ini, kita dapat mengatakan bahwa pemahaman dokumen muncul di persimpangan antara pemrosesan dokumen, AI, dan RPA.

Pemahaman dokumen muncul di persimpangan antara pemrosesan dokumen, AI, dan RPA. [Sumber Gambar: Pemahaman Dokumen Jalur Ui [2]]

Bagaimana Robot dapat belajar memahami dokumen dengan OCR dan ML

Sebelum kita mendalami Pemahaman Dokumen terlebih dahulu, mari kita bicara tentang peran Robot untuk Pemahaman Dokumen. Pembantu yang sama sekali tidak terlihat ini membuat hidup kita jauh lebih nyaman. Tidak seperti film dan serial, robot ini bukanlah perangkat fisik atau program kecerdasan buatan yang ditempatkan di desktop dan menekan tombol untuk melakukan tugas. Kami dapat menganggap ini sebagai asisten digital yang dilatih untuk memproses dokumen dengan membaca dan menggunakan aplikasi seperti yang kami lakukan. Di sisi fungsional, robot pandai meningkatkan kinerja dan efisiensi suatu proses. Tetap saja, mereka menjadi perangkat lunak yang berdiri sendiri, tidak dapat mengevaluasi proses dan membuat keputusan kognitif. Namun, jika pembelajaran mesin berhasil diintegrasikan, robotika akan menjadi lebih dinamis dan adaptif. Misalnya, robot yang digunakan untuk pemrosesan dokumen, manajemen data, dan fungsi lainnya di kantor depan dan tengah akan melakukan tindakan yang lebih cerdas, seperti menghilangkan entri duplikat atau menyelesaikan pengecualian sistem yang tidak diketahui dalam proses tersebut. Selanjutnya, robot dilatih untuk membaca, mengekstrak, menafsirkan, dan menindaklanjuti data dari dokumen menggunakan kecerdasan buatan (AI).

Bagaimana perusahaan dapat mengintegrasikan OCR cerdas dengan RPA untuk meningkatkan alur kerja

Mengekstrak data dokumen merupakan komponen penting untuk pemahaman dokumen. Di bagian ini, kita akan membahas bagaimana kita dapat mengintegrasikan OCR dengan RPA atau sebaliknya. Pertama, kita semua tahu bahwa ada berbagai jenis dokumen dalam hal template, gaya, format, dan terkadang bahasa. Oleh karena itu, kami tidak dapat mengandalkan teknik OCR sederhana untuk mengekstrak data dari dokumen-dokumen ini. Untuk mengatasi masalah ini, kami akan menggunakan pendekatan berbasis aturan dan pendekatan berbasis model dalam OCR untuk menangani data dari struktur dokumen yang berbeda. Sekarang kita akan melihat bagaimana perusahaan yang melakukan OCR dapat mengintegrasikan RPA di sistem mereka yang ada berdasarkan jenis dokumen.

Dokumen Terstruktur: Dalam jenis dokumen ini, tata letak dan templat biasanya diperbaiki dan hampir konsisten. Misalnya, pertimbangkan organisasi yang melakukan KYC dengan ID yang dikeluarkan pemerintah seperti paspor atau SIM. Semua dokumen ini akan identik dan memiliki bidang yang sama dengan Nomor ID, Nama Orang, Umur, dan beberapa lainnya pada posisi yang sama. Tapi hanya detailnya yang bervariasi. Mungkin ada beberapa kendala seperti tabel yang meluap atau data yang tidak diarsipkan.

Biasanya, pendekatan yang direkomendasikan menggunakan template atau mesin berbasis aturan untuk mengekstrak informasi untuk dokumen terstruktur. Ini dapat mencakup ekspresi reguler atau pemetaan posisi sederhana dan OCR. Karenanya, untuk mengintegrasikan robot perangkat lunak untuk mengotomatiskan ekstraksi informasi, kita dapat menggunakan templat yang sudah ada sebelumnya atau membuat aturan untuk data terstruktur kita. Ada satu kerugian menggunakan pendekatan berbasis aturan, karena bergantung pada bagian tetap, bahkan perubahan kecil dalam struktur bentuk dapat menyebabkan aturan rusak.

Dokumen Semi-Terstruktur: Dokumen-dokumen ini memiliki informasi yang sama tetapi disusun dalam posisi yang berbeda. Misalnya, pertimbangkan faktur berisi 8-12 bidang identik. Dalam beberapa faktur, alamat pedagang dapat ditemukan di bagian atas, dan di tempat lain, dapat ditemukan di bagian bawah. Biasanya pendekatan berbasis aturan ini tidak memberikan akurasi yang tinggi; oleh karena itu kami menghadirkan model pembelajaran mesin dan pembelajaran mendalam ke dalam gambar untuk ekstraksi informasi menggunakan OCR. Atau, dalam beberapa kasus, kita dapat menggunakan model hibrid yang melibatkan kedua aturan dan model ML. Beberapa model pra-pelatihan yang populer adalah FastRCNN, Attention OCR, Graph Convolutions untuk ekstraksi informasi dalam dokumen. Namun, sekali lagi model ini memiliki beberapa kelemahan; maka kami mengukur kinerja algoritme menggunakan metrik seperti akurasi atau skor kepercayaan. Karena modelnya adalah pola pembelajaran, daripada menjalankan aturan konkret, mungkin membuat kesalahan pada awalnya tepat setelah koreksi. Namun, solusi untuk kelemahan ini – semakin banyak sampel yang diproses model ML, semakin banyak pola yang dipelajari untuk memastikan akurasi.

Dokumen Tidak Terstruktur: RPA, saat ini tidak dapat mengelola data tidak terstruktur secara langsung, sehingga membutuhkan robot terlebih dahulu untuk mengekstrak dan membuat data terstruktur menggunakan OCR. Tidak seperti dokumen terstruktur dan semi terstruktur, data tidak terstruktur tidak memiliki beberapa pasangan nilai kunci. Misalnya, dalam beberapa faktur, kami melihat alamat pedagang di suatu tempat tanpa nama kunci apa pun; demikian pula, kami mengamati hal yang sama untuk bidang lain seperti tanggal, ID faktur. Agar model ML memprosesnya secara akurat, robot perlu mempelajari cara menerjemahkan teks tertulis menjadi data yang dapat ditindaklanjuti, seperti email, nomor telepon, alamat, dll. Model kemudian akan mempelajari bahwa pola angka 7 atau 10 digit harus diekstraksi sebagai nomor telepon dan teks besar yang berisi kode lima digit dan kata benda yang berbeda sebagai teks. Untuk membuat model ini lebih akurat, kita juga dapat menggunakan teknik dari Natural Language Processing (NLP) seperti Named Entity Recognition dan Word Embedding.

Secara keseluruhan untuk pemahaman dokumen, pertama-tama penting untuk memahami data dan kemudian menerapkan OCR dengan RPA. Selanjutnya, daripada memetakan proses selangkah demi selangkah, kita dapat mengajarkan robot untuk "melakukan apa yang saya lakukan" dengan merekam proses yang terjadi dengan kemampuan OCR yang kuat seperti yang dibahas di atas, dengan mengintegrasikan aturan dan algoritme pembelajaran mesin. Robot perangkat lunak mengikuti klik dan tindakan Anda di layar, lalu mengubahnya menjadi alur kerja yang dapat diedit. Jika Anda bekerja sepenuhnya dalam program lokal, itu yang perlu Anda ketahui.

Tantangan OCR yang dihadapi oleh pengembang RPA

Kami telah melihat bagaimana kami dapat mengintegrasikan OCRR dengan RPA untuk dokumen yang berbeda, tetapi ada beberapa kasus tantangan yang perlu ditangani robot dengan baik. Mari kita bahas sekarang!

Data Lemah atau Tidak Konsisten: Data memainkan peran penting dalam Pemahaman Dokumen. Dalam kebanyakan kasus, dokumen dipindai menggunakan kamera di mana ada kemungkinan kehilangan format dokumen selama pemindaian teks (yaitu, tebal, miring & garis bawah tidak selalu dikenali). Kadang-kadang, OCR mungkin mengekstrak teks dengan cara yang salah yang menyebabkan kesalahan ejaan, pemutusan paragraf yang tidak teratur, yang mengurangi kinerja robot secara keseluruhan. Oleh karena itu, menangani semua nilai yang hilang dan menangkap data dengan presisi yang lebih tinggi sangat penting untuk mencapai akurasi yang lebih tinggi untuk OCR.
Orientasi Halaman Salah dalam Dokumen: Orientasi dan Kemiringan Halaman juga merupakan salah satu masalah umum yang menyebabkan koreksi teks OCR yang salah. Ini biasanya terjadi ketika dokumen tidak dipindai dengan benar selama fase pengumpulan data. Untuk mengatasinya, kita harus mendeklarasikan beberapa fungsi pada robot seperti auto-fit to the page, auto-filter sehingga mereka dapat mengaktifkan peningkatan kualitas dokumen yang dipindai dan menerima data yang benar pada keluaran.
Masalah Integrasi: Tidak semua alat RPA bekerja dengan baik di lingkungan desktop jarak jauh - alat ini menyebabkan crash dan masalah kritis dalam otomatisasi. Terlebih lagi, pengembang RPA perlu mengetahui solusi OCR mana yang terbaik untuk kasus tertentu. Selain itu, untuk bekerja dengan alat otomatisasi tertentu, pengembang RPA hanya perlu memilih teknologi OCR terbatas yang dibuat oleh Microsoft, Google. Karenanya, mengintegrasikan algoritme dan model khusus kami terkadang menantang.
Semua teks adalah teks acak: Untuk kasus penggunaan kehidupan nyata, teks yang ditangkap oleh OCR generik semuanya diacak dan tidak memiliki informasi berarti yang dapat digunakan bot untuk melakukan operasi yang signifikan. Pengembang RPA membutuhkan dukungan ML yang kuat untuk dapat membangun aplikasi yang berguna.

Pipeline untuk Alur Kerja Pemahaman Dokumen

Di bagian sebelumnya, kita telah melihat bagaimana bot membantu menjalankan OCR untuk berbagai jenis Dokumen. Tetapi OCR hanyalah teknik yang mengubah gambar atau file lain menjadi teks. Sekarang, di bagian ini, kita akan melihat alur kerja Pemahaman Dokumen sejak awal mengumpulkan dokumen hingga akhirnya menyimpannya informasi yang berarti ke dalam format yang diinginkan.

Serap dokumen dari folder menggunakan Bot Anda: Ini adalah langkah pertama untuk mencapai pemahaman dokumen melalui bot. Di sini, kami akan mengambil dokumen yang terletak di platform cloud (menggunakan API) atau dari mesin lokal. Dalam beberapa kasus, jika dokumen kita ada di halaman web, kita dapat mengotomatiskan scraping skrip melalui bot tempat mereka dapat mengambil dokumen secara tepat waktu.
Tipe dokumen: Setelah kami mengambil data, penting untuk memahami jenis dokumen dan format penyimpanannya di sistem kami, karena terkadang, kami menerima data dari berbagai sumber dalam berbagai format file seperti PDF, PNG, dan JPG. Bukan hanya jenis file, terkadang saat dokumen dipindai dengan kamera ponsel, beberapa masalah yang menantang seperti kemiringan gambar, rotasi, kecerahan, atau resolusi rendah juga harus ditangani. Dengan demikian, kita harus memastikan bahwa bot mengklasifikasikan dokumen-dokumen ini ke dalam kategori terstruktur, semi-terstruktur, atau tidak terstruktur, sehingga menyimpannya dalam format umum. Tugas klasifikasi dicapai dengan membandingkan dokumen dengan template dan menganalisis fitur seperti font, bahasa, keberadaan pasangan nilai kunci, tabel, dll.
Mengekstrak Data dengan OCR: Baiklah, sekarang bot mengatur dokumen kita ke dalam format generik dan mengklasifikasikannya, sekarang saatnya kita mendigitalkan mereka menggunakan teknik OCR. Dengan ini, kita akan memiliki teks, lokasinya di koordinat bersama dari gambar. Ini membantu untuk menstandarisasi dokumen dan data untuk langkah selanjutnya. Kami juga menjumpai beberapa saat perangkat lunak OCR tidak dapat membedakan karakter dengan benar, seperti 't' versus 'i,' atau '0' versus 'O.' Kesalahan yang ingin Anda hindari menggunakan perangkat lunak OCR bisa menjadi sakit kepala baru ketika teknologi OCR tidak mampu menganalisis nuansa dokumen berdasarkan kualitas atau bentuk aslinya. Di sinilah Machine Learning masuk ke dalam gambaran, yang akan kita bahas di langkah berikutnya.
Memanfaatkan ML / DL untuk Intelligent OCR menggunakan Bot: Setelah data didigitalisasi, perangkat lunak OCR harus memahami jenis dokumen yang digunakan dan apa yang relevan. Tetapi perangkat lunak OCR tradisional dapat kesulitan untuk mengukur upaya klasifikasi dokumen. Karenanya, bot perangkat lunak harus dilatih dengan kemampuan kognitif dengan memanfaatkan pembelajaran mesin dan teknik pembelajaran mendalam untuk membuat OCR lebih cerdas. Solusi OCR berbasis ML dapat mengidentifikasi jenis dokumen dan mencocokkannya dengan jenis dokumen yang diketahui digunakan oleh bisnis Anda. Mereka juga dapat mengurai dan memahami blok teks dalam dokumen tidak terstruktur. Setelah mengetahui lebih banyak tentang dokumen itu sendiri, solusi dapat mulai mengekstrak informasi yang relevan berdasarkan maksud dan makna.
Ekstraksi dan Klasifikasi Data yang Lebih Baik: Ekstraksi data adalah inti dari Pemahaman Dokumen. Seperti yang telah dibahas di bagian sebelumnya tentang Mengintegrasikan RPA dengan OCR pada langkah ini, pilih teknik ekstraksi data berdasarkan jenis dokumen. Melalui RPA, kita dapat dengan mudah mengonfigurasi ekstraktor mana yang akan digunakan, apakah teknik OCR model berbasis aturan atau berbasis ML atau hybrid. Berdasarkan metrik kepercayaan dan kinerja yang dikembalikan setelah ekstraksi informasi, robot perangkat lunak akan menyimpannya dalam format yang kami inginkan untuk analisis lebih lanjut. Di bawah ini adalah gambar bagaimana kita dapat mengkonfigurasi ekstraktor dan mengatur tingkat kepercayaan di alat RPA oleh UIPath.

*Memilih Ekstraktor yang diperlukan untuk Pemahaman Dokumen di Jalur UI*

6. Validasi dan Pemberdayaan Insights: Model OCR dan Pembelajaran Mesin tidak seratus persen akurat dalam hal ekstraksi informasi, sehingga menambahkan lapisan intervensi manusia dengan bantuan robot dapat menyelesaikan masalah. Cara kerja validasi ini adalah setiap kali robot menangani keakuratan dan pengecualian yang rendah, robot segera memunculkan pemberitahuan ke pusat tindakan tempat karyawan dapat menerima permintaan untuk memvalidasi data atau menangani pengecualian dan dapat menyelesaikan ketidakpastian apa pun dalam hitungan klik. Lebih lanjut, kami dapat membuka potensi Artificial Intelligence untuk mendokumentasikan data dari waktu ke waktu untuk membuat prediksi, dan mengidentifikasi potensi anomali yang dapat mengindikasikan penipuan, duplikasi, dan kesalahan lainnya.

Manfaat mengintegrasikan robot dengan Pemahaman Dokumen

Proses Otomatis: Alasan utama untuk mengintegrasikan bot untuk pemahaman dokumen adalah untuk mengotomatiskan seluruh proses dari awal hingga akhir. Yang perlu kita lakukan adalah membuat alur kerja untuk bot belajar, duduk, dan rileks. Selama proses validasi, kami mungkin perlu mengatasi masalah yang diberitahukan oleh bot tempat kesalahan atau penipuan teridentifikasi.
Bot dengan Pembelajaran Mesin: Selama proses otomatisasi, kita dapat membuat bot menjadi tangguh terhadap pembelajaran mesin. Artinya, robot juga dapat mempelajari performa model Machine Learning dan dengan demikian menyempurnakan model untuk mencapai akurasi dan performa yang lebih tinggi untuk ekstraksi teks dan informasi dokumen.
Proses Berbagai Pemrosesan Dokumen: Untuk tugas umum seperti ekstraksi tabel dan informasi, kita harus membuat pipeline deep learning yang berbeda untuk berbagai jenis dokumen. Ini mengarah pada pembangunan banyak aplikasi dan menerapkan berbagai model pada server yang berbeda, yang membutuhkan banyak usaha dan waktu. Ketika bot ada dalam gambar untuk berbagai dokumen, kita hanya dapat memiliki satu pipeline dimana bot dapat mengklasifikasikannya dan kemudian menggunakan model yang sesuai untuk tugas yang berbeda. Kami juga dapat mengintegrasikan berbagai layanan melalui API dan berkomunikasi dengan organisasi lain dalam hal pengambilan data.
Mudah untuk Menerapkan: Untuk pemahaman dokumen setelah pipeline dibuat, proses penerapan hanya satu menit. Kami dapat memiliki API yang diekspor oleh bot setelah pelatihan, atau kami dapat membuat solusi RPA khusus yang dapat digunakan di sistem lokal kami. Jenis penerapan ini juga dapat mengoptimalkan perusahaan dan dapat mengurangi pengeluaran dengan risiko yang sangat minimal.

Masukkan Nanonet

NanoNets adalah platform Pembelajaran Mesin yang memungkinkan pengguna untuk menangkap data dari faktur, kuitansi, dan dokumen lainnya tanpa pengaturan template apa pun. Kami memiliki algoritma pembelajaran mendalam dan visi komputer canggih yang berjalan di belakang yang dapat menangani segala jenis tugas pemahaman dokumen seperti OCR, ekstraksi tabel, ekstraksi pasangan nilai kunci. Mereka biasanya diekspor sebagai API atau dapat digunakan di tempat berdasarkan kasus penggunaan yang berbeda. Berikut adalah beberapa contoh,

Model Faktur: Identifikasi bidang utama dari Faktur seperti Nama Pembeli, Id Faktur, Tanggal, Jumlah dll.
Model Tanda Terima: Identifikasi bidang kunci dari Tanda Terima seperti Nama Penjual, Nomor, Tanggal, Jumlah, dll.
Surat Izin Mengemudi (AS): Identifikasi bidang utama seperti Nomor Lisensi, DOB, Tanggal Kedaluwarsa, Tanggal Penerbitan, dll.
Resume: Ambil pengalaman, pendidikan, keahlian, info kandidat, dll.

Untuk membuat alur kerja ini lebih cepat dan kuat, kami menggunakan UiPath, alat RPA untuk otomatisasi dokumen Anda tanpa template apa pun. Di bagian selanjutnya, kita akan membahas bagaimana Anda dapat menggunakan UiPath Connect dengan Nanonets untuk pemahaman dokumen. 3 pemain terbesar di pasar RPA adalah UiPath, Automation Anywhere dan Prisma Biru. Blog ini berfokus pada Uipath.

NanoNets dengan UiPath

Kami telah belajar membuat pipeline pemahaman dokumen di bagian sebelumnya. Ini membutuhkan pengetahuan dasar tentang OCR, RPA, dan Pembelajaran mesin, karena ada pendekatan dan algoritme yang berbeda untuk tugas yang berbeda di berbagai titik. Selain itu, kami telah menghabiskan banyak upaya untuk membangun Jaringan Neural yang memahami template kami, melatih, dan menerapkannya. Oleh karena itu, agar nyaman dan mengotomatiskan semuanya mulai dari mengupload dokumen, mengklasifikasikannya, membuat OCR, mengintegrasikan model ML, kami di Nanonets sedang mengerjakan Ui Path untuk membuat pipeline yang mulus untuk Pemahaman Dokumen. Di bawah ini adalah gambar cara kerjanya.

Sekarang mari kita tinjau masing-masing dan pelajari bagaimana kita bisa mengintegrasikan Nanonet dengan UiPath.

Langkah 1: Daftar di UiPath dan Unduh UiPath Studio

Untuk membuat alur kerja, pertama, kita harus membuat akun di UiPath. Jika Anda adalah pengguna yang sudah ada, Anda dapat langsung masuk ke akun Anda, mengarahkan dasbor UiPath Anda. Selanjutnya, Anda harus mengunduh dan menginstal UiPath Studio (Community Edition), yang gratis.

Langkah 2: Unduh Komponen Nanonets

Selanjutnya, untuk menyiapkan pipa pemrosesan faktur, Anda harus mengunduh Konektor Nanonets dari tautan di bawah.

-> NanoNets OCR - Komponen RPA

Di bawah ini adalah tangkapan layar dari UiPath Marketplace, dan Nanonets Component. Juga, untuk mengunduh ini, pastikan Anda masuk ke UiPath dari sistem operasi Windows.

File yang Anda unduh harus berisi file yang tercantum di bawah ini,

UiPath OCR Predict ├── Main.xaml
└── project.json

Langkah 3: Buka file Main.xaml Nanonets Component

Untuk memeriksa apakah Nanonets UiPath berfungsi atau tidak, Anda dapat membuka file Main.xml dari komponen Nanonets yang diunduh menggunakan Ui Path Studio. Kemudian Anda dapat melihat pipeline Anda sudah dibuat untuk Anda untuk pemrosesan dokumen.

Langkah 4: Kumpulkan ID Model, Kunci API, dan Titik Akhir API Anda dari Nanonets APP

Selanjutnya, Anda dapat menggunakan salah satu model OCR terlatih dari Nanonets APP dan mengumpulkan ID Model, Kunci API, dan titik akhir. Berikut adalah detail selengkapnya agar Anda dapat menemukannya dengan cepat.

ID Model: Masuk ke akun Nanonets Anda dan arahkan ke "Model Saya". Anda dapat melatih model baru atau menyalin ID Aplikasi dari model yang sudah ada.

Titik Akhir API: Anda dapat memilih model yang ada dan klik Integrasikan untuk menemukan titik akhir API Anda. Di bawah ini adalah contoh tampilan titik akhir Anda.

https://app.nanonets.com/api/v2/OCR/Model/XXXXXXX-4840-4c27-8940-d3add200779e/LabelUrls/

3. Kunci API: Arahkan ke tab Kunci API, dan Anda dapat menyalin Kunci API yang ada atau membuat yang baru.

Langkah 5: Tambahkan Permintaan HTTP untuk mendapatkan metode dan Variabel Anda ke Jalur UI

Sekarang untuk mengintegrasikan Model Anda dari Nanonets ke UI Path, Anda akan memiliki klik pertama pada Permintaan HTTP dan menambahkan EndPoint, yang dapat ditemukan di navigasi kiri di bawah bagian Input. Berikut tangkapan layarnya.

Nanti, tambahkan semua variabel Anda untuk membuat koneksi dari studio UiPath Anda ke Nanonets API. Anda dapat menemukan bagian ini di panel bawah di "Tab Variabel." Di bawah ini adalah tangkapan layar, Anda harus memperbarui / menyalin Kunci API, Titik Akhir, dan ID Model model Anda di sini.

Langkah 6: Tambahkan Lokasi File untuk Prediksi

Terakhir, Anda dapat menambahkan lokasi file Anda di bawah tab atribut, seperti yang ditunjukkan pada gambar di bawah ini, dan tekan tombol putar di navigasi atas Anda untuk memprediksi keluaran Anda.

Voila! Berikut adalah keluaran kami untuk dokumen yang kami minta pada gambar di bawah ini. Untuk memproses lebih lanjut, Anda cukup menambahkan lokasi file Anda dan menekan tombol run.

Langkah 7 - Dorong Output ke CSV / ERP

Terakhir, untuk menyesuaikan output kami ke dalam format yang Anda inginkan, kami dapat menambahkan blok baru ke pipeline Anda di file Main.XML. Kami juga dapat mendorong ini ke sistem ERP yang ada melalui file offline atau Panggilan API.

Untuk bantuan apa pun hubungi kami di support@nanonets.com

Webinar

Bergabunglah dengan kami untuk Webinar Selasa depan di OCR dengan RPA, Daftar disini.

Referensi

[1] Gartner Mengatakan Otomatisasi Proses Robotik Dapat Menghemat Departemen Keuangan 25,000 Jam Kerja yang Dapat Dihindari Setiap Tahun

[2] Pemahaman Dokumen - Pemrosesan Dokumen AI

[3] RPA OCR - meningkatkan otomatisasi proses | BAGUS

[4] Cara Menggunakan AI untuk Mengoptimalkan Pemahaman Dokumen

[5] https://www.uipath.com/product/document-understanding

[6] Menggunakan NanoNets di UiPath Workflow untuk Invoice OCR

Selanjutnya Membaca

Anda mungkin tertarik dengan postingan terbaru kami di:

Update:‌
Menambahkan lebih banyak bahan bacaan tentang penggunaan dan dampak OCR, RPA dalam pemahaman dokumen.

Sumber: https://nanonets.com/blog/ocr-with-rpa-and-document-understanding-uipath/

Stempel Waktu: 19 Mei 2021

Stempel Waktu: Juni 20, 2022

Panduan Komprehensif untuk OCR dengan RPA dan Pemahaman Dokumen

Diterbitkan Ulang Oleh Plato

Definisi dan Gambaran Umum

Bagaimana Robot dapat belajar memahami dokumen dengan OCR dan ML

Bagaimana perusahaan dapat mengintegrasikan OCR cerdas dengan RPA untuk meningkatkan alur kerja

Tantangan OCR yang dihadapi oleh pengembang RPA

Pipeline untuk Alur Kerja Pemahaman Dokumen

Manfaat mengintegrasikan robot dengan Pemahaman Dokumen

Masukkan Nanonet

NanoNets dengan UiPath

Webinar

Referensi

Selanjutnya Membaca

Anda mungkin tertarik dengan postingan terbaru kami di:

Lebih dari AI & Pembelajaran Mesin

Otomatisasi Hutang Akun Quickbooks

Apa itu PO Selimut?

Bagaimana Mengonversi Email ke Google Spreadsheet?

Apa itu otomatisasi pelaporan keuangan?

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun