A Comprehensive Guide To OCR With RPA And Document Understanding

הועלה מחדש על ידי אפלטון

עוקב: 0

עדכון אחרון: ינואר 2021.

בלוג זה הוא סקירה מקיפה של השימוש ב- OCR עם כל כלי RPA לאוטומציה של תהליכי העבודה של המסמכים שלך. אנו חוקרים כיצד טכנולוגיות ה- OCR המבוססות על למידת מכונה אינן דורשות כללים או הגדרת תבנית.

RPAs או אוטומציה של תהליך רובוטי הם כלי תוכנה שמטרתם לחסל משימות עסקיות חוזרות ונשנות. יותר אנשי CIO פונים אליהם כדי להפחית עלויות ולעזור לעובדים להתמקד בעבודה עסקית בעלת ערך גבוה יותר. דוגמאות כוללות תגובה לתגובות באתרים או עיבוד הזמנת לקוחות. משימות מורכבות מעט יותר כוללות טיפול במסמכים כמו טפסים בכתב יד ו חשבוניות – these typically need to be moved from one legacy system to the other – say your email client to your SAP ERP system where you need to extract data. זה החלק הבעייתי.

רוב כלי ה-OCR הלוכדים נתונים ממסמכים אלה מבוססים על תבניות (למשל אבי Flexicapture) and don’t scale well on semi-structured documents. There are newer generation machine learning based solutions that typically provide API
אינטגרציות שיכולות ללכוד זוגות של ערכי מפתח ממסמכים - מערכות ארגוניות בדרך כלל הן מדור קודם ולא פתוחות לשילוב עם ממשקי API חיצוניים. בצד השני, RPAs בנויים להתמודד עם תהליכי עבודה מדור קודם של מערכות כמו בליעת מסמכים מתיקיות והזנת תוצאות ל- ERP או CRM.

מכיוון שאוטומציה של תהליכים רובוטיים (RPA) ו- ML מתפתחים לקראת אוטומציה יתר, אנו יכולים להשתמש בבוטים של תוכנה בשילוב עם ML לטיפול במשימות מורכבות כמו סיווג מסמכים, חילוץ וזיהוי תווים אופטי. במחקר שנערך לאחרונה נאמר כי על ידי אוטומציה של 29% בלבד מהפונקציות למשימה המשתמשת ב- RPA, מחלקות הכספים בלבד חוסכות יותר מ- 25,000 שעות של עיבוד חוזר שנגרם על ידי טעויות אנושיות בעלות של 878,000 $ לשנה עבור ארגון עם 40 מלאים צוות חשבונאות זמן [1]. בבלוג זה נלמד על שימוש ב- OCR עם RPA ונצלול עמוק לתהליכי הבנת מסמכים. להלן תוכן העניינים.

הגדרות וסקירה כללית

RPA, באופן כללי, היא טכנולוגיה שעוזרת לבצע אוטומציה של משימות ניהול באמצעות בוטים של תוכנה-חומרה. בוטים אלו מנצלים את ממשקי המשתמש; ללכוד את הנתונים ולתפעל יישומים כפי שעושים בני אדם. לדוגמה, RPA יכול להסתכל על סדרה של משימות שבוצעו ב-GUI, למשל הזזת סמנים, להתחבר לממשקי API, להעתיק ולהדביק את הנתונים ולנסח את אותו רצף של פעולות ב-RPA wireframe שמתורגם לקוד. יתר על כן, ניתן לבצע משימות אלו ללא התערבות אנושית בעתיד. זיהוי תווים אופטי (OCR) הוא מאפיין מכריע בכל פתרון פונקציונלי של אוטומציה של תהליכים רובוטיים (RPA). טכנולוגיה זו משמשת כדי לקרוא ולחלץ טקסט ממקורות שונים כמו תמונות או pdf לפורמט דיגיטלי מבלי ללכוד אותו באופן ידני.

מצד שני, הבנת מסמך היא המונח המשמש לתיאור אוטומטי של קריאה, פירוש ופעולה על פי נתוני המסמך. החשוב ביותר בתהליך זה הוא תוכנת בוטים עצמה לבצע את כל המשימות. בוטים אלה ממנפים את כוחם של בינה מלאכותית ולמידת מכונה כדי להבין מסמכים כעוזרים דיגיטליים. בדרך זו אנו יכולים לומר כי הבנת מסמכים מתרחשת בצומת עיבוד מסמכים, AI ו- RPA.

הבנת המסמך מתגלה בצומת של עיבוד מסמכים, AI ו- RPA. [מקור תמונה: הבנת מסמך נתיב Ui [2]]

כיצד רובוטים יכולים ללמוד להבין את המסמכים באמצעות OCR ו- ML

לפני שנעמיק תחילה בהבנת מסמכים, בואו נדבר על תפקידם של רובוטים להבנת מסמכים. העוזרים הבלתי נראים הללו הופכים את חיינו להרבה יותר נוחים. בניגוד לסרטים וסדרות, רובוטים אלה אינם מכשירים פיזיים או תוכניות בינה מלאכותית היושבים ליד שולחן העבודה ולוחצים על כפתורים לביצוע משימות. אנו יכולים לחשוב על אלה כעוזרים דיגיטליים שאומנו לעבד מסמכים על ידי קריאה ושימוש ביישומים כמונו. בצד הפונקציונלי, הרובוטים טובים בשיפור הביצועים והיעילות של התהליך. ובכל זאת, הן תוכנה עצמאית, אינן יכולות להעריך את התהליך ולקבל החלטות קוגניטיביות. עם זאת, אם למידת מכונה תשולב בהצלחה, הרובוטיקה תהפוך לדינמית ומסתגלת יותר. לדוגמא, רובוטים המשמשים לעיבוד מסמכים, לניהול נתונים ולפונקציות אחרות במשרד הקדמי ובמשרד הבינוני יבצעו פעולות חכמות יותר, כגון ביטול רשומות כפולות או פתרון חריגים לא ידועים של המערכת בתהליך. יתר על כן, הרובוטים מאומנים לקרוא, לחלץ, לפרש ולפעול על פי נתונים מהמסמכים באמצעות בינה מלאכותית (AI).

כיצד חברות יכולות לשלב OCR חכם עם RPA כדי לשפר את תהליכי העבודה

חילוץ נתוני מסמך הוא מרכיב מכריע להבנת המסמכים. בחלק זה נדון כיצד נוכל לשלב OCR עם RPA או להיפך. ראשית, כולנו ידענו שיש סוגים שונים של מסמכים מבחינת תבניות, סגנון, עיצוב ולפעמים שפה. לפיכך איננו יכולים להסתמך על טכניקת OCR פשוטה לחילוץ הנתונים ממסמכים אלה. כדי לטפל בבעיה זו, נשתמש הן בגישות מבוססות-כללים והן בגישות מבוססות-מודל בתוך OCR לטיפול בנתונים ממבני מסמכים שונים. כעת נראה כיצד חברות העושות OCR יכולות לשלב RPA במערכת הקיימת שלהן על סמך סוג המסמכים.

מסמכים מובנים: בסוג זה של מסמכים, הפריסות והתבניות בדרך כלל קבועות וכמעט עקביות. לדוגמה, שקול ארגון שעושה KYC עם תעודות זהות שהונפקו על ידי הממשלה כמו דרכון או רישיון נהיגה. כל המסמכים הללו יהיו זהים ויהיו שדות זהים למספר תעודת זהות, שם האדם, גיל ומעטים אחרים באותם תפקידים. אבל רק הפרטים משתנים. יכולות להיות אילוצים מעטים כמו הצפה בטבלה או נתונים לא מסוננים.

בדרך כלל, הגישה המומלצת משתמשת בתבנית או במנוע מבוסס כללים כדי לחלץ את המידע למסמכים מובנים. אלה יכולים לכלול ביטויים רגולריים או מיפוי מיקום פשוט ו- OCR. מכאן שכדי לשלב רובוטים של תוכנה לאוטומציה של חילוץ מידע, נוכל להשתמש בתבניות קיימות או ליצור כללים לנתונים המובנים שלנו. יש חיסרון אחד בשימוש בגישה המבוססת על כלל, מכיוון שהיא מסתמכת על חלקים קבועים, אפילו שינויים קלים במבנה הטופס עלולים לגרום לפירוק כללים.

מסמכים מובנים למחצה: למסמכים אלו יש מידע זהה אך מסודרים בעמדות שונות. למשל, קחו בחשבון חשבוניות מכיל 8-12 שדות זהים. בעוד כמה חשבוניות, ניתן למצוא את כתובת הסוחר בחלק העליון, ובאחרים ניתן למצוא אותה בחלק התחתון. בדרך כלל גישות מבוססות כללים אלו אינן נותנות דיוק גבוה; לפיכך אנו מביאים לתמונה מודלים של למידת מכונה ולמידה עמוקה לצורך מיצוי מידע באמצעות OCR. לחלופין, במקרים מסוימים, אנו יכולים להשתמש במודלים היברידיים הכוללים גם חוקים וגם מודלים של ML. כמה דגמים פופולריים שהוכשרו מראש הם FastRCNN, Attention OCR, Graph Convolutions לחילוץ מידע במסמכים. עם זאת, שוב לדגמים הללו יש מעט חסרונות; לפיכך אנו מודדים את ביצועי האלגוריתם באמצעות מדדים כמו דיוק או ציון ביטחון. מכיוון שהמודל לומד דפוסים, במקום לפעול לפי כללים קונקרטיים, הוא עלול לעשות טעויות בהתחלה מיד לאחר התיקונים. עם זאת, הפתרון לחסרונות הללו - ככל שמודל ה-ML מעבד יותר דוגמאות, כך הוא לומד יותר דפוסים כדי להבטיח דיוק.

מסמכים לא מובנים: RPA, today is unable to manage unstructured data directly, hence requiring robots first to extract and create structured data using OCR. Unlike structured and semi-structured documents, unstructured data doesn’t have a few key-values pairs. For example, in a few חשבוניות, אנו רואים כתובת של סוחר איפשהו ללא שם מפתח כלשהו; באופן דומה, אנו מקפידים על אותו הדבר עבור שדות אחרים כמו תאריך, מזהה חשבונית. כדי שמודלים של ML יעבדו אותם במדויק, הרובוטים צריכים ללמוד כיצד לתרגם טקסט כתוב לנתונים שניתן לבצע, כמו דוא"ל, מספר טלפון, כתובת וכו'. לאחר מכן המודל ילמד שיש לחלץ דפוסי מספרים בני 7 או 10 ספרות כמספרי טלפון וטקסט ענק המכיל קודים בני חמש ספרות ושמות עצם שונים כטקסט. כדי להפוך את המודלים הללו למדויקים יותר, אנו יכולים להשתמש גם בטכניקות מעיבוד שפה טבעית (NLP) כמו זיהוי ישויות בשם והטבעת מילים.

באופן כללי להבנת מסמכים, ראשית חיוני להבין את הנתונים ואז ליישם OCR עם RPA. בשלב הבא, במקום למפות תהליך שלב אחר שלב, אנו יכולים ללמד רובוט "לעשות כמוני" על ידי הקלטת התהליך כפי שהוא קורה עם יכולות OCR עוצמתיות כפי שפורט לעיל, על ידי שילוב כללים ואלגוריתמים של למידת מכונה. רובוט התוכנה עוקב אחר הקלקות והפעולות שלך על המסך ואז הופך אותם לתהליך עבודה הניתן לעריכה. אם אתה עובד לחלוטין בתוכניות מקומיות, זה ככל שאתה צריך לדעת.

אתגרי OCR העומדים בפני מפתחי RPA

ראינו כיצד אנו יכולים לשלב OCRR עם RPA למסמכים שונים, אך ישנם כמה מקרים של אתגרים בהם הרובוטים צריכים להתמודד היטב. בואו נדבר עליהם עכשיו!

נתונים חלשים או לא עקביים: נתונים ממלאים תפקיד מכריע בהבנת המסמכים. ברוב המקרים המסמכים נסרקים באמצעות מצלמות בהן יש סיכוי לאבד עיצוב מסמכים במהלך סריקת טקסט (כלומר, לא תמיד מזהים מודגש, נטוי וקו תחתון). לפעמים, ה- OCR עשוי לחלץ טקסט בצורה לא נכונה ולהוביל לשגיאות כתיב, הפסקות פסקה לא סדירות, מה שמקטין את הביצועים הכוללים של רובוטים. לפיכך הטיפול בכל הערכים החסרים ולכידת הנתונים בדיוק רב יותר היא חיונית להשגת דיוק גבוה יותר עבור OCR.
כיוון עמוד שגוי במסמכים: כיוון העמודים ועקמת היא גם אחת הבעיות הנפוצות המובילות לתיקון טקסט שגוי של OCR. זה קורה בדרך כלל כאשר המסמכים נסרקים בצורה שגויה בשלב איסוף הנתונים. כדי להתגבר על זה, נצטרך להכריז על כמה פונקציות לרובוטים כמו התאמה אוטומטית לדף, סינון אוטומטי כדי שיאפשרו את העלאת איכות המסמך הסרוק וקבלת נתונים נכונים על הפלט.
בעיות אינטגרציה: לא כל כלי ה- RPA מתפקדים היטב בסביבות שולחן עבודה מרוחקות - הם גורמים לקריסות ולבעיות קריטיות באוטומציה. יתרה מכך, מפתח RPA צריך לדעת איזה פתרון OCR יהיה הטוב ביותר למקרה ספציפי. כמו כן, כדי לעבוד עם כלי אוטומציה ספציפיים, מפתח RPA צריך לבחור רק בטכנולוגיית OCR מוגבלת שנוצרה על ידי מיקרוסופט, גוגל. לפיכך שילוב האלגוריתמים והמודלים המותאמים אישית שלנו מאתגר לפעמים.
כל הטקסט הוא טקסט מקושקש: עבור מקרי שימוש אמיתיים, טקסטים שנתפסו על ידי OCR כללי מקושקשים ואין להם מידע משמעותי בו הרובוטים יכולים להשתמש כדי לבצע פעולות משמעותיות. מפתחי RPA זקוקים לתמיכה חזקה ב- ML כדי להיות מסוגל לבנות יישומים שימושיים.

צינור להבנת זרימת העבודה של המסמכים

בסעיפים הקודמים ראינו כיצד בוטים עוזרים לבצע OCR עבור סוגים שונים של מסמכים. אבל OCR היא רק טכניקה הממירה תמונות או קבצים אחרים לטקסט. כעת, בחלק זה, נבחן את זרימת העבודה בנושא הבנת מסמכים כבר מתחילת איסוף המסמכים כדי לשמור סופית מידע משמעותי בפורמט הרצוי.

הוסף את המסמך מתיקיה באמצעות ה- Bot שלך: זהו הצעד הראשון להשגת הבנת מסמכים באמצעות בוטים. כאן נביא את המסמך שנמצא בפלטפורמת ענן (באמצעות ממשק API) או ממכונה מקומית. במקרים ספורים, אם המסמכים שלנו נמצאים בדפי אינטרנט, נוכל להפוך אוטומטית סקריפטים לגירוד באמצעות בוטים שבהם הם יכולים להביא מסמכים במועד.
סוג מסמך: After we fetch the data, it’s essential to understand the type of document and the format with which they are saved in our systems, as sometimes, we receive data from different sources in various file formats such as PDF, PNG, and JPG. Not just the file types, sometimes when the documents are scanned with phone cameras, a few challenging problems like image skewness, rotation, brightness, or low-resolution should also be handled. Thereby, we’ll have to make sure that bots classify these documents into the structured, semi-structured, or unstructured category, thus saving it in a generic format. The classification task is achieved by comparing the documents with templates and analyzing features like fonts, language, presence of key-value pairs, tables, etc.
חילוץ הנתונים באמצעות OCR: בסדר, עכשיו, לאחר שהבוטים סידרו את המסמכים שלנו בפורמט כללי וסיווגו אותם, הגיע הזמן שאנחנו דיגיטליים אותם בטכניקת OCR. עם זאת, נקבל את הטקסט, את מיקומו בקואורדינטות משותפות מהתמונות. זה עוזר לתקנן את המסמכים והנתונים לשלבים הבאים. אנו נתקלים גם בכמה כאשר תוכנת OCR לא הצליחה להבחין נכון בין תווים, כגון 't' לעומת 'i' או '0' לעומת 'O'. השגיאות שעליהם אתה רוצה להתחמק באמצעות תוכנת OCR עלולות להפוך לכאבי ראש חדשים כאשר טכנולוגיית OCR אינה מסוגלת לנתח את הניואנסים של המסמך על סמך איכותו או צורתו המקורית. כאן נכנס לתמונה למידת מכונה, עליה נדבר בשלב הבא.
מינוף ML / DL עבור OCR אינטליגנטי באמצעות בוטים: לאחר סיום הדיגיטציה של הנתונים, תוכנת ה- OCR צריכה להבין את סוג המסמך איתו הוא עובד ומה רלוונטי. אך תוכנת ה- OCR המסורתית יכולה להיאבק בהגדלת מאמצי סיווג המסמכים. לפיכך יש לאמן בוטים לתוכנה עם יכולות קוגניטיביות על ידי מינוף למידת מכונה וטכניקות למידה עמוקה כדי להפוך את ה- OCR לחכמים יותר. פתרונות OCR מבוססי ML יכולים לזהות סוג מסמך ולהתאים אותו לסוג מסמך ידוע המשמש את העסק שלך. הם יכולים גם לנתח ולהבין גושי טקסט במסמכים לא מובנים. לאחר שהפתרון ידע יותר על המסמך עצמו, הוא יכול להתחיל לחלץ מידע רלוונטי על בסיס כוונה ומשמעות.
שאיבת נתונים ומיון טובים יותר: חילוץ נתונים הוא הליבה של הבנת המסמכים. כפי שנדון בסעיף הקודם על שילוב RPA עם OCR בשלב זה, בחר בטכניקת חילוץ הנתונים בהתבסס על סוג המסמך. באמצעות RPA, אנו יכולים להגדיר בקלות באיזה מחלץ להשתמש, בין אם מדובר על כללי מבוסס או מבוסס ML או על טכניקת OCR מודל היברידי. בהתבסס על מדדי הביטחון והביצועים המוחזרים לאחר מיצוי המידע, רובוטי התוכנה ישמרו אותם בפורמט הרצוי לנו לצורך ניתוח נוסף. להלן תמונה כיצד אנו יכולים להגדיר מחלצים ולקבוע רמת ביטחון בכלי RPA על ידי UIPath.

*בחירת חילוצים נחוצים להבנת מסמכים בנתיב ממשק המשתמש*

6. אימות ותובנות מעצימות: מודלים של OCR ו- Machine Learning אינם מדויקים במאה אחוז מבחינת חילוץ מידע, ומכאן הוספת שכבת התערבות אנושית בעזרת רובוטים יכולה לפתור את הבעיה. האופן שבו אימות זה עובד הוא שבכל פעם שהרובוטים מתמודדים עם דיוק וחריגים נמוכים, הוא מעלה מיד הודעה למרכז הפעולה שבו עובד יכול לקבל בקשה לאמת נתונים או לטפל בחריגים ויכול לפתור כל אי וודאות בעניין של קליקים. יתר על כן, אנו יכולים לפתוח את הפוטנציאל של בינה מלאכותית לתעד נתונים לאורך זמן כדי לחזות, ולזהות חריגות אפשריות שעשויות להצביע על הונאה, כפילות ושגיאות אחרות.

היתרונות של שילוב רובוטים עם הבנת מסמכים

תהליך אוטומטי: הסיבה העיקרית לשילוב בוטים להבנת מסמכים היא להפוך את כל התהליך לאוטומטי מתחילתו ועד סופו. כל שעלינו לעשות הוא ליצור זרימת עבודה לבוטים ללמוד, לשבת ולהירגע. במהלך תהליך האימות, ייתכן שנצטרך לטפל בבעיות שקיבלו הודעות על ידי הרובוטים, שם מזוהים שגיאות או הונאות.
בוטים עם למידת מכונה: במהלך תהליך האוטומציה, אנו יכולים להפוך את הרובוטים לעמידים בפני למידת מכונה. המשמעות היא שהרובוטים יכולים גם ללמוד כיצד מודלים של Machine Learning מבצעים ובכך לשפר את המודלים כדי להשיג דיוק וביצועים גבוהים יותר להפקת טקסט ומידע של מסמכים.
עיבוד מגוון רחב של עיבוד מסמכים: למשימות כלליות כמו מיצוי טבלאות ומידע, נצטרך ליצור צינורות למידה עמוקים שונים עבור סוגים שונים של מסמכים. זה מוביל לבניית מספר יישומים ולפריסת מודלים שונים בשרתים שונים, מה שדורש הרבה מאמץ וזמן. כאשר הרובוטים נמצאים בתמונה למגוון רחב של מסמכים, נוכל לקבל רק צינור יחיד בו הבוטים יכולים לסווג אותם ואז להשתמש במודל המתאים למשימות שונות. אנו יכולים גם לשלב שירותים שונים באמצעות ממשקי API ולתקשר עם ארגונים אחרים מבחינת אחזור הנתונים.
קל לפרוס: להבנת מסמכים לאחר יצירת הצינורות, תהליך הפריסה הוא דקה בלבד. אנו יכולים לייצא ממשקי API המיובאים על ידי בוטים לאחר האימון, או שאנו יכולים לבנות פתרון RPA מותאם אישית שיכול לשמש במערכות המקומיות שלנו. סוג פריסה זה יכול גם לייעל את המפעלים ולהפחית את ההוצאות עם סיכונים מינימליים ביותר.

היכנסו לננונטס

NanoNets היא פלטפורמת למידת מכונה המאפשרת למשתמשים ללכוד מהם נתונים חשבוניות, קבלות ומסמכים אחרים ללא כל הגדרת תבנית. יש לנו אלגוריתמים מתקדמים של למידה עמוקה וראייה ממוחשבת שפועלים מאחור שיכולים להתמודד עם כל סוג של משימות הבנת מסמכים כמו OCR, חילוץ טבלה, חילוץ זוג מפתח-ערך. הם בדרך כלל מיוצאים כממשקי API או ניתנים לפריסה מקומית בהתבסס על מקרי שימוש שונים. הנה כמה דוגמאות,

מודל חשבונית: זיהוי שדות מפתח מתוך חשבוניות כמו שם קונה, מזהה חשבונית, תאריך, סכום וכו'.
דגם קבלות: זיהוי שדות מפתח מקבלות כמו שם מוכר, מספר, תאריך, סכום וכו '.
רישיון נהיגה (ארה"ב): זיהוי שדות מפתח כמו מספר רישיון, תאריך סיום, תאריך תפוגה, תאריך הנפקה וכו '.
קורות חיים: ניסיון לחלץ, השכלה, קבוצות מיומנויות, מידע על מועמדים וכו '.

כדי להפוך את זרימות העבודה הללו למהירות יותר וחזקות יותר, אנו משתמשים ב-UiPath, כלי RPA לאוטומציה חלקה של המסמכים שלך ללא כל תבנית. בסעיף הבא, נעבור על איך אתה יכול להשתמש ב-UiPath Connect עם Nanonets להבנת מסמכים. שלושת השחקנים הגדולים בשוק ה-RPA הם UiPath, Automation Anywhere ו פריזמה כחולה. בלוג זה מתמקד ב-Uipath.

NanoNets עם UiPath

למדנו ליצור צינור הבנת מסמכים בסעיפים הקודמים שלנו. זה דורש ידע בסיסי ב- OCR, RPA ו- Machine Learning, מכיוון שישנן גישות ואלגוריתמים שונים למשימות שונות בנקודות שונות. כמו כן, עלינו להשקיע מאמצים רבים בבניית רשתות עצביות שמבינות את התבניות שלנו, הכשרה ופריסה שלהן. לפיכך, כדי להיות נוחים ולאוטומטיים הכל, מהעלאת מסמכים, סיווגם, בניית OCR, שילוב מודלים של ML, אנו בחברת Nanonets עובדים על Ui Path כדי ליצור צינור חלק להבנת מסמכים. להלן תמונה של איך זה עובד.

עכשיו בואו נבדוק כל אחד מאלה ונלמד כיצד נוכל לשלב את Nanonets עם UiPath.

שלב 1: הרשמה ב- UiPath והורדת UiPath Studio

כדי ליצור זרימת עבודה, ראשית, נצטרך ליצור חשבון ב- UiPath. אם אתה משתמש קיים, אתה יכול להתחבר ישירות לחשבונך ולנתב מחדש את לוח המחוונים של UiPath. לאחר מכן, יהיה עליך להוריד ולהתקין את UiPath Studio (מהדורת הקהילה), שהוא ללא תשלום.

שלב 2: הורד את רכיב Nanonets

לאחר מכן, כדי להגדיר את צינור עיבוד חשבוניותתצטרך להוריד את מחבר Nanonets מהקישור למטה.

-> NanoNets OCR - רכיב RPA

להלן צילום מסך של UiPath Marketplace ו- Nanonets Component. כמו כן, כדי להוריד את זה, ודא שאתה מחובר ל- UiPath ממערכת הפעלה של Windows.

הקבצים שהורדת צריכים להכיל את הקבצים המפורטים להלן,

UiPath OCR Predict ├── Main.xaml
└── project.json

שלב 3: פתח את הקובץ Main.xaml Nanonets Component

כדי לבדוק אם UiPath של Nanonets עובד או לא, אתה יכול לפתוח את קובץ Main.xml שלך מהרכיב Nanonets שהורדת באמצעות Ui Path Studio. אז אתה יכול לראות את הצינור שלך כבר נוצר עבורך לעיבוד מסמכים.

שלב 4: אסוף את מזהה הדגם, מפתח ה- API ונקודת הקצה של ה- API מאפליקציית Nanonets

לאחר מכן תוכל להשתמש בכל אחד ממודלי ה- OCR המאומנים של Nanonets APP ולאסוף את מזהה הדגם, מפתח ה- API ונקודת הקצה. להלן פרטים נוספים כדי למצוא אותם במהירות.

מזהה דגם: היכנס לחשבון Nanonets שלך ונווט אל "הדגמים שלי". אתה יכול לאמן מודל חדש או להעתיק את מזהה היישום של מודל קיים.

נקודת סיום API: אתה יכול לבחור כל מודל קיים ולחץ על שילוב כדי למצוא את נקודת הקצה של ה- API שלך. להלן דוגמה לאופן שבו נקודות הקצה שלך נראות.

https://app.nanonets.com/api/v2/OCR/Model/XXXXXXX-4840-4c27-8940-d3add200779e/LabelUrls/

3. מפתח API: נווט לכרטיסייה מפתח API, ותוכל להעתיק כל מפתח API קיים או ליצור מפתח חדש.

שלב 5: הוסף בקשת HTTP כדי לקבל את השיטה והמשתנים שלך לנתיב ממשק המשתמש

כעת כדי לשלב את המודל שלך מ- Nanonets לנתיב ממשק המשתמש, תלחץ על הלחיצה הראשונה על HTTP Request ותוסיף את EndPoint, אשר ניתן למצוא בניווט השמאלי בקטע Input. להלן צילום מסך.

מאוחר יותר, הוסף את כל המשתנים שלך כדי ליצור חיבור מאולפן UiPath שלך ל- Nanonets API. תוכל למצוא את החלק הזה בחלונית התחתונה בכרטיסייה "משתנים". להלן צילום המסך, יהיה עליך לעדכן / להעתיק את מפתח ה- API שלך, נקודת הקצה ואת מזהה הדגם של המודל שלך כאן.

שלב 6: הוסף מיקום קובץ לחיזויים

לבסוף, אתה יכול להוסיף את מיקום הקובץ שלך בכרטיסיית התכונות, כפי שמוצג בצילום המסך שלמטה, ולחץ על כפתור ההפעלה בניווט העליון שלך כדי לחזות את התפוקות שלך.

וואלה! להלן התפוקות שלנו למסמך שביקשנו בצילום המסך שלהלן. כדי לעבד יותר, אתה יכול פשוט להוסיף את מיקומי הקבצים שלך וללחוץ על כפתור ההפעלה.

שלב 7 - דחף את הפלט ל- CSV / ERP

לבסוף, כדי להתאים אישית את הפלט שלנו לפורמט הרצוי שלך אנו יכולים להוסיף חסימות חדשות לצינור שלך בקובץ Main.XML. אנו יכולים גם לדחוף זאת לכל מערכות ERP קיימות באמצעות קבצים לא מקוונים או שיחות API.