טקסטורה באמזון הוא שירות למידת מכונה (ML) המחלץ אוטומטית טקסט, כתב יד ונתונים מכל מסמך או תמונה. AnalyzeDocument Signatures היא תכונה בתוך Amazon Textract שמציעה את היכולת לזהות חתימות אוטומטית על כל מסמך. זה יכול להפחית את הצורך בסקירה אנושית, קוד מותאם אישית או ניסיון ב-ML.
בפוסט זה, אנו דנים ביתרונות של התכונה AnalyzeDocument Signatures וכיצד ה-API של AnalyzeDocument Signatures עוזר לזהות חתימות במסמכים. אנו גם עוברים על אופן השימוש בתכונה דרך קונסולת Amazon Textract ומספקים דוגמאות קוד לשימוש ב-API ולעבד את התגובה עם ספריית מנתח התגובות של Amazon Textract. לבסוף, אנו חולקים כמה שיטות עבודה מומלצות לשימוש בתכונה זו.
היתרונות של תכונת החתימות
לקוחותינו מענפי הביטוח, המשכנתאות, המשפט והמיסוי עומדים בפני האתגר של עיבוד כמויות עצומות של מסמכים מבוססי נייר תוך הקפדה על דרישות רגולטוריות ותאימות הדורשות חתימות במסמכים. ייתכן שיהיה עליך לוודא שטפסים ספציפיים כגון בקשות להלוואה או תביעות שהוגשו על ידי לקוחות הקצה שלך מכילים חתימות לפני שתתחיל לעבד את הבקשה. עבור תהליכי עבודה מסוימים של עיבוד מסמכים, ייתכן שיהיה עליך ללכת צעד קדימה כדי לחלץ ולהשוות את החתימות לצורך אימות.
מבחינה היסטורית, לקוחות בדרך כלל מנתבים את המסמכים לבודק אנושי כדי לזהות חתימות. שימוש בבודקים אנושיים כדי לזהות חתימות נוטה לדרוש כמות משמעותית של זמן ומשאבים. זה יכול גם להוביל לחוסר יעילות בזרימת העבודה של עיבוד המסמכים, וכתוצאה מכך זמני אספקה ארוכים יותר וחווית משתמש קצה גרועה.
התכונה AnalyzeDocument Signatures מאפשרת לך לזהות אוטומטית חתימות בכתב יד, חתימות אלקטרוניות וראשי תיבות על מסמכים. זה יכול לעזור לך לבנות פתרון אוטומטי שניתן להרחבה עם פחות הסתמכות על עיבוד ידני יקר וגוזל זמן. לא רק שאתה יכול להשתמש בתכונה זו כדי לוודא אם המסמך חתום, אלא שאתה יכול גם לאמת אם שדה מסוים בטופס נחתם באמצעות פרטי המיקום של החתימות שזוהו. אתה יכול גם להשתמש בפרטי מיקום כדי לבטל מידע אישי מזהה (PII) במסמך.
כיצד AnalyzeDocument Signatures מזהה חתימות במסמכים
ל-AnalyzeDocument API יש ארבעה סוגי תכונות: טפסים, טבלאות, שאילתות וחתימות. כאשר Amazon Textract מעבדת מסמכים, התוצאות מוחזרות במערך של לחסום חפצים. ניתן להשתמש בתכונת החתימות בפני עצמה או בשילוב עם סוגי תכונה אחרים. בשימוש בפני עצמו, סוג התכונה Signatures מספק תגובת JSON הכוללת את ציוני המיקום והביטחון של החתימות שזוהו והטקסט הגולמי (מילים ושורות) מהמסמכים. תכונת החתימות בשילוב עם סוגי תכונה אחרים, כגון טפסים וטבלאות, יכולה לעזור להפיק תובנות שימושיות. במקרים בהם נעשה שימוש בתכונה עם טפסים וטבלאות, התגובה מציגה את החתימה כחלק מצמד ערכי מפתח או תא טבלה. לדוגמה, התגובה עבור הטופס הבא מכילה את המפתח as חתימת המלווה והערך כ- Block
אובייקט.
כיצד להשתמש בתכונת החתימות בקונסולת Amazon Textract
לפני שנתחיל עם ה-API ודוגמאות הקוד, בואו נסקור את קונסולת Amazon Textract. לאחר העלאת המסמך לקונסולת Amazon Textract, בחר זיהוי חתימה ב הגדר את המסמך סעיף ובחר החל תצורה.
צילום המסך הבא מציג דוגמה של תלוש תשלום ב- חתימות לשונית עבור ה-API של Analyze Document בקונסולת Amazon Textract.
התכונה מזהה ומציגה את החתימה עם העמוד התואם שלה וציון הביטחון.
דוגמאות קוד
אתה יכול להשתמש בתכונת החתימות כדי לזהות חתימות על סוגים שונים של מסמכים, כגון צ'קים, טופסי בקשה להלוואה, טופסי תביעה, תלושי משכורת, מסמכי משכנתא, דפי בנק, הסכמי שכירות וחוזים. בסעיף זה, אנו דנים בחלק מהמסמכים הללו ומראים כיצד להפעיל את ה-API של AnalyzeDocument עם הפרמטר Signatures כדי לזהות חתימות.
מסמך הקלט יכול להיות בפורמט של מערך בתים או ממוקם ב- שירות אחסון פשוט של אמזון דלי (Amazon S3). עבור מסמכים בפורמט של מערך בתים, אתה יכול לשלוח בתים של תמונה לפעולת Amazon Textract API באמצעות bytes
תכונה. חתימות כסוג תכונה נתמכות על ידי ה-API של AnalyzeDocument לעיבוד מסמכים סינכרוני ו-StartDocumentAnalysis לעיבוד אסינכרוני של מסמכים.
בדוגמה הבאה, אנו מזהים חתימות על מכתב אימות העסקה.
אנו משתמשים בקוד Python לדוגמה הבא:
בואו ננתח את התגובה שאנו מקבלים מ-AnalyzeDocument API. התגובה הבאה נחתכה כדי להציג רק את החלקים הרלוונטיים. בתגובה יש א BlockType
of SIGNATURE
שמראה את ציון הביטחון, המזהה של החסימה ופרטי התיבה התוחמת:
אנו משתמשים בקוד הבא כדי להדפיס את המזהה והמיקום בפורמט טבלה:
צילום המסך הבא מציג את התוצאות שלנו.
פרטים נוספים והקוד המלא זמינים במחברת ב- GitHub ריפו.
עבור מסמכים שיש להם חתימות קריאות בפורמטים של ערכי מפתח, נוכל להשתמש ב- מנתח תגובה של Textract כדי לחלץ רק את שדות החתימה על ידי חיפוש המפתח והערך המתאים למפתחות אלה:
הקוד הקודם מחזיר את התוצאות הבאות:
שימו לב שכדי לתמלל את החתימות בצורה זו, על החתימות להיות קריאות.
שיטות עבודה מומלצות לשימוש בתכונת החתימות
שקול את השיטות המומלצות הבאות בעת השימוש בתכונה זו:
- לתגובות בזמן אמת, השתמש בפעולה הסינכרונית של ה-API של AnalyzeDocument. למקרי שימוש שבהם אינך זקוק לתגובה בזמן אמת, כגון עיבוד אצווה, אנו מציעים להשתמש בפעולה האסינכרונית של ה-API.
- תכונת החתימות פועלת בצורה הטובה ביותר כאשר יש עד שלוש חתימות בדף. כאשר יש יותר משלוש חתימות בדף, עדיף לפצל את הדף למקטעים ולהזין כל אחד מהקטעים בנפרד ל-API.
- השתמש בציוני האמון המסופקים עם החתימות שזוהו כדי לנתב את המסמכים לבדיקה אנושית כאשר הציונים אינם עומדים בסף הנדרש שלך. ציון הביטחון אינו מדד לדיוק, אלא אומדן של אמון המודל בתחזית שלו. עליך לבחור ציון ביטחון שהכי הגיוני עבור מקרה השימוש שלך.
<br> סיכום
בפוסט זה, סיפקנו סקירה כללית של תכונת החתימות של Amazon Textract לזיהוי אוטומטי של חתימות על מסמכים, כגון תלושי שכר, הסכמי שכירות וחוזים. AnalyzeDocument Signatures מפחיתה את הצורך בבודקים אנושיים ועוזרת לך להפחית עלויות, לחסוך זמן ולבנות פתרונות ניתנים להרחבה לעיבוד מסמכים.
כדי להתחיל, היכנס לקונסולת Amazon Textract כדי לנסות את התכונה. למידע נוסף על יכולות Amazon Textract, עיין ב טקסטורה באמזון, ה מדריך למפתחי טקסטורה של אמזון, או משאבי Textract.
על הכותבים
מרן צ'נדראסקארן הוא ארכיטקט פתרונות בכיר בחברת Amazon Web Services, שעובד עם הלקוחות הארגוניים שלנו. מחוץ לעבודה, הוא אוהב לטייל ולרכוב על האופנוע שלו בטקסס היל קאנטרי.
שיבין מיכאלרג' הוא מנהל מוצר אב בצוות AWS Textract. הוא מתמקד בבניית מוצרים מבוססי AI/ML עבור לקוחות AWS.
סופראקש דוטה הוא Sr. Solutions Architect בשירותי האינטרנט של אמזון. הוא מתמקד באסטרטגיית טרנספורמציה דיגיטלית, מודרניזציה והגירה של יישומים, ניתוח נתונים ולמידת מכונה. הוא חלק מקהילת AI/ML ב-AWS ומעצב פתרונות חכמים לעיבוד מסמכים.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- Platoblockchain. Web3 Metaverse Intelligence. ידע מוגבר. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/detect-signatures-on-documents-or-images-using-the-signatures-feature-in-amazon-textract/
- 100
- a
- יכולת
- אודות
- דיוק
- לאחר
- הסכמים
- AI / ML
- מאפשר
- אמזון בעברית
- טקסטורה באמזון
- אמזון שירותי אינטרנט
- כמות
- ניתוח
- לנתח
- ו
- API
- בקשה
- יישומים
- מערך
- אוטומטי
- באופן אוטומטי
- זמין
- AWS
- בנק
- לפני
- הטבות
- הטוב ביותר
- שיטות עבודה מומלצות
- לחסום
- אבני
- אריזה מקורית
- לִבנוֹת
- בִּניָן
- שיחה
- יכולות
- מקרה
- מקרים
- מסוים
- לאתגר
- בדיקות
- בחרו
- טענות
- לקוחות
- לקוחות
- קוד
- שילוב
- משולב
- קהילה
- לְהַשְׁווֹת
- להשלים
- הענות
- אמון
- קונסול
- מכיל
- חוזים
- תוֹאֵם
- עלויות
- מדינה
- מנהג
- לקוחות
- נתונים
- ניתוח נתונים
- עיצובים
- פרטים
- זוהה
- איתור
- מפתח
- אחר
- דיגיטלי
- טרנספורמציה דיגיטלית
- לדון
- מסמך
- מסמכים
- לא
- כל אחד
- או
- אֶלֶקטרוֹנִי
- תעסוקה
- לְהַבטִיחַ
- מִפְעָל
- לקוחות ארגוניים
- לְהַעֲרִיך
- Ether (ETH)
- דוגמה
- דוגמאות
- ניסיון
- תמצית
- תמציות
- פָּנִים
- מאפיין
- שדה
- שדות
- מרוכז
- מתמקד
- הבא
- טופס
- פוּרמָט
- צורות
- החל מ-
- נוסף
- בדרך כלל
- גאומטריה
- לקבל
- Go
- רֶשֶׁת
- גובה
- לעזור
- עוזר
- איך
- איך
- HTML
- HTTPS
- עצום
- בן אנוש
- תמונה
- תמונות
- לייבא
- in
- כולל
- תעשיות
- מידע
- קלט
- תובנות
- ביטוח
- אינטליגנטי
- עיבוד מסמכים חכם
- IT
- עצמו
- ג'סון
- מפתח
- מפתחות
- עוֹפֶרֶת
- לִלמוֹד
- למידה
- משפטי
- מַשׁאִיל
- מכתב
- סִפְרִיָה
- קווים
- להלוות
- מקומי
- ממוקם
- מיקום
- עוד
- מכונה
- למידת מכונה
- עושה
- מנהל
- מדריך ל
- למדוד
- לִפְגוֹשׁ
- הֲגִירָה
- ML
- מוֹדֶרנִיזָצִיָה
- יותר
- משכנתה
- רוב
- אופנוע
- צורך
- מחברה
- אובייקט
- אובייקטים
- המיוחדות שלנו
- מבצע
- להזמין
- אחר
- בחוץ
- סקירה
- מבוסס נייר
- פרמטר
- חלק
- מסוים
- חלקים
- חולף
- אישית
- pii
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- מְצוּלָע
- עני
- הודעה
- פרקטיקות
- נבואה
- מתנות
- קופונים להדפסה
- תהליך
- תהליכים
- תהליך
- המוצר
- מנהל מוצר
- מוצרים
- רכוש
- לספק
- ובלבד
- מספק
- פיתון
- חי
- ממשי
- זמן אמת
- להפחית
- מפחית
- רגולטורים
- רלוונטי
- הסתמכות
- לדרוש
- נדרש
- דרישות
- משאבים
- תגובה
- וכתוצאה מכך
- תוצאות
- החזרות
- סקירה
- ריצ'רד
- לרכוב
- מסלול
- שמור
- להרחבה
- חיפוש
- חיפוש
- סעיף
- סעיפים
- לחצני מצוקה לפנסיונרים
- תחושה
- לְחוּד
- שרות
- שירותים
- שיתוף
- צריך
- לְהַצִיג
- הופעות
- חתימות
- חָתוּם
- משמעותי
- פָּשׁוּט
- פִּתָרוֹן
- פתרונות
- כמה
- ספציפי
- לפצל
- התחלה
- החל
- הצהרות
- שלב
- אחסון
- אִסטרָטֶגִיָה
- להגיש
- הוגש
- כזה
- נתמך
- שולחן
- מס
- נבחרת
- טקסס
- השמיים
- הבלוק
- שְׁלוֹשָׁה
- סף
- דרך
- זמן
- דורש זמן רב
- פִּי
- ל
- חלק עליון
- טרנספורמציה
- אסטרטגיית טרנספורמציה
- נסיעות
- TRP
- סוגים
- להשתמש
- במקרה להשתמש
- לְאַמֵת
- ערך
- אימות
- לאמת
- כרכים
- אינטרנט
- שירותי אינטרנט
- אם
- בזמן
- בתוך
- מילים
- תיק עבודות
- זרימת עבודה
- זרימות עבודה
- עובד
- עובד
- X
- זפירנט