טקסטורה באמזון הוא שירות למידת מכונה (ML) המחלץ אוטומטית טקסט, כתב יד ונתונים מכל מסמך או תמונה. כדי להפוך את זה לפשוט יותר להעריך את היכולות של Amazon Textract, השקנו תכונה חדשה של העלאת מסמכים בתפזורת בקונסולת Amazon Textract המאפשרת לך לעבד במהירות את סט המסמכים שלך מבלי לכתוב שום קוד.
בפוסט זה, אנו עוברים על מתי וכיצד להשתמש ב-Amazon Textract Bulk Document Uploader כדי להעריך את הביצועים של Amazon Textract במסמכים שלך.
סקירה כללית של הפיתרון
יש להשתמש ב-Buk Document Uploader להערכה מהירה של Amazon Textract עבור מקרי שימוש קבועים מראש. על ידי העלאת מסמכים מרובים בו-זמנית דרך ממשק משתמש אינטואיטיבי, אתה יכול בקלות לאמוד את ביצועי Amazon Textract במסמכים שלך.
ניתן להעלות ולעבד עד 150 מסמכים בבת אחת. בניגוד להדגמות קונסולת Amazon Textract הקיימות, המטילות מגבלות מלאכותיות על מספר המסמכים, גודל המסמכים ומספר העמודים המרבי המותר, העלאת מסמכים בכמות גדולה תומך בעיבוד של עד 150 מסמכים לכל בקשה ובעל אותן גודל מסמכים ומגבלות עמודים כמו ממשקי ה-API של Amazon Textract. זה עושה את זה יעיל יותר עבורך להעריך קבוצה גדולה יותר של מסמכים.
העלאת מסמכים בכמות גדולה מוציאה תגובת JSON סטנדרטית של Amazon Textract וקובץ CSV. התוצאות מסופקות בפורמט JSON לניתוח פרוגרמטי קל. בנוסף, קובץ CSV הניתן לקריאה אנושית עם ציוני ביטחון מסופק להשוואה והערכה פשוטה של המידע שחולץ.
בעת שימוש בתכונה זו, זכור את הדברים הבאים:
- העלאת מסמכים בכמות גדולה מעבדת מסמכים באמצעות פעולות אסינכרוניות. אתה יכול לעקוב אחר מצב העיבוד בקונסולת Amazon Textract. רק DetectDocumentText (OCR), נתח את המסמך (טבלאות, שאילתות, טפסים וחתימות), ו AnalyzeExpense ממשקי API נתמכים כעת.
- העלאת מסמכים בכמות גדולה מספקת תוצאות JSON של פעולות ה-API ודוחות CSV מעוצבים. ייתכן שתצטרך להסתמך על כלים חיצוניים להדמיה של הנתונים, כגון הצגת הדגשים של תיבה תוחמת במסמך באמצעות תוצאות ה-JSON.
- השימוש בתכונה זו לעיבוד מסמכים כרוך באותם חיובים כמו השימוש הרגיל ב-Amazon Textract (תלוי באיזו תכונה נעשה שימוש), והוא כפוף למגבלות ה-TPS (עסקאות בשנייה) עבור ממשקי API המוגדרים עבור החשבון והאזור. למידע נוסף על תמחור, עיין ב תמחור אמזון טקסטראקט. למידע נוסף על מגבלות Amazon Textract, עיין ב מכסות ב- Amazon Textract.
- פורמטים מקובלים של קבצים להעלאה בכמות גדולה הם JPEG, PNG, TIF ו-PDF. גם תמונות מקודדות JPEG 2000 בתוך קובצי PDF נתמכות. לקובצי JPEG ו-PNG יש מגבלת גודל של 10 מגה-בייט, ואילו לקובצי PDF ו-TIF יש מגבלת גודל של 500 מגה-בייט. לקובצי PDF ו-TIF מרובי עמודים יש מגבלה של 3,000 עמודים.
השתמש בהעלאת מסמכים בכמות גדולה
העלאת מסמכים בתפזורת נועד לעזור לך להעריך במהירות כיצד Amazon Textract מתפקד על קבוצה של מסמכים משלך, ללא צורך בכתיבת קוד. אתה יכול להשתמש ב-Buk Document Uploader כדי לעבד עד 150 מסמכים במקום להעלות ולעבד מסמכים בנפרד. אתה יכול להעלות מסמכים בכמות גדולה ישירות מהמחשב שלך או לייבא מסמכים ממסמך קיים שירות אחסון פשוט של אמזון (אמזון S3) דלי.
העלאת מסמכים בכמות גדולה מספקת תוצאות שתוכל להוריד מאוחר יותר לבדיקה לא מקוונת. כל קובץ ZIP להורדה מכיל את תגובת ה-API של Amazon Textract בפורמט קובץ JSON וקובץ CSV הניתן לקריאה על ידי אדם של הפלט המכיל את הנתונים שחולצו וציוני האמון. תוצאות הפלט זמינות להורדה למשך 7 ימים לאחר העיבוד. לאחר 14 יום, המסמכים מנוקים מה- מסמכים שהוגשו סָעִיף. כדי להשתמש בהעלאת מסמכים בכמות גדולה, בצע את השלבים הבאים:
- בקונסולת Amazon Textract, תחת הדגמות בחלונית הניווט, בחר העלאת מסמכים בכמות גדולה.
- לבחור העלה מסמכים.
- ציין את מקור המסמכים שלך.
יש לך שתי אפשרויות להעלות מסמכים:
- ייבוא מסמכים מ-S3 bucket – אם אתה משתמש בדלי S3 עבור המסמכים שלך, ספק את כתובת האתר של הדלי ו(אופציונלי) את הקידומת שבה נמצאים המסמכים שלך, ב
s3://your-bucket/prefix/
פוּרמָט. לחילופין, בחר דפדף ב- S3 כדי לעיין ולבחור את המיקום הרצוי של המסמכים שלך. אם המיקום של Amazon S3 שציינת מכיל יותר מ-150 מסמכים, אז רק 150 המסמכים הראשונים יישלחו ל-Amazon Textract לעיבוד. - העלה מסמכים מהמחשב שלך - אם אתה מעלה מסמכים מהמחשב שלך, אתה יכול להעלות עד 50 מסמכים בכל פעם על ידי בחירה העלה מסמכים. להעלאת מסמכים נוספים (עד 150 מקסימום), בחר להוסיף מסמכים לאחר העלאת המסמכים הראשוניים שלך.
במקרה זה, המסמכים שלך מועלים לראשונה לדלי S3 בחשבון שלך שנוצר בשמך, לכן חשוב לוודא שיש לך הרשאות לגשת ולהעלות מסמכים לאמזון S3. זוהי פעולה חד פעמית, ואותו דלי ישמש עבור כל ההעלאות הבאות מהמחשב שלך. אם ברצונך להעלות ולעבד את אותה קבוצה של מסמכים, תוכל להשתמש בנתיב לדלי S3 זה באמצעות ייבוא מסמכים מ-S3 bucket אוֹפְּצִיָה. דלי S3 שנוצר בשמך יהיה גלוי לאחר יצירת הדלי.
- לאחר מכן, ציין את תכונת Amazon Textract שבה ברצונך להשתמש כדי לעבד את המסמכים שלך.
אתה יכול לבחור רק תכונה אחת בכל פעם כדי לעבד את המסמכים שלך. אם אתה צריך להעריך תכונות נוספות, עליך ליצור בקשה נפרדת על ידי בחירת התכונה הרצויה והעלאת המסמכים שוב. אם ה AnalyzeDocument - שאילתות נבחרת, עליך לספק את השאילתות שברצונך לבדוק מול המסמכים שלך. ניתן לציין עד 30 שאילתות בכל פעם. אם המסמכים שהועלו מכילים קבצי מרובי עמודים (PDF או TIF), השאילתות מוחלות רק על העמוד הראשון של כל מסמך. מתייחס שיטות עבודה מומלצות לשאילתות כדי ללמוד כיצד לבנות שאילתות.
- לבחור התחל בעיבוד להגיש את המסמכים ל- Amazon Textract לעיבוד.
אתה יכול לעקוב אחר מצב המסמך ולהוריד את תוצאות הפלט של מסמכים מעובדים ב- מסמכים שהוגשו סָעִיף. סעיף זה מתעדכן מעת לעת, ותוכל לרענן אותו באופן ידני כדי לראות אם העיבוד הושלם. כל מסמך מעובד בנפרד, כך שאתה יכול לבחור את המסמך עם מוכן להורדה סטטוס או המתן עד שכל המסמכים יסתיימו בעיבוד כדי להוריד את התוצאות. הפלט של המסמכים המעובדים יישאר זמין להורדה עד 7 ימים, ולאחר מכן יפוג תוקפם. מסמכים שפג תוקפם יימחקו מה- מסמכים שהוגשו סעיף לאחר 7 ימים נוספים (14 ימים ממועד העיבוד). אנו מציעים להוריד ולשמר את הפלטים בתוך 7 ימים.
סיכום
בפוסט זה, הכרזנו על התכונה החדשה של Amazon Textract להעלאת מסמכים בתפזורת, המאפשרת לך לעבד במהירות מספר רב של מסמכים למטרות הערכה. אתה יכול להשתמש בתכונה זו כדי להעריך את Amazon Textract עבור מקרה שימוש שנקבע מראש עם המסמכים שלך. למידע נוסף על איך אתה יכול להשתמש ב- Amazon Textract בעומס העבודה החכם שלך בעיבוד מסמכים, בקר תכונות Amazon Textract ו תחילת העבודה עם Amazon Textract.
על הכותבים
שאשווט ספרה הוא מנהל מוצר טכני בכיר בצוות Amazon Textract. הוא מתמקד בבניית שירותים מבוססי למידת מכונה עבור לקוחות AWS. בזמנו הפנוי הוא אוהב לקרוא על טכנולוגיות חדשות, לטייל ולחקור מאכלים שונים.
אנג'אן ביזוואז הוא ארכיטקט בכיר בשירותי AI עם התמקדות ב-AI/ML ו-Data Analytics. אנג'אן הוא חלק מצוות שירותי AI העולמי ועובד עם לקוחות כדי לעזור להם להבין ולפתח פתרונות לבעיות עסקיות עם AI ו-ML. לאנג'אן יש למעלה מ-14 שנות ניסיון בעבודה עם שרשרת אספקה גלובלית, ייצור וקמעונאות, והיא עוזרת ללקוחות להתחיל ולהתקדם בשירותי AI של AWS.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoAiStream. Web3 Data Intelligence. הידע מוגבר. גישה כאן.
- הטבעת העתיד עם אדריאן אשלי. גישה כאן.
- קנה ומכירה של מניות בחברות PRE-IPO עם PREIPO®. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :יש ל
- :הוא
- :איפה
- $ למעלה
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- אודות
- גישה
- חֶשְׁבּוֹן
- פעולה
- באופן פעיל
- נוסף
- בנוסף
- לאחר
- שוב
- נגד
- AI
- שירותי AI
- AI / ML
- תעשיות
- מאפשר
- גם
- אמזון בעברית
- טקסטורה באמזון
- אמזון שירותי אינטרנט
- an
- אנליזה
- ניתוח
- ו
- הודיע
- כל
- API
- ממשקי API
- יישומית
- ARE
- מלאכותי
- AS
- At
- באופן אוטומטי
- זמין
- AWS
- BE
- אריזה מקורית
- בִּניָן
- עסקים
- by
- CAN
- יכולות
- מקרה
- מקרים
- שרשרת
- חיובים
- לבחור
- בחירה
- קוד
- השוואה
- להשלים
- המחשב
- אמון
- קונסול
- לבנות
- מכיל
- לִיצוֹר
- נוצר
- כיום
- לקוחות
- נתונים
- ניתוח נתונים
- תַאֲרִיך
- ימים
- הדגמות
- תלוי
- רצוי
- לפתח
- אחר
- ישירות
- מציג
- מסמך
- מסמכים
- להורדה
- כל אחד
- בקלות
- קל
- יעיל
- או
- מאפשר
- משופר
- לְהַבטִיחַ
- Ether (ETH)
- להעריך
- הערכה
- קיימים
- ניסיון
- היכרות
- חיצוני
- תמציות
- מאפיין
- תכונות
- שלח
- קבצים
- ראשון
- להתמקד
- מרוכז
- הבא
- בעד
- פוּרמָט
- צורות
- החל מ-
- לקבל
- גלוֹבָּלִי
- יש
- he
- לעזור
- עזרה
- פסים
- שֶׁלוֹ
- איך
- איך
- HTML
- http
- HTTPS
- קריא אדם
- if
- תמונה
- תמונות
- לייבא
- חשוב
- שהוטל
- in
- בנפרד
- מידע
- בתחילה
- במקום
- אינטליגנטי
- עיבוד מסמכים חכם
- התכוון
- החדרה
- אינטואיטיבי
- IT
- jpg
- ג'סון
- שמור
- גָדוֹל
- גדול יותר
- מאוחר יותר
- הושק
- לִלמוֹד
- למידה
- להגביל
- גבולות
- מיקום
- מכונה
- למידת מכונה
- לעשות
- עושה
- מנהל
- באופן ידני
- ייצור
- רב
- מקסימום
- מאי..
- אכפת לי
- ML
- יותר
- יותר יעיל
- מספר
- צריך
- ניווט
- צורך
- צורך
- חדש
- טכנולוגיות חדשות
- מספר
- OCR
- of
- לא מחובר
- on
- פעם
- ONE
- רק
- תפעול
- אפשרות
- אפשרויות
- or
- ארגונים
- תפוקה
- יותר
- שֶׁלוֹ
- עמוד
- זגוגית
- חלק
- נתיב
- מבצע
- תקופה
- הרשאות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- הודעה
- פרקטיקות
- מִשׁמֶרֶת
- תמחור
- בעיות
- תהליך
- תהליכים
- תהליך
- המוצר
- מנהל מוצר
- פרוגרמטית
- לספק
- ובלבד
- מספק
- למטרות
- שאילתות
- מָהִיר
- מהירות
- קריאה
- באזור
- רגיל
- לסמוך
- להשאר
- דוחות לדוגמא
- לבקש
- תגובה
- תוצאות
- קמעוני
- סקירה
- אותו
- סולם
- שְׁנִיָה
- סעיף
- לִרְאוֹת
- נבחר
- בחירה
- לחצני מצוקה לפנסיונרים
- נשלח
- נפרד
- שרות
- שירותים
- סט
- צריך
- חתימות
- פָּשׁוּט
- בו זמנית
- מידה
- So
- פתרונות
- מָקוֹר
- מפורט
- תֶקֶן
- החל
- מצב
- צעדים
- אחסון
- נושא
- להגיש
- לאחר מכן
- כזה
- להציע
- לספק
- שרשרת אספקה
- נתמך
- תומך
- נבחרת
- טכני
- טכנולוגיות
- מבחן
- מֵאֲשֶׁר
- זֶה
- אל האני
- המקור
- אותם
- אז
- לכן
- הֵם
- זֶה
- דרך
- זמן
- ל
- כלים
- Tps
- לעקוב
- עסקות
- נסיעה
- שתיים
- ui
- תחת
- להבין
- בניגוד
- עדכונים
- נטען
- העלאה
- כתובת האתר
- נוֹהָג
- להשתמש
- במקרה להשתמש
- מְשׁוּמָשׁ
- באמצעות
- באמצעות
- נראה
- לְבַקֵר
- ראיה
- לחכות
- רוצה
- we
- אינטרנט
- שירותי אינטרנט
- טוֹב
- מתי
- אשר
- יצטרך
- עם
- בתוך
- לְלֹא
- עובד
- עובד
- לכתוב
- כתיבה
- שנים
- אתה
- זפירנט
- רוכסן