متن آمازون یک سرویس یادگیری ماشینی (ML) است که به طور خودکار متن، دست خط و داده را از هر سند یا تصویری استخراج می کند. برای سادهتر کردن ارزیابی قابلیتهای آمازون متن، ما یک ویژگی جدید آپلودکننده سند انبوه را در کنسول آمازون متن راهاندازی کردهایم که به شما امکان میدهد به سرعت مجموعه اسناد خود را بدون نوشتن هیچ کدی پردازش کنید.
در این پست، زمان و نحوه استفاده از آپلود کننده انبوه اسناد متنی آمازون را برای ارزیابی عملکرد آمازون متن بر روی اسناد شما توضیح می دهیم.
بررسی اجمالی راه حل
آپلود کننده اسناد انبوه باید برای ارزیابی سریع متن آمازون برای موارد استفاده از پیش تعیین شده استفاده شود. با آپلود چندین سند به طور همزمان از طریق یک رابط کاربری بصری، می توانید به راحتی میزان عملکرد Amazon Textract روی اسناد خود را اندازه گیری کنید.
شما می توانید تا 150 سند را به طور همزمان آپلود و پردازش کنید. برخلاف نسخههای نمایشی کنسول آمازون Texttract موجود، که محدودیتهای مصنوعی بر تعداد اسناد، اندازه سند و حداکثر تعداد مجاز صفحات اعمال میکنند، آپلودکننده سند انبوه از پردازش حداکثر ۱۵۰ سند در هر درخواست پشتیبانی میکند و اندازه سند و محدودیتهای صفحه مشابه دارد. APIهای متنی آمازون این امر باعث می شود که ارزیابی مجموعه بزرگتری از اسناد برای شما کارآمدتر باشد.
آپلود کننده سند انبوه یک پاسخ استاندارد آمازون متنی JSON و فایل CSV را خروجی می دهد. نتایج در قالب JSON برای تجزیه و تحلیل برنامه نویسی آسان ارائه شده است. علاوه بر این، یک فایل CSV قابل خواندن توسط انسان با امتیازات اطمینان برای مقایسه و ارزیابی ساده اطلاعات استخراج شده ارائه شده است.
هنگام استفاده از این ویژگی، موارد زیر را در نظر داشته باشید:
- آپلود کننده اسناد انبوه اسناد را از طریق پردازش می کند عملیات ناهمزمان. شما می توانید وضعیت پردازش را در کنسول آمازون Textract پیگیری کنید. فقط ردیابی (OCR) آنالیز سند (جدول، پرسش ها، فرم ها و امضاها)، و تجزیه و تحلیل API ها در حال حاضر پشتیبانی می شوند.
- آپلود کننده سند انبوه نتایج JSON عملیات API و گزارش های CSV فرمت شده را ارائه می دهد. ممکن است لازم باشد برای تجسم داده ها به ابزارهای خارجی تکیه کنید، مانند نمایش نقاط برجسته کادر محدود بر روی سند با استفاده از نتایج JSON.
- استفاده از این ویژگی برای پردازش اسناد، هزینههای مشابهی را به همراه دارد که استفاده معمولی از Amazon Texttract (بسته به اینکه کدام ویژگی استفاده میشود)، و مشمول محدودیتهای TPS (تراکنش در ثانیه) برای APIهایی است که برای حساب و منطقه تنظیم شدهاند. برای اطلاعات بیشتر در مورد قیمت به ادامه مطلب مراجعه کنید قیمت گذاری متن آمازون. برای کسب اطلاعات بیشتر در مورد محدودیت های متن آمازون، مراجعه کنید سهمیه در متن آمازون.
- فرمت های فایل پذیرفته شده برای آپلود انبوه عبارتند از JPEG، PNG، TIF و PDF. تصاویر کدگذاری شده با JPEG 2000 در فایل های PDF نیز پشتیبانی می شوند. فایل های JPEG و PNG دارای محدودیت حجمی 10 مگابایتی هستند، در حالی که فایل های PDF و TIF دارای محدودیت حجمی 500 مگابایتی هستند. فایل های PDF و TIF چند صفحه ای دارای محدودیت 3,000 صفحه هستند.
از آپلود کننده اسناد انبوه استفاده کنید
آپلود کننده اسناد انبوه برای کمک به شما در ارزیابی سریع نحوه عملکرد آمازون متن بر روی مجموعه ای از اسناد خود، بدون نیاز به نوشتن کد در نظر گرفته شده است. شما می توانید از آپلود کننده انبوه اسناد برای پردازش 150 سند به جای آپلود و پردازش اسناد به صورت جداگانه استفاده کنید. می توانید اسناد را مستقیماً از رایانه خود به صورت انبوه بارگذاری کنید یا اسناد موجود را وارد کنید سرویس ذخیره سازی ساده آمازون سطل (Amazon S3).
آپلود کننده اسناد انبوه نتایجی را ارائه می دهد که می توانید بعداً برای بررسی آفلاین بارگیری کنید. هر فایل ZIP قابل دانلود حاوی پاسخ Amazon Texttract API در قالب فایل JSON و یک فایل CSV قابل خواندن توسط انسان از خروجی است که حاوی داده های استخراج شده و امتیازات اطمینان است. نتایج خروجی به مدت 7 روز پس از پردازش برای دانلود در دسترس هستند. پس از 14 روز، اسناد از آن پاک می شود مدارک ارائه شده بخش. برای استفاده از آپلود کننده انبوه اسناد، مراحل زیر را انجام دهید:
- در کنسول آمازون Texttract، در زیر توده مردم در قسمت ناوبری، را انتخاب کنید آپلود کننده انبوه اسناد.
- را انتخاب کنید اسناد را بارگذاری کنید.
- منبع اسناد خود را مشخص کنید.
شما دو گزینه برای آپلود اسناد دارید:
- اسناد را از سطل S3 وارد کنید - اگر از یک سطل S3 برای اسناد خود استفاده می کنید، URL سطل و (در صورت تمایل) پیشوندی که اسناد شما در آن قرار دارند را ارائه کنید.
s3://your-bucket/prefix/
قالب در غیر این صورت، انتخاب کنید S3 را مرور کنید برای مرور و انتخاب مکان مورد نظر اسناد خود. اگر مکان آمازون S3 که مشخص کردهاید حاوی بیش از 150 سند باشد، تنها 150 سند اول برای پردازش به متن آمازون ارسال میشود. - اسناد را از رایانه خود آپلود کنید - اگر اسناد را از رایانه خود آپلود می کنید، می توانید با انتخاب همزمان حداکثر 50 سند را آپلود کنید اسناد را بارگذاری کنید. برای آپلود اسناد اضافی (حداکثر 150)، را انتخاب کنید اسناد را اضافه کنید پس از آپلود اسناد اولیه
در این حالت، اسناد شما ابتدا در یک سطل S3 در حساب شما که از طرف شما ایجاد شده است آپلود می شود، بنابراین مهم است که اطمینان حاصل کنید که مجوز دسترسی و آپلود اسناد در Amazon S3 را دارید. این یک اقدام یک بار است و از همان سطل برای همه آپلودهای بعدی از رایانه شما استفاده می شود. اگر میخواهید همان مجموعه اسناد را آپلود و پردازش کنید، میتوانید از مسیر این سطل S3 با استفاده از اسناد را از سطل S3 وارد کنید گزینه. سطل S3 ایجاد شده از طرف شما پس از ایجاد سطل قابل مشاهده خواهد بود.
- در مرحله بعد، ویژگی Amazon Texttract را که می خواهید برای پردازش اسناد خود استفاده کنید، مشخص کنید.
شما می توانید در هر زمان تنها یک ویژگی را برای پردازش اسناد خود انتخاب کنید. در صورت نیاز به ارزیابی ویژگی های اضافی، باید با انتخاب ویژگی مورد نظر و بارگذاری مجدد اسناد، درخواست جداگانه ایجاد کنید. اگر AnalyzeDocument – Query ویژگی انتخاب شده است، باید پرس و جوهایی را که می خواهید در برابر اسناد خود آزمایش کنید ارائه دهید. شما می توانید حداکثر 30 پرس و جو را در یک زمان مشخص کنید. اگر اسناد آپلود شده حاوی فایلهای چند صفحهای (PDF یا TIF) باشند، درخواستها فقط در صفحه اول هر سند اعمال میشوند. رجوع شود به بهترین روش ها برای پرس و جو برای یادگیری نحوه ساخت پرس و جوها
- را انتخاب کنید شروع به پردازش کنید اسناد را برای پردازش به آمازون تکست ارسال کنید.
می توانید وضعیت سند را ردیابی کنید و نتایج خروجی اسناد پردازش شده را در قسمت دانلود کنید مدارک ارائه شده بخش. این بخش به صورت دوره ای به روز می شود و می توانید به صورت دستی آن را بازخوانی کنید تا ببینید آیا پردازش کامل شده است یا خیر. هر سند به صورت جداگانه پردازش می شود، بنابراین می توانید سند را با آن انتخاب کنید آماده دانلود وضعیت یا صبر کنید تا تمام اسناد پردازش کامل شود تا نتایج را دانلود کنید. خروجی اسناد پردازش شده تا 7 روز برای دانلود در دسترس خواهد بود و پس از آن منقضی می شود. مدارک منقضی شده از مدارک ارائه شده بخش پس از 7 روز اضافی (14 روز از تاریخ پردازش). پیشنهاد می کنیم خروجی ها را در بازه زمانی 7 روزه دانلود و حفظ کنید.
نتیجه
در این پست، ویژگی جدید آپلود کننده اسناد متنی انبوه آمازون را معرفی کردیم که به شما امکان می دهد تا به سرعت تعداد زیادی از اسناد را برای اهداف ارزیابی پردازش کنید. می توانید از این ویژگی برای ارزیابی متن آمازون برای یک مورد استفاده از پیش تعیین شده با اسناد خود استفاده کنید. برای کسب اطلاعات بیشتر در مورد اینکه چگونه می توانید از متن آمازون در حجم کاری پردازش هوشمند اسناد خود استفاده کنید، مراجعه کنید ویژگی های آمازون متن و شروع کار با آمازون تکست.
درباره نویسنده
ششوات ساپره یک مدیر ارشد فنی محصول با تیم آمازون تکست است. او بر ایجاد خدمات مبتنی بر یادگیری ماشین برای مشتریان AWS متمرکز است. او در اوقات فراغت خود مطالعه در مورد فن آوری های جدید، سفر و کشف غذاهای مختلف را دوست دارد.
انجان بیسواس یک معمار ارشد راه حل های خدمات هوش مصنوعی با تمرکز بر AI/ML و تجزیه و تحلیل داده ها است. Anjan بخشی از تیم خدمات هوش مصنوعی در سراسر جهان است و با مشتریان همکاری می کند تا به آنها کمک کند تا راه حل هایی برای مشکلات تجاری با هوش مصنوعی و ML ایجاد کنند. Anjan بیش از 14 سال تجربه کار با زنجیره تامین جهانی، تولید و سازمانهای خردهفروشی دارد و به طور فعال به مشتریان کمک میکند تا خدمات هوش مصنوعی AWS را شروع کرده و مقیاس کنند.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoAiStream. Web3 Data Intelligence دانش تقویت شده دسترسی به اینجا.
- ضرب کردن آینده با آدرین اشلی. دسترسی به اینجا.
- خرید و فروش سهام در شرکت های PRE-IPO با PREIPO®. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- : دارد
- :است
- :جایی که
- $UP
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- درباره ما
- دسترسی
- حساب
- عمل
- فعالانه
- اضافی
- علاوه بر این
- پس از
- از نو
- در برابر
- AI
- خدمات هوش مصنوعی
- AI / ML
- معرفی
- اجازه می دهد تا
- همچنین
- آمازون
- متن آمازون
- آمازون خدمات وب
- an
- تحلیل
- علم تجزیه و تحلیل
- و
- اعلام کرد
- هر
- API
- رابط های برنامه کاربردی
- اعمال می شود
- هستند
- مصنوعی
- AS
- At
- بطور خودکار
- در دسترس
- AWS
- BE
- جعبه
- بنا
- کسب و کار
- by
- CAN
- قابلیت های
- مورد
- موارد
- زنجیر
- بار
- را انتخاب کنید
- انتخاب
- رمز
- مقایسه
- کامل
- کامپیوتر
- اعتماد به نفس
- کنسول
- ساختن
- شامل
- ایجاد
- ایجاد شده
- در حال حاضر
- مشتریان
- داده ها
- تجزیه و تحلیل داده ها
- تاریخ
- روز
- توده مردم
- بستگی دارد
- مطلوب
- توسعه
- مختلف
- مستقیما
- نمایش
- سند
- اسناد و مدارک
- دانلود
- هر
- به آسانی
- ساده
- موثر
- هر دو
- را قادر می سازد
- افزایش
- اطمینان حاصل شود
- اتر (ETH)
- ارزیابی
- ارزیابی
- موجود
- تجربه
- بررسی
- خارجی
- عصاره ها
- ویژگی
- امکانات
- پرونده
- فایل ها
- نام خانوادگی
- تمرکز
- متمرکز شده است
- پیروی
- برای
- قالب
- اشکال
- از جانب
- دریافت کنید
- جهانی
- آیا
- he
- کمک
- کمک
- های لایت
- خود را
- چگونه
- چگونه
- HTML
- HTTP
- HTTPS
- قابل خواندن انسان است
- if
- تصویر
- تصاویر
- واردات
- مهم
- تحمیل
- in
- به طور جداگانه
- اطلاعات
- اول
- در عوض
- هوشمند
- پردازش هوشمند اسناد
- مورد نظر
- معرفی
- حسی
- IT
- JPG
- json
- نگاه داشتن
- بزرگ
- بزرگتر
- بعد
- راه اندازی
- یاد گرفتن
- یادگیری
- محدود
- محدودیت
- محل
- دستگاه
- فراگیری ماشین
- ساخت
- باعث می شود
- مدیر
- دستی
- تولید
- بسیاری
- بیشترین
- ممکن است..
- ذهن
- ML
- بیش
- کارآمدتر
- چندگانه
- باید
- جهت یابی
- نیاز
- نیازمند
- جدید
- فناوری های نوین
- عدد
- OCR
- of
- آنلاین نیست.
- on
- یک بار
- ONE
- فقط
- عملیات
- گزینه
- گزینه
- or
- سازمان های
- تولید
- روی
- خود
- با ما
- قطعه
- بخش
- مسیر
- انجام می دهد
- دوره
- مجوز
- افلاطون
- هوش داده افلاطون
- PlatoData
- پست
- شیوه های
- حفظ کردن
- قیمت گذاری
- مشکلات
- روند
- فرآیندهای
- در حال پردازش
- محصول
- مدیر تولید
- برنامه ریزی شده
- ارائه
- ارائه
- فراهم می کند
- اهداف
- نمایش ها
- سریع
- به سرعت
- مطالعه
- منطقه
- منظم
- تکیه
- ماندن
- گزارش ها
- درخواست
- پاسخ
- نتایج
- خرده فروشی
- این فایل نقد می نویسید:
- همان
- مقیاس
- دوم
- بخش
- دیدن
- انتخاب شد
- انتخاب
- ارشد
- فرستاده
- جداگانه
- سرویس
- خدمات
- تنظیم
- باید
- امضا
- ساده
- به طور همزمان
- اندازه
- So
- مزایا
- منبع
- مشخص شده
- استاندارد
- آغاز شده
- وضعیت
- مراحل
- ذخیره سازی
- موضوع
- ارسال
- متعاقب
- چنین
- نشان می دهد
- عرضه
- زنجیره تامین
- پشتیبانی
- پشتیبانی از
- تیم
- فنی
- فن آوری
- آزمون
- نسبت به
- که
- La
- منبع
- آنها
- سپس
- از این رو
- آنها
- این
- از طریق
- زمان
- به
- ابزار
- thps
- مسیر
- معاملات
- سفر
- دو
- ui
- زیر
- فهمیدن
- بر خلاف
- به روز رسانی
- آپلود شده
- آپلود
- URL
- استفاده
- استفاده کنید
- مورد استفاده
- استفاده
- با استفاده از
- از طريق
- قابل رویت
- بازدید
- تجسم
- صبر کنيد
- می خواهم
- we
- وب
- خدمات وب
- خوب
- چه زمانی
- که
- اراده
- با
- در داخل
- بدون
- کارگر
- با این نسخهها کار
- نوشتن
- نوشته
- سال
- شما
- شما
- زفیرنت
- زیپ