ایمیزون ٹیکسٹ ایک مشین لرننگ (ML) سروس ہے جو کسی بھی دستاویز یا تصویر سے ٹیکسٹ، ہینڈ رائٹنگ اور ڈیٹا کو خود بخود نکالتی ہے۔ Amazon Textract کی صلاحیتوں کو جانچنا آسان بنانے کے لیے، ہم نے Amazon Textract کنسول پر ایک نئی بلک ڈاکومنٹ اپ لوڈر فیچر شروع کیا ہے جو آپ کو بغیر کسی کوڈ کے لکھے دستاویزات کے اپنے سیٹ پر تیزی سے کارروائی کرنے کے قابل بناتا ہے۔
اس پوسٹ میں، ہم Amazon Textract Bulk Document Uploader کو کب اور کیسے استعمال کرتے ہیں اس کا جائزہ لیتے ہیں کہ Amazon Textract آپ کے دستاویزات پر کیسے کام کرتا ہے۔
حل کا جائزہ
بلک دستاویز اپ لوڈر کا استعمال پہلے سے طے شدہ استعمال کے معاملات کے لیے Amazon Textract کی فوری تشخیص کے لیے کیا جانا چاہیے۔ ایک بدیہی UI کے ذریعے متعدد دستاویزات کو بیک وقت اپ لوڈ کرکے، آپ آسانی سے اندازہ لگا سکتے ہیں کہ Amazon Textract آپ کے دستاویزات پر کتنی اچھی کارکردگی کا مظاہرہ کرتا ہے۔
آپ ایک ساتھ 150 دستاویزات تک اپ لوڈ اور کارروائی کر سکتے ہیں۔ موجودہ ایمیزون ٹیکسٹریکٹ کنسول ڈیمو کے برعکس، جو دستاویزات کی تعداد، دستاویز کے سائز، اور صفحات کی زیادہ سے زیادہ اجازت شدہ تعداد پر مصنوعی حدیں لگاتے ہیں، بلک ڈاکومنٹ اپ لوڈر فی درخواست 150 دستاویزات تک پروسیسنگ کو سپورٹ کرتا ہے اور اس کے پاس وہی دستاویز کا سائز اور صفحہ کی حد ہوتی ہے۔ Amazon Textract APIs۔ یہ آپ کے لیے دستاویزات کے ایک بڑے سیٹ کا جائزہ لینا زیادہ موثر بناتا ہے۔
بلک دستاویز اپ لوڈر معیاری Amazon Textract JSON جواب اور CSV فائل کو آؤٹ پٹ کرتا ہے۔ آسان پروگرامیٹک تجزیہ کے لیے نتائج JSON فارمیٹ میں فراہم کیے گئے ہیں۔ مزید برآں، حاصل کردہ معلومات کے سادہ موازنہ اور تشخیص کے لیے اعتماد کے اسکور کے ساتھ ایک انسانی پڑھنے کے قابل CSV فائل فراہم کی جاتی ہے۔
اس خصوصیت کو استعمال کرتے وقت، درج ذیل باتوں کو ذہن میں رکھیں:
- بلک ڈاکومنٹ اپ لوڈر کے ذریعے دستاویزات پر کارروائی کرتا ہے۔ غیر مطابقت پذیر آپریشنز. آپ Amazon Textract کنسول پر پروسیسنگ کی حیثیت کو ٹریک کرسکتے ہیں۔ صرف DetectDocumentText (OCR)، دستاویز کا تجزیہ کریں۔ (ٹیبلز، سوالات، فارم، اور دستخط)، اور اخراجات کا تجزیہ کریں۔ APIs فی الحال تعاون یافتہ ہیں۔
- بلک دستاویز اپ لوڈر API آپریشنز اور فارمیٹ شدہ CSV رپورٹس کے JSON نتائج فراہم کرتا ہے۔ آپ کو ڈیٹا کے تصور کے لیے بیرونی ٹولز پر انحصار کرنے کی ضرورت پڑ سکتی ہے، جیسے JSON نتائج کا استعمال کرتے ہوئے دستاویز پر باؤنڈنگ باکس ہائی لائٹس کو ڈسپلے کرنا۔
- دستاویزات پر کارروائی کرنے کے لیے اس خصوصیت کو استعمال کرنے سے وہی چارجز لگتے ہیں جو کہ باقاعدہ Amazon Textract کے استعمال (اس پر منحصر ہے کہ کس خصوصیت کا استعمال کیا جاتا ہے)، اور APIs کے لیے TPS (ٹرانزیکشن فی سیکنڈ) کی حدود کے ساتھ مشروط ہے جو اکاؤنٹ اور علاقے کے لیے مقرر ہیں۔ قیمتوں کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ ایمیزون ٹیکسٹ کی قیمتوں کا تعین. Amazon Textract کی حدود کے بارے میں مزید جاننے کے لیے، رجوع کریں۔ Amazon Textract میں کوٹے۔.
- بلک اپ لوڈر کے لیے قبول شدہ فائل فارمیٹس JPEG، PNG، TIF، اور PDF ہیں۔ پی ڈی ایف میں JPEG 2000 انکوڈ شدہ تصاویر بھی معاون ہیں۔ JPEG اور PNG فائلوں میں 10 MB سائز کی حد ہوتی ہے، جبکہ PDF اور TIF فائلوں کی سائز کی حد 500 MB ہوتی ہے۔ ملٹی پیج پی ڈی ایف اور TIF فائلوں میں 3,000 صفحات کی حد ہوتی ہے۔
بلک دستاویز اپ لوڈر استعمال کریں۔
بلک دستاویز اپ لوڈر کا مقصد آپ کو فوری طور پر اس بات کا اندازہ کرنے میں مدد کرنا ہے کہ ایمیزون ٹیکسٹریکٹ آپ کے اپنے دستاویزات کے سیٹ پر کس طرح کارکردگی کا مظاہرہ کرتا ہے، بغیر کسی کوڈ کو لکھنے کی ضرورت ہے۔ آپ انفرادی طور پر دستاویزات کو اپ لوڈ اور پروسیس کرنے کے بجائے زیادہ سے زیادہ 150 دستاویزات پر کارروائی کرنے کے لیے بلک ڈاکومنٹ اپ لوڈر کا استعمال کر سکتے ہیں۔ آپ اپنے کمپیوٹر سے براہ راست دستاویزات کو بلک اپ لوڈ کرسکتے ہیں یا کسی موجودہ سے دستاویزات درآمد کرسکتے ہیں۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) بالٹی۔
بلک دستاویز اپ لوڈر ایسے نتائج فراہم کرتا ہے جنہیں آپ بعد میں آف لائن جائزے کے لیے ڈاؤن لوڈ کر سکتے ہیں۔ ہر ڈاؤن لوڈ کے قابل ZIP فائل میں JSON فائل فارمیٹ میں Amazon Textract API کا جواب اور آؤٹ پٹ کی انسانی پڑھنے کے قابل CSV فائل ہوتی ہے جس میں نکالے گئے ڈیٹا اور اعتماد کے اسکور ہوتے ہیں۔ آؤٹ پٹ کے نتائج پروسیسنگ کے بعد 7 دنوں تک ڈاؤن لوڈ کے لیے دستیاب ہیں۔ 14 دن کے بعد، دستاویزات سے صاف کر دیا جاتا ہے جمع کرائی گئی دستاویزات سیکشن بلک دستاویز اپ لوڈر استعمال کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:
- ایمیزون ٹیکسٹریکٹ کنسول پر، نیچے ڈیمو نیویگیشن پین میں، منتخب کریں۔ بلک دستاویز اپ لوڈر.
- میں سے انتخاب کریں دستاویزات اپ لوڈ کریں.
- اپنی دستاویزات کا ماخذ بتائیں۔
آپ کے پاس دستاویزات اپ لوڈ کرنے کے دو اختیارات ہیں:
- S3 بالٹی سے دستاویزات درآمد کریں۔ - اگر آپ اپنی دستاویزات کے لیے S3 بالٹی استعمال کر رہے ہیں، تو بالٹی کا URL اور (اختیاری طور پر) وہ سابقہ فراہم کریں جہاں آپ کی دستاویزات رہتی ہیں،
s3://your-bucket/prefix/
فارمیٹ متبادل طور پر، منتخب کریں S3 کو براؤز کریں۔ اپنے دستاویزات کی مطلوبہ جگہ کو براؤز کرنے اور منتخب کرنے کے لیے۔ اگر آپ کے بتائے ہوئے Amazon S3 مقام میں 150 سے زیادہ دستاویزات ہیں، تو صرف پہلی 150 دستاویزات کو Amazon Textract کو پروسیسنگ کے لیے بھیجا جائے گا۔ - اپنے کمپیوٹر سے دستاویزات اپ لوڈ کریں۔ - اگر آپ اپنے کمپیوٹر سے دستاویزات اپ لوڈ کر رہے ہیں، تو آپ ایک وقت میں 50 تک دستاویزات کو منتخب کر کے اپ لوڈ کر سکتے ہیں۔ دستاویزات اپ لوڈ کریں. اضافی دستاویزات (زیادہ سے زیادہ 150 تک) اپ لوڈ کرنے کے لیے، منتخب کریں۔ دستاویزات شامل کریں۔ آپ کی ابتدائی دستاویزات اپ لوڈ ہونے کے بعد۔
اس صورت میں، آپ کے دستاویزات سب سے پہلے آپ کے اکاؤنٹ میں S3 بالٹی میں اپ لوڈ کیے جاتے ہیں جو آپ کی جانب سے بنایا گیا ہے، اس لیے یہ یقینی بنانا ضروری ہے کہ آپ کو Amazon S3 پر دستاویزات تک رسائی اور اپ لوڈ کرنے کی اجازت ہے۔ یہ ایک بار کی کارروائی ہے، اور اسی بالٹی کو آپ کے کمپیوٹر سے آنے والے تمام اپ لوڈز کے لیے استعمال کیا جائے گا۔ اگر آپ دستاویزات کے ایک ہی سیٹ کو اپ لوڈ اور اس پر کارروائی کرنا چاہتے ہیں، تو آپ اس S3 بالٹی کا راستہ استعمال کر سکتے ہیں۔ S3 بالٹی سے دستاویزات درآمد کریں۔ اختیار آپ کی جانب سے بنائی گئی S3 بالٹی بالٹی بننے کے بعد نظر آئے گی۔
- اگلا، ایمیزون ٹیکسٹریکٹ فیچر کی وضاحت کریں جسے آپ اپنی دستاویزات پر کارروائی کرنے کے لیے استعمال کرنا چاہتے ہیں۔
آپ اپنی دستاویزات پر کارروائی کرنے کے لیے ایک وقت میں صرف ایک خصوصیت کا انتخاب کر سکتے ہیں۔ اگر آپ کو اضافی خصوصیات کا جائزہ لینے کی ضرورت ہے، تو آپ کو مطلوبہ خصوصیت کو منتخب کرکے اور دستاویزات کو دوبارہ اپ لوڈ کرکے ایک علیحدہ درخواست بنانا ہوگی۔ اگر دستاویز کا تجزیہ کریں - سوالات خصوصیت کو منتخب کیا گیا ہے، آپ کو وہ سوالات فراہم کرنے کی ضرورت ہے جو آپ اپنے دستاویزات کے خلاف جانچنا چاہتے ہیں۔ آپ ایک وقت میں 30 سوالات تک کی وضاحت کر سکتے ہیں۔ اگر اپ لوڈ کردہ دستاویزات میں ملٹی پیج (PDF یا TIF) فائلیں ہیں، تو استفسارات صرف ہر دستاویز کے پہلے صفحہ پر لاگو ہوتے ہیں۔ کا حوالہ دیتے ہیں سوالات کے لیے بہترین طرز عمل سوالات کی تعمیر کے بارے میں جاننے کے لیے۔
- میں سے انتخاب کریں پروسیسنگ شروع کریں۔ دستاویزات کو Amazon Textract میں پروسیسنگ کے لیے جمع کرانے کے لیے۔
آپ دستاویز کی حیثیت کو ٹریک کرسکتے ہیں اور پروسیس شدہ دستاویزات کے آؤٹ پٹ نتائج کو میں ڈاؤن لوڈ کرسکتے ہیں۔ جمع کرائی گئی دستاویزات سیکشن یہ سیکشن وقتاً فوقتاً اپ ڈیٹ ہوتا رہتا ہے، اور آپ اسے دستی طور پر ریفریش کر کے دیکھ سکتے ہیں کہ آیا پروسیسنگ مکمل ہو گئی ہے۔ ہر دستاویز پر انفرادی طور پر کارروائی کی جاتی ہے، لہذا آپ یا تو اس کے ساتھ دستاویز کو منتخب کر سکتے ہیں۔ ڈاؤن لوڈ کرنے کے لیے تیار ہے۔ اسٹیٹس یا نتائج ڈاؤن لوڈ کرنے کے لیے تمام دستاویزات کی پروسیسنگ مکمل ہونے کا انتظار کریں۔ پروسیس شدہ دستاویزات کا آؤٹ پٹ ڈاؤن لوڈ کے لیے 7 دنوں تک دستیاب رہے گا، جس کے بعد ان کی میعاد ختم ہو جائے گی۔ میعاد ختم ہونے والی دستاویزات کو سے کلیئر کر دیا جائے گا۔ جمع کرائی گئی دستاویزات سیکشن 7 اضافی دنوں کے بعد (کارروائی کی تاریخ سے 14 دن)۔ ہم 7 دن کی مدت کے اندر آؤٹ پٹ کو ڈاؤن لوڈ اور محفوظ کرنے کا مشورہ دیتے ہیں۔
نتیجہ
اس پوسٹ میں، ہم نے نئے Amazon Textract Bulk Document Uploader کی خصوصیت کا اعلان کیا ہے، جو آپ کو تشخیص کے مقاصد کے لیے بڑی تعداد میں دستاویزات پر تیزی سے کارروائی کرنے کی اجازت دیتا ہے۔ آپ اس خصوصیت کو اپنے دستاویزات کے ساتھ پہلے سے طے شدہ استعمال کے معاملے کے لیے Amazon Textract کا جائزہ لینے کے لیے استعمال کر سکتے ہیں۔ اس بارے میں مزید جاننے کے لیے کہ آپ اپنے ذہین دستاویز پراسیسنگ کے کام کے بوجھ میں Amazon Textract کیسے استعمال کر سکتے ہیں، ملاحظہ کریں۔ ایمیزون ٹیکسٹ کی خصوصیات اور Amazon Textract کے ساتھ شروع کرنا.
مصنفین کے بارے میں
شاشوت سپرے Amazon Textract ٹیم کے ساتھ ایک سینئر ٹیکنیکل پروڈکٹ مینیجر ہے۔ اس کی توجہ AWS صارفین کے لیے مشین لرننگ پر مبنی خدمات کی تعمیر پر مرکوز ہے۔ اپنے فارغ وقت میں، وہ نئی ٹیکنالوجیز کے بارے میں پڑھنا، سفر کرنا اور مختلف کھانوں کی تلاش کرنا پسند کرتا ہے۔
انجان بسواس اے آئی/ایم ایل اور ڈیٹا اینالیٹکس پر توجہ کے ساتھ ایک سینئر AI سروسز سلوشنز آرکیٹیکٹ ہے۔ انجان دنیا بھر کی AI سروسز ٹیم کا حصہ ہے اور صارفین کے ساتھ کام کرتا ہے تاکہ وہ AI اور ML کے ساتھ کاروباری مسائل کو سمجھنے اور ان کے حل کو تیار کرنے میں مدد کریں۔ انجان کے پاس عالمی سپلائی چین، مینوفیکچرنگ، اور ریٹیل تنظیموں کے ساتھ کام کرنے کا 14 سال سے زیادہ کا تجربہ ہے، اور وہ صارفین کو AWS AI خدمات شروع کرنے اور اسکیل کرنے میں فعال طور پر مدد کر رہا ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹوآئ اسٹریم۔ ویب 3 ڈیٹا انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- ایڈریین ایشلے کے ساتھ مستقبل کا نقشہ بنانا۔ یہاں تک رسائی حاصل کریں۔
- PREIPO® کے ساتھ PRE-IPO کمپنیوں میں حصص خریدیں اور بیچیں۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- : ہے
- : ہے
- :کہاں
- $UP
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- ہمارے بارے میں
- تک رسائی حاصل
- اکاؤنٹ
- عمل
- فعال طور پر
- ایڈیشنل
- اس کے علاوہ
- کے بعد
- پھر
- کے خلاف
- AI
- AI خدمات
- AI / ML
- تمام
- کی اجازت دیتا ہے
- بھی
- ایمیزون
- ایمیزون ٹیکسٹ
- ایمیزون ویب سروسز
- an
- تجزیہ
- تجزیاتی
- اور
- کا اعلان کیا ہے
- کوئی بھی
- اے پی آئی
- APIs
- اطلاقی
- کیا
- مصنوعی
- AS
- At
- خود کار طریقے سے
- دستیاب
- AWS
- BE
- باکس
- عمارت
- کاروبار
- by
- کر سکتے ہیں
- صلاحیتوں
- کیس
- مقدمات
- چین
- بوجھ
- میں سے انتخاب کریں
- منتخب کریں
- کوڈ
- موازنہ
- مکمل
- کمپیوٹر
- آپکا اعتماد
- کنسول
- تعمیر
- پر مشتمل ہے
- تخلیق
- بنائی
- اس وقت
- گاہکوں
- اعداد و شمار
- ڈیٹا تجزیات
- تاریخ
- دن
- ڈیمو
- منحصر ہے
- مطلوبہ
- ترقی
- مختلف
- براہ راست
- دکھانا
- دستاویز
- دستاویزات
- ڈاؤن لوڈ، اتارنا
- ہر ایک
- آسانی سے
- آسان
- ہنر
- یا تو
- کے قابل بناتا ہے
- بہتر
- کو یقینی بنانے کے
- Ether (ETH)
- اندازہ
- تشخیص
- موجودہ
- تجربہ
- ایکسپلور
- بیرونی
- نچوڑ۔
- نمایاں کریں
- خصوصیات
- فائل
- فائلوں
- پہلا
- توجہ مرکوز
- توجہ مرکوز
- کے بعد
- کے لئے
- فارمیٹ
- فارم
- سے
- حاصل
- گلوبل
- ہے
- he
- مدد
- مدد
- پر روشنی ڈالی گئی
- ان
- کس طرح
- کیسے
- HTML
- HTTP
- HTTPS
- انسانی پڑھنے کے قابل
- if
- تصویر
- تصاویر
- درآمد
- اہم
- نافذ کریں
- in
- انفرادی طور پر
- معلومات
- ابتدائی
- کے بجائے
- انٹیلجنٹ
- ذہین دستاویز پروسیسنگ
- ارادہ
- متعارف کرانے
- بدیہی
- IT
- فوٹو
- JSON
- رکھیں
- بڑے
- بڑے
- بعد
- شروع
- جانیں
- سیکھنے
- LIMIT
- حدود
- محل وقوع
- مشین
- مشین لرننگ
- بنا
- بناتا ہے
- مینیجر
- دستی طور پر
- مینوفیکچرنگ
- بہت سے
- زیادہ سے زیادہ
- مئی..
- برا
- ML
- زیادہ
- زیادہ موثر
- ایک سے زیادہ
- ضروری
- سمت شناسی
- ضرورت ہے
- ضرورت ہے
- نئی
- نئی ٹیکنالوجی
- تعداد
- OCR
- of
- آف لائن
- on
- ایک بار
- ایک
- صرف
- آپریشنز
- اختیار
- آپشنز کے بھی
- or
- تنظیمیں
- پیداوار
- پر
- خود
- صفحہ
- پین
- حصہ
- راستہ
- کارکردگی کا مظاہرہ
- مدت
- اجازتیں
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- پوسٹ
- طریقوں
- محفوظ کر رہا ہے
- قیمتوں کا تعین
- مسائل
- عمل
- عمل
- پروسیسنگ
- مصنوعات
- پروڈکٹ مینیجر
- پروگراماتی۔
- فراہم
- فراہم
- فراہم کرتا ہے
- مقاصد
- سوالات
- فوری
- جلدی سے
- پڑھنا
- خطے
- باقاعدہ
- انحصار کرو
- رہے
- رپورٹیں
- درخواست
- جواب
- نتائج کی نمائش
- خوردہ
- کا جائزہ لینے کے
- اسی
- پیمانے
- دوسری
- سیکشن
- دیکھنا
- منتخب
- منتخب
- سینئر
- بھیجا
- علیحدہ
- سروس
- سروسز
- مقرر
- ہونا چاہئے
- دستخط
- سادہ
- بیک وقت
- سائز
- So
- حل
- ماخذ
- مخصوص
- معیار
- شروع
- درجہ
- مراحل
- ذخیرہ
- موضوع
- جمع
- بعد میں
- اس طرح
- مشورہ
- فراہمی
- فراہمی کا سلسلہ
- تائید
- کی حمایت کرتا ہے
- ٹیم
- ٹیکنیکل
- ٹیکنالوجی
- ٹیسٹ
- سے
- کہ
- ۔
- ماخذ
- ان
- تو
- لہذا
- وہ
- اس
- کے ذریعے
- وقت
- کرنے کے لئے
- اوزار
- ٹی پی
- ٹریک
- معاملات
- سفر
- دو
- ui
- کے تحت
- سمجھ
- برعکس
- تازہ ترین معلومات
- اپ لوڈ کردہ
- اپ لوڈ کرنا
- URL
- استعمال
- استعمال کی شرائط
- استعمال کیس
- استعمال کیا جاتا ہے
- کا استعمال کرتے ہوئے
- کی طرف سے
- نظر
- دورہ
- تصور
- انتظار
- چاہتے ہیں
- we
- ویب
- ویب خدمات
- اچھا ہے
- جب
- جس
- گے
- ساتھ
- کے اندر
- بغیر
- کام کر
- کام کرتا ہے
- لکھنا
- تحریری طور پر
- سال
- آپ
- اور
- زیفیرنیٹ
- زپ