अमेज़न टेक्सट्रेक एक मशीन लर्निंग (एमएल) सेवा है जो स्वचालित रूप से किसी दस्तावेज़ या छवि से पाठ, लिखावट और डेटा निकालती है। Amazon Textract की क्षमताओं का मूल्यांकन करना आसान बनाने के लिए, हमने Amazon Textract कंसोल पर एक नया बल्क डॉक्यूमेंट अपलोडर फीचर लॉन्च किया है जो आपको बिना कोई कोड लिखे अपने दस्तावेजों के सेट को जल्दी से प्रोसेस करने में सक्षम बनाता है।
इस पोस्ट में, हम यह जानने के लिए कि Amazon Textract Bulk Document Uploader का उपयोग कब और कैसे करें, यह जानने के लिए कि Amazon Textract आपके दस्तावेज़ों पर कैसा प्रदर्शन करता है।
समाधान का अवलोकन
बल्क दस्तावेज़ अपलोडर का उपयोग पूर्व निर्धारित उपयोग मामलों के लिए Amazon Textract के त्वरित मूल्यांकन के लिए किया जाना चाहिए। एक सहज यूआई के माध्यम से एक साथ कई दस्तावेज़ अपलोड करके, आप आसानी से अनुमान लगा सकते हैं कि अमेज़ॅन टेक्सट्रैक्ट आपके दस्तावेज़ों पर कितना अच्छा प्रदर्शन करता है।
आप एक बार में अधिकतम 150 दस्तावेज़ अपलोड और प्रोसेस कर सकते हैं। मौजूदा अमेज़ॅन टेक्सट्रैक्ट कंसोल डेमो के विपरीत, जो दस्तावेज़ों की संख्या, दस्तावेज़ आकार और पृष्ठों की अधिकतम अनुमत संख्या पर कृत्रिम सीमाएँ लगाता है, बल्क दस्तावेज़ अपलोडर प्रति अनुरोध 150 दस्तावेज़ों तक प्रसंस्करण का समर्थन करता है और दस्तावेज़ का आकार और पृष्ठ सीमाएँ समान हैं अमेज़ॅन टेक्सट्रैक्ट एपीआई। यह आपके लिए दस्तावेज़ों के एक बड़े समूह का मूल्यांकन करना अधिक कुशल बनाता है।
बल्क दस्तावेज़ अपलोडर एक मानक Amazon Textract JSON प्रतिक्रिया और CSV फ़ाइल आउटपुट करता है। परिणाम आसान प्रोग्रामेटिक विश्लेषण के लिए JSON प्रारूप में प्रदान किए जाते हैं। इसके अतिरिक्त, निकाली गई जानकारी की सरल तुलना और मूल्यांकन के लिए कॉन्फिडेंस स्कोर के साथ एक मानव-पठनीय CSV फ़ाइल प्रदान की जाती है।
इस सुविधा का उपयोग करते समय, निम्न बातों का ध्यान रखें:
- बल्क डॉक्यूमेंट अपलोडर दस्तावेजों को प्रोसेस करता है अतुल्यकालिक संचालन. आप Amazon Textract कंसोल पर प्रोसेसिंग की स्थिति को ट्रैक कर सकते हैं। केवल डिटेक्ट डॉक्यूमेंट टेक्स्ट (ओसीआर), विश्लेषण (तालिकाएँ, प्रश्न, प्रपत्र और हस्ताक्षर), और व्यय का विश्लेषण करें एपीआई वर्तमान में समर्थित हैं।
- बल्क दस्तावेज़ अपलोडर एपीआई संचालन के JSON परिणाम और स्वरूपित CSV रिपोर्ट प्रदान करता है। आपको डेटा के विज़ुअलाइज़ेशन के लिए बाहरी टूल पर निर्भर रहने की आवश्यकता हो सकती है, जैसे कि JSON परिणामों का उपयोग करके दस्तावेज़ पर बाउंडिंग बॉक्स हाइलाइट प्रदर्शित करना।
- दस्तावेज़ों को प्रोसेस करने के लिए इस सुविधा का उपयोग करने पर वही शुल्क लगता है जो रेगुलर Amazon Textract उपयोग (इस पर निर्भर करता है कि किस सुविधा का उपयोग किया जाता है) के लिए है, और यह API के लिए TPS (लेन-देन प्रति सेकंड) सीमा के अधीन है जो खाते और क्षेत्र के लिए निर्धारित हैं। मूल्य निर्धारण के बारे में अधिक जानकारी के लिए देखें अमेज़ॅन टेक्सट्रेक मूल्य निर्धारण. Amazon Textract की सीमाओं के बारे में अधिक जानने के लिए देखें Amazon Textract में कोटा.
- बल्क अपलोडर के लिए स्वीकृत फ़ाइल प्रारूप JPEG, PNG, TIF और PDF हैं। पीडीएफ के भीतर जेपीईजी 2000-एन्कोडेड छवियां भी समर्थित हैं। जेपीईजी और पीएनजी फाइलों की आकार सीमा 10 एमबी है, जबकि पीडीएफ और टीआईएफ फाइलों की आकार सीमा 500 एमबी है। मल्टी-पेज पीडीएफ और टीआईएफ फाइलों में 3,000 पेज की सीमा होती है।
बल्क दस्तावेज़ अपलोडर का उपयोग करें
बल्क दस्तावेज़ अपलोडर का उद्देश्य यह मूल्यांकन करने में आपकी मदद करना है कि बिना किसी कोड को लिखे Amazon Textract आपके स्वयं के दस्तावेज़ों के एक सेट पर कैसा प्रदर्शन करता है। आप दस्तावेज़ों को व्यक्तिगत रूप से अपलोड और संसाधित करने के बजाय अधिक से अधिक 150 दस्तावेज़ों को संसाधित करने के लिए बल्क दस्तावेज़ अपलोडर का उपयोग कर सकते हैं। आप दस्तावेज़ों को सीधे अपने कंप्यूटर से बल्क अपलोड कर सकते हैं या किसी मौजूदा से दस्तावेज़ आयात कर सकते हैं अमेज़न सरल भंडारण सेवा (अमेज़न S3) बाल्टी।
बल्क दस्तावेज़ अपलोडर ऐसे परिणाम प्रदान करता है जिन्हें आप ऑफ़लाइन समीक्षा के लिए बाद में डाउनलोड कर सकते हैं। प्रत्येक डाउनलोड करने योग्य ZIP फ़ाइल में JSON फ़ाइल स्वरूप में Amazon Textract API प्रतिक्रिया और निकाले गए डेटा और कॉन्फिडेंस स्कोर वाले आउटपुट की एक मानव-पठनीय CSV फ़ाइल होती है। प्रोसेसिंग के बाद आउटपुट परिणाम 7 दिनों तक डाउनलोड के लिए उपलब्ध रहते हैं। 14 दिनों के बाद, दस्तावेजों को मंजूरी दे दी जाती है प्रस्तुत दस्तावेज अनुभाग। बल्क दस्तावेज़ अपलोडर का उपयोग करने के लिए, निम्न चरणों को पूरा करें:
- Amazon Textract कंसोल पर, के अंतर्गत क़ौम नेविगेशन फलक में, चुनें बल्क दस्तावेज़ अपलोडर.
- चुनें दस्तावेज़ अपलोड करें.
- अपने दस्तावेज़ों के स्रोत निर्दिष्ट करें।
दस्तावेज़ अपलोड करने के लिए आपके पास दो विकल्प हैं:
- S3 बकेट से दस्तावेज़ आयात करें – यदि आप अपने दस्तावेज़ों के लिए S3 बकेट का उपयोग कर रहे हैं, तो बकेट URL और (वैकल्पिक रूप से) उपसर्ग प्रदान करें जहाँ आपके दस्तावेज़ स्थित हैं
s3://your-bucket/prefix/
प्रारूप। वैकल्पिक रूप से चुनें S3 ब्राउज़ करें ब्राउज़ करने और अपने दस्तावेज़ों के वांछित स्थान का चयन करने के लिए। यदि आपके द्वारा निर्दिष्ट Amazon S3 स्थान में 150 से अधिक दस्तावेज़ हैं, तो केवल पहले 150 दस्तावेज़ Amazon Textract को प्रसंस्करण के लिए भेजे जाएंगे। - अपने कंप्यूटर से दस्तावेज़ अपलोड करें – यदि आप अपने कंप्यूटर से दस्तावेज़ अपलोड कर रहे हैं, तो आप चुनकर एक बार में अधिकतम 50 दस्तावेज़ अपलोड कर सकते हैं दस्तावेज़ अपलोड करें. अतिरिक्त दस्तावेज़ अपलोड करने के लिए (अधिकतम 150 तक), चुनें दस्तावेज़ जोड़ें आपके प्रारंभिक दस्तावेज़ अपलोड होने के बाद।
इस मामले में, आपके दस्तावेज़ पहले आपके खाते में एक S3 बकेट में अपलोड किए जाते हैं जो आपकी ओर से बनाया गया है, इसलिए यह सुनिश्चित करना महत्वपूर्ण है कि आपके पास Amazon S3 पर दस्तावेज़ों को एक्सेस करने और अपलोड करने की अनुमति है। यह एक बार की कार्रवाई है, और आपके कंप्यूटर से बाद के सभी अपलोड के लिए उसी बकेट का उपयोग किया जाएगा। यदि आप दस्तावेज़ों के समान सेट को अपलोड और संसाधित करना चाहते हैं, तो आप इस S3 बकेट के पथ का उपयोग कर सकते हैं S3 बकेट से दस्तावेज़ आयात करें विकल्प। बकेट बनने के बाद आपकी ओर से बनाई गई S3 बकेट दिखाई देगी।
- इसके बाद, Amazon Textract सुविधा निर्दिष्ट करें जिसका उपयोग आप अपने दस्तावेज़ों को संसाधित करने के लिए करना चाहते हैं।
आप अपने दस्तावेज़ों को संसाधित करने के लिए एक समय में केवल एक सुविधा का चयन कर सकते हैं। यदि आपको अतिरिक्त सुविधाओं का मूल्यांकन करने की आवश्यकता है, तो आपको वांछित सुविधा का चयन करके और दस्तावेज़ों को दोबारा अपलोड करके एक अलग अनुरोध बनाना होगा। अगर दस्तावेज़ का विश्लेषण करें - प्रश्न सुविधा का चयन किया जाता है, तो आपको वे प्रश्न प्रदान करने होंगे जिनका आप अपने दस्तावेज़ों के विरुद्ध परीक्षण करना चाहते हैं। आप एक समय में अधिकतम 30 प्रश्न निर्दिष्ट कर सकते हैं। यदि अपलोड किए गए दस्तावेज़ों में बहु-पृष्ठ (PDF या TIF) फ़ाइलें हैं, तो प्रश्न केवल प्रत्येक दस्तावेज़ के पहले पृष्ठ पर लागू होते हैं। को देखें प्रश्नों के लिए सर्वोत्तम अभ्यास प्रश्नों का निर्माण कैसे करें के बारे में जानने के लिए।
- चुनें प्रसंस्करण प्रारंभ करें प्रसंस्करण के लिए Amazon Textract को दस्तावेज जमा करने के लिए।
आप दस्तावेज़ की स्थिति को ट्रैक कर सकते हैं और संसाधित दस्तावेज़ों के आउटपुट परिणाम डाउनलोड कर सकते हैं प्रस्तुत दस्तावेज अनुभाग। यह अनुभाग समय-समय पर अद्यतन होता है, और आप यह देखने के लिए इसे मैन्युअल रूप से ताज़ा कर सकते हैं कि संसाधन पूरा हो गया है या नहीं। प्रत्येक दस्तावेज़ को व्यक्तिगत रूप से संसाधित किया जाता है, इसलिए आप या तो दस्तावेज़ का चयन कर सकते हैं डाउनलोड करने के लिए तैयार है स्थिति या परिणाम डाउनलोड करने के लिए सभी दस्तावेजों के प्रसंस्करण को पूरा करने की प्रतीक्षा करें। प्रोसेस किए गए दस्तावेज़ों का आउटपुट डाउनलोड करने के लिए 7 दिनों तक उपलब्ध रहेगा, जिसके बाद वे समाप्त हो जाएंगे। समय सीमा समाप्त दस्तावेज़ से साफ़ कर दिया जाएगा प्रस्तुत दस्तावेज अनुभाग 7 अतिरिक्त दिनों के बाद (संसाधित तिथि से 14 दिन)। हम 7 दिन की अवधि के भीतर आउटपुट को डाउनलोड करने और संरक्षित करने का सुझाव देते हैं।
निष्कर्ष
इस पोस्ट में, हमने नई अमेज़ॅन टेक्सट्रैक्ट बल्क डॉक्यूमेंट अपलोडर सुविधा की घोषणा की, जो आपको मूल्यांकन उद्देश्यों के लिए बड़ी संख्या में दस्तावेजों को जल्दी से संसाधित करने की अनुमति देती है। आप अपने दस्तावेज़ों के साथ पूर्व निर्धारित उपयोग मामले के लिए Amazon Textract का मूल्यांकन करने के लिए इस सुविधा का उपयोग कर सकते हैं। आप अपने इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग वर्कलोड में Amazon Textract का उपयोग कैसे कर सकते हैं, इसके बारे में अधिक जानने के लिए, यहाँ जाएँ अमेज़ॅन टेक्सट्रैक्ट सुविधाएँ और Amazon Textract के साथ शुरुआत करना.
लेखक के बारे में
शाश्वत सप्रे Amazon Textract टीम के साथ एक वरिष्ठ तकनीकी उत्पाद प्रबंधक हैं। वह AWS ग्राहकों के लिए मशीन लर्निंग-आधारित सेवाओं के निर्माण पर केंद्रित है। अपने खाली समय में, उन्हें नई तकनीकों के बारे में पढ़ना, यात्रा करना और विभिन्न व्यंजनों की खोज करना पसंद है।
अंजन बिस्वास एआई / एमएल और डेटा एनालिटिक्स पर ध्यान देने के साथ एक वरिष्ठ एआई सेवा समाधान वास्तुकार है। अंजन विश्वव्यापी एआई सेवा टीम का हिस्सा है और एआई और एमएल के साथ व्यावसायिक समस्याओं के समाधान को समझने और विकसित करने में ग्राहकों की मदद करने के लिए उनके साथ काम करता है। अंजन के पास वैश्विक आपूर्ति श्रृंखला, विनिर्माण और खुदरा संगठनों के साथ काम करने का 14 से अधिक वर्षों का अनुभव है, और सक्रिय रूप से ग्राहकों को AWS AI सेवाओं को शुरू करने और बढ़ाने में मदद कर रहा है।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोआईस्ट्रीम। Web3 डेटा इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- मिंटिंग द फ्यूचर डब्ल्यू एड्रिएन एशले। यहां पहुंचें।
- PREIPO® के साथ PRE-IPO कंपनियों में शेयर खरीदें और बेचें। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :हैस
- :है
- :कहाँ
- $यूपी
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- About
- पहुँच
- लेखा
- कार्य
- सक्रिय रूप से
- अतिरिक्त
- इसके अतिरिक्त
- बाद
- फिर
- के खिलाफ
- AI
- ऐ सेवा
- ऐ / एमएल
- सब
- की अनुमति देता है
- भी
- वीरांगना
- अमेज़न टेक्सट्रेक
- अमेज़ॅन वेब सेवा
- an
- विश्लेषण
- विश्लेषिकी
- और
- की घोषणा
- कोई
- एपीआई
- एपीआई
- लागू
- हैं
- कृत्रिम
- AS
- At
- स्वतः
- उपलब्ध
- एडब्ल्यूएस
- BE
- मुक्केबाज़ी
- इमारत
- व्यापार
- by
- कर सकते हैं
- क्षमताओं
- मामला
- मामलों
- श्रृंखला
- प्रभार
- चुनें
- चुनने
- कोड
- तुलना
- पूरा
- कंप्यूटर
- आत्मविश्वास
- कंसोल
- निर्माण
- शामिल हैं
- बनाना
- बनाया
- वर्तमान में
- ग्राहक
- तिथि
- डेटा विश्लेषण
- तारीख
- दिन
- क़ौम
- निर्भर करता है
- वांछित
- विकसित करना
- विभिन्न
- सीधे
- प्रदर्शित
- दस्तावेज़
- दस्तावेजों
- डाउनलोड
- से प्रत्येक
- आसानी
- आसान
- कुशल
- भी
- सक्षम बनाता है
- वर्धित
- सुनिश्चित
- ईथर (ईटीएच)
- मूल्यांकन करें
- मूल्यांकन
- मौजूदा
- अनुभव
- तलाश
- बाहरी
- अर्क
- Feature
- विशेषताएं
- पट्टिका
- फ़ाइलें
- प्रथम
- फोकस
- ध्यान केंद्रित
- निम्नलिखित
- के लिए
- प्रारूप
- रूपों
- से
- मिल
- वैश्विक
- है
- he
- मदद
- मदद
- हाइलाइट
- उसके
- कैसे
- How To
- एचटीएमएल
- http
- HTTPS
- मानव पठनीय
- if
- की छवि
- छवियों
- आयात
- महत्वपूर्ण
- लगाया
- in
- व्यक्तिगत रूप से
- करें-
- प्रारंभिक
- बजाय
- बुद्धिमान
- बुद्धिमान दस्तावेज़ प्रसंस्करण
- इरादा
- शुरू करने
- सहज ज्ञान युक्त
- IT
- जेपीजी
- JSON
- रखना
- बड़ा
- बड़ा
- बाद में
- शुभारंभ
- जानें
- सीख रहा हूँ
- सीमा
- सीमाएं
- स्थान
- मशीन
- यंत्र अधिगम
- बनाना
- बनाता है
- प्रबंधक
- मैन्युअल
- विनिर्माण
- बहुत
- अधिकतम
- मई..
- मन
- ML
- अधिक
- अधिक कुशल
- विभिन्न
- चाहिए
- पथ प्रदर्शन
- आवश्यकता
- ज़रूरत
- नया
- नयी तकनीकें
- संख्या
- ओसीआर
- of
- ऑफ़लाइन
- on
- एक बार
- ONE
- केवल
- संचालन
- विकल्प
- ऑप्शंस
- or
- संगठनों
- उत्पादन
- के ऊपर
- अपना
- पृष्ठ
- फलक
- भाग
- पथ
- पीडीएफ
- प्रदर्शन
- अवधि
- अनुमतियाँ
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- पद
- प्रथाओं
- संरक्षण
- कीमत निर्धारण
- समस्याओं
- प्रक्रिया
- प्रक्रियाओं
- प्रसंस्करण
- एस्ट्रो मॉल
- उत्पादन प्रबंधक
- कार्यक्रम संबंधी
- प्रदान करना
- बशर्ते
- प्रदान करता है
- प्रयोजनों
- प्रश्नों
- त्वरित
- जल्दी से
- पढ़ना
- क्षेत्र
- नियमित
- भरोसा करना
- रहना
- रिपोर्ट
- का अनुरोध
- प्रतिक्रिया
- परिणाम
- खुदरा
- की समीक्षा
- वही
- स्केल
- दूसरा
- अनुभाग
- देखना
- चयनित
- का चयन
- वरिष्ठ
- भेजा
- अलग
- सेवा
- सेवाएँ
- सेट
- चाहिए
- हस्ताक्षर
- सरल
- एक साथ
- आकार
- So
- समाधान ढूंढे
- स्रोत
- विनिर्दिष्ट
- मानक
- शुरू
- स्थिति
- कदम
- भंडारण
- विषय
- प्रस्तुत
- आगामी
- ऐसा
- सुझाव
- आपूर्ति
- आपूर्ति श्रृंखला
- समर्थित
- समर्थन करता है
- टीम
- तकनीकी
- टेक्नोलॉजीज
- परीक्षण
- से
- कि
- RSI
- स्रोत
- उन
- फिर
- इसलिये
- वे
- इसका
- यहाँ
- पहर
- सेवा मेरे
- उपकरण
- टी पी एस
- ट्रैक
- लेनदेन
- यात्रा का
- दो
- ui
- के अंतर्गत
- समझना
- भिन्न
- अपडेट
- अपलोड की गई
- अपलोड हो रहा है
- यूआरएल
- प्रयोग
- उपयोग
- उदाहरण
- प्रयुक्त
- का उपयोग
- के माध्यम से
- दिखाई
- भेंट
- दृश्य
- प्रतीक्षा
- करना चाहते हैं
- we
- वेब
- वेब सेवाओं
- कुंआ
- कब
- कौन कौन से
- मर्जी
- साथ में
- अंदर
- बिना
- काम कर रहे
- कार्य
- लिखना
- लिख रहे हैं
- साल
- इसलिए आप
- आपका
- जेफिरनेट
- ज़िप