অ্যামাজন টেক্সট্র্যাক একটি মেশিন লার্নিং (ML) পরিষেবা যা স্বয়ংক্রিয়ভাবে যেকোনো নথি বা ছবি থেকে পাঠ্য, হাতের লেখা এবং ডেটা বের করে। অ্যামাজন টেক্সট্র্যাক্টের ক্ষমতাগুলি মূল্যায়ন করা সহজ করার জন্য, আমরা অ্যামাজন টেক্সট্র্যাক্ট কনসোলে একটি নতুন বাল্ক ডকুমেন্ট আপলোডার বৈশিষ্ট্য চালু করেছি যা আপনাকে কোনো কোড না লিখেই আপনার নিজস্ব নথির সেট দ্রুত প্রক্রিয়া করতে সক্ষম করে।
এই পোস্টে, আমরা অ্যামাজন টেক্সট্র্যাক্ট বাল্ক ডকুমেন্ট আপলোডার কখন এবং কীভাবে ব্যবহার করব তা মূল্যায়ন করার জন্য আপনার নথিতে অ্যামাজন টেক্সট্র্যাক্ট কীভাবে কাজ করে তা নিয়ে আলোচনা করি।
সমাধান ওভারভিউ
বাল্ক ডকুমেন্ট আপলোডারটি অ্যামাজন টেক্সট্র্যাক্টের পূর্বনির্ধারিত ব্যবহারের ক্ষেত্রে দ্রুত মূল্যায়নের জন্য ব্যবহার করা উচিত। একটি স্বজ্ঞাত UI এর মাধ্যমে একসাথে একাধিক নথি আপলোড করার মাধ্যমে, আপনি সহজেই অনুমান করতে পারেন যে Amazon Textract আপনার নথিতে কতটা ভাল কাজ করে৷
আপনি একবারে 150টি নথি আপলোড এবং প্রক্রিয়া করতে পারেন। বিদ্যমান অ্যামাজন টেক্সট্র্যাক্ট কনসোল ডেমোগুলির বিপরীতে, যা নথির সংখ্যা, নথির আকার এবং সর্বাধিক অনুমোদিত পৃষ্ঠাগুলির সংখ্যার উপর কৃত্রিম সীমা আরোপ করে, বাল্ক ডকুমেন্ট আপলোডার প্রতি অনুরোধে 150টি নথি পর্যন্ত প্রক্রিয়াকরণ সমর্থন করে এবং একই নথির আকার এবং পৃষ্ঠার সীমা রয়েছে Amazon Textract APIs. এটি আপনার জন্য নথির একটি বৃহত্তর সেট মূল্যায়ন করা আরও দক্ষ করে তোলে।
বাল্ক ডকুমেন্ট আপলোডার একটি আদর্শ Amazon Textract JSON প্রতিক্রিয়া এবং CSV ফাইল আউটপুট করে। সহজ প্রোগ্রামেটিক বিশ্লেষণের জন্য ফলাফলগুলি JSON ফর্ম্যাটে সরবরাহ করা হয়েছে। অতিরিক্তভাবে, নির্যাসিত তথ্যের সহজ তুলনা এবং মূল্যায়নের জন্য আত্মবিশ্বাসের স্কোর সহ একটি মানব-পাঠযোগ্য CSV ফাইল সরবরাহ করা হয়েছে।
এই বৈশিষ্ট্যটি ব্যবহার করার সময়, নিম্নলিখিতগুলি মনে রাখবেন:
- বাল্ক ডকুমেন্ট আপলোডার এর মাধ্যমে ডকুমেন্ট প্রসেস করে অ্যাসিঙ্ক্রোনাস অপারেশন. আপনি Amazon Textract কনসোলে প্রক্রিয়াকরণের অবস্থা ট্র্যাক করতে পারেন। কেবল DetectDocumentText (ওসিআর), ডকুমেন্ট বিশ্লেষণ করুন (সারণী, প্রশ্ন, ফর্ম, এবং স্বাক্ষর), এবং ব্যয় বিশ্লেষণ করুন APIs বর্তমানে সমর্থিত.
- বাল্ক ডকুমেন্ট আপলোডার API অপারেশনের JSON ফলাফল এবং ফর্ম্যাট করা CSV রিপোর্ট প্রদান করে। আপনাকে ডেটার ভিজ্যুয়ালাইজেশনের জন্য বাহ্যিক সরঞ্জামগুলির উপর নির্ভর করতে হতে পারে, যেমন JSON ফলাফলগুলি ব্যবহার করে নথিতে বাউন্ডিং বক্স হাইলাইটগুলি প্রদর্শন করা।
- ডকুমেন্টগুলি প্রক্রিয়া করার জন্য এই বৈশিষ্ট্যটি ব্যবহার করার জন্য নিয়মিত Amazon Textract ব্যবহারের (কোন বৈশিষ্ট্যটি ব্যবহার করা হয় তার উপর নির্ভর করে) সমান চার্জ লাগে এবং অ্যাকাউন্ট এবং অঞ্চলের জন্য সেট করা APIগুলির জন্য TPS (প্রতি সেকেন্ডে লেনদেন) সীমার সাপেক্ষে৷ মূল্য সম্পর্কে আরও তথ্যের জন্য, পড়ুন আমাজন টেক্সট্র্যাক্ট মূল্য. Amazon Textract সীমা সম্পর্কে আরও জানতে, পড়ুন অ্যামাজন টেক্সট্র্যাক্টে কোটা.
- বাল্ক আপলোডারের জন্য স্বীকৃত ফাইল ফরম্যাট হল JPEG, PNG, TIF, এবং PDF। PDF এর মধ্যে JPEG 2000-এনকোড করা ছবিগুলিও সমর্থিত। JPEG এবং PNG ফাইলের সাইজ 10 MB আছে, যেখানে PDF এবং TIF ফাইলের সাইজ 500 MB আছে। বহু-পৃষ্ঠার PDF এবং TIF ফাইলগুলির একটি 3,000 পৃষ্ঠার সীমা রয়েছে৷
বাল্ক ডকুমেন্ট আপলোডার ব্যবহার করুন
বাল্ক ডকুমেন্ট আপলোডারের উদ্দেশ্য আপনাকে দ্রুত মূল্যায়ন করতে সাহায্য করার জন্য যে অ্যামাজন টেক্সট্র্যাক্ট আপনার নিজের নথির একটি সেটে কীভাবে কাজ করে, কোনো কোড লেখার প্রয়োজন ছাড়াই। আপনি স্বতন্ত্রভাবে নথি আপলোড এবং প্রক্রিয়াকরণের পরিবর্তে 150 টির মতো নথি প্রক্রিয়া করতে বাল্ক ডকুমেন্ট আপলোডার ব্যবহার করতে পারেন৷ আপনি আপনার কম্পিউটার থেকে সরাসরি নথিগুলি বাল্ক আপলোড করতে পারেন বা বিদ্যমান থেকে নথি আমদানি করতে পারেন৷ আমাজন সিম্পল স্টোরেজ সার্ভিস (অ্যামাজন এস 3) বালতি।
বাল্ক ডকুমেন্ট আপলোডার ফলাফল প্রদান করে যা আপনি পরে অফলাইন পর্যালোচনার জন্য ডাউনলোড করতে পারবেন। প্রতিটি ডাউনলোডযোগ্য জিপ ফাইলে JSON ফাইল ফর্ম্যাটে Amazon Textract API প্রতিক্রিয়া এবং আউটপুটের একটি মানব-পঠনযোগ্য CSV ফাইল রয়েছে যাতে নিষ্কাশিত ডেটা এবং আত্মবিশ্বাসের স্কোর থাকে। আউটপুট ফলাফল প্রক্রিয়াকরণের পরে 7 দিনের জন্য ডাউনলোডের জন্য উপলব্ধ। 14 দিন পরে, নথিগুলি থেকে সাফ করা হয় জমা দেওয়া নথি অধ্যায়. বাল্ক ডকুমেন্ট আপলোডার ব্যবহার করতে, নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- আমাজন টেক্সট্র্যাক্ট কনসোলে, নীচে গণদেবতা নেভিগেশন ফলকে, নির্বাচন করুন বাল্ক ডকুমেন্ট আপলোডার.
- বেছে নিন দস্তাবেজগুলি আপলোড করুন.
- আপনার নথির উৎস উল্লেখ করুন।
নথি আপলোড করার জন্য আপনার কাছে দুটি বিকল্প রয়েছে:
- S3 বালতি থেকে নথি আমদানি করুন - আপনি যদি আপনার নথিগুলির জন্য একটি S3 বালতি ব্যবহার করেন, তাহলে বালতি URL এবং (ঐচ্ছিকভাবে) উপসর্গটি প্রদান করুন যেখানে আপনার নথিগুলি রয়েছে,
s3://your-bucket/prefix/
বিন্যাস বিকল্পভাবে, নির্বাচন করুন S3 ব্রাউজ করুন ব্রাউজ করতে এবং আপনার নথির পছন্দসই অবস্থান নির্বাচন করতে। যদি আপনার নির্দিষ্ট করা Amazon S3 অবস্থানটিতে 150 টিরও বেশি নথি থাকে, তবে শুধুমাত্র প্রথম 150টি নথি প্রক্রিয়াকরণের জন্য Amazon Textract-এ পাঠানো হবে৷ - আপনার কম্পিউটার থেকে নথি আপলোড করুন - আপনি যদি আপনার কম্পিউটার থেকে নথি আপলোড করছেন, আপনি একবারে 50টি নথি আপলোড করতে পারেন দস্তাবেজগুলি আপলোড করুন. অতিরিক্ত নথি আপলোড করতে (সর্বোচ্চ 150টি পর্যন্ত), বেছে নিন নথি যুক্ত করুন আপনার প্রাথমিক নথি আপলোড করার পরে।
এই ক্ষেত্রে, আপনার দস্তাবেজগুলি প্রথমে আপনার অ্যাকাউন্টের একটি S3 বালতিতে আপলোড করা হয় যা আপনার পক্ষ থেকে তৈরি করা হয়েছে, তাই এটি নিশ্চিত করা গুরুত্বপূর্ণ যে আপনার কাছে Amazon S3 এ নথিগুলি অ্যাক্সেস এবং আপলোড করার অনুমতি রয়েছে৷ এটি একটি এককালীন ক্রিয়া, এবং আপনার কম্পিউটার থেকে পরবর্তী সমস্ত আপলোডগুলির জন্য একই বালতি ব্যবহার করা হবে৷ আপনি যদি নথির একই সেট আপলোড এবং প্রক্রিয়া করতে চান তবে আপনি এই S3 বালতিটির পথ ব্যবহার করে ব্যবহার করতে পারেন S3 বালতি থেকে নথি আমদানি করুন বিকল্প আপনার পক্ষ থেকে তৈরি করা S3 বালতিটি বালতি তৈরি হওয়ার পরে দৃশ্যমান হবে৷
- এরপরে, আপনার নথিগুলি প্রক্রিয়া করতে আপনি যে অ্যামাজন টেক্সট্র্যাক্ট বৈশিষ্ট্যটি ব্যবহার করতে চান তা নির্দিষ্ট করুন৷
আপনার নথিগুলি প্রক্রিয়া করার জন্য আপনি একবারে শুধুমাত্র একটি বৈশিষ্ট্য নির্বাচন করতে পারেন। আপনার যদি অতিরিক্ত বৈশিষ্ট্যগুলি মূল্যায়ন করার প্রয়োজন হয় তবে আপনাকে অবশ্যই পছন্দসই বৈশিষ্ট্যটি নির্বাচন করে এবং নথিগুলি আবার আপলোড করে একটি পৃথক অনুরোধ তৈরি করতে হবে৷ যদি ডকুমেন্ট বিশ্লেষণ করুন – প্রশ্ন বৈশিষ্ট্য নির্বাচন করা হয়েছে, আপনি আপনার নথির বিরুদ্ধে পরীক্ষা করতে চান এমন প্রশ্নগুলি প্রদান করতে হবে। আপনি একবারে 30টি পর্যন্ত প্রশ্ন নির্দিষ্ট করতে পারেন। আপলোড করা নথিতে যদি একাধিক-পৃষ্ঠা (পিডিএফ বা টিআইএফ) ফাইল থাকে, প্রশ্নগুলি শুধুমাত্র প্রতিটি নথির প্রথম পৃষ্ঠায় প্রয়োগ করা হয়। নির্দেশ করে প্রশ্নের জন্য সর্বোত্তম অনুশীলন কিভাবে প্রশ্ন তৈরি করতে হয় সে সম্পর্কে জানতে।
- বেছে নিন প্রক্রিয়াকরণ শুরু করুন প্রক্রিয়াকরণের জন্য Amazon Textract এ নথি জমা দিতে।
আপনি নথির স্থিতি ট্র্যাক করতে পারেন এবং প্রক্রিয়াকৃত নথিগুলির আউটপুট ফলাফলগুলি ডাউনলোড করতে পারেন৷ জমা দেওয়া নথি অধ্যায়. এই বিভাগটি পর্যায়ক্রমে আপডেট হয়, এবং প্রক্রিয়াকরণ সম্পূর্ণ হয়েছে কিনা তা দেখতে আপনি ম্যানুয়ালি রিফ্রেশ করতে পারেন। প্রতিটি নথি পৃথকভাবে প্রক্রিয়া করা হয়, তাই আপনি হয় সঙ্গে নথি নির্বাচন করতে পারেন ডাউনলোড করার জন্য প্রস্তুত স্থিতি বা ফলাফল ডাউনলোড করার জন্য সমস্ত নথি প্রক্রিয়াকরণ সম্পূর্ণ হওয়ার জন্য অপেক্ষা করুন। প্রক্রিয়াকৃত নথিগুলির আউটপুট ডাউনলোডের জন্য 7 দিন পর্যন্ত উপলব্ধ থাকবে, তারপরে সেগুলির মেয়াদ শেষ হয়ে যাবে। মেয়াদোত্তীর্ণ নথিগুলি থেকে সাফ করা হবে জমা দেওয়া নথি বিভাগ 7 অতিরিক্ত দিন পরে (প্রক্রিয়াজাত তারিখ থেকে 14 দিন)। আমরা 7 দিনের মধ্যে আউটপুট ডাউনলোড এবং সংরক্ষণ করার পরামর্শ দিই।
উপসংহার
এই পোস্টে, আমরা নতুন অ্যামাজন টেক্সট্র্যাক্ট বাল্ক ডকুমেন্ট আপলোডার বৈশিষ্ট্য ঘোষণা করেছি, যা আপনাকে মূল্যায়নের উদ্দেশ্যে দ্রুত বিপুল সংখ্যক নথি প্রক্রিয়া করার অনুমতি দেয়। আপনি আপনার নথিগুলির সাথে একটি পূর্বনির্ধারিত ব্যবহারের ক্ষেত্রে Amazon Textract মূল্যায়ন করতে এই বৈশিষ্ট্যটি ব্যবহার করতে পারেন। কিভাবে আপনি আপনার বুদ্ধিমান ডকুমেন্ট প্রসেসিং কাজের চাপে Amazon Textract ব্যবহার করতে পারেন সে সম্পর্কে আরও জানতে, দেখুন অ্যামাজন টেক্সট্র্যাক্ট বৈশিষ্ট্য এবং Amazon Textract দিয়ে শুরু করা হচ্ছে.
লেখক সম্পর্কে
শাশ্বত সাপ্রে আমাজন টেক্সট্র্যাক্ট দলের একজন সিনিয়র টেকনিক্যাল প্রোডাক্ট ম্যানেজার। তিনি AWS গ্রাহকদের জন্য মেশিন লার্নিং-ভিত্তিক পরিষেবা তৈরির দিকে মনোনিবেশ করছেন। তার অবসর সময়ে, তিনি নতুন প্রযুক্তি সম্পর্কে পড়তে, ভ্রমণ করতে এবং বিভিন্ন রান্নার অন্বেষণ করতে পছন্দ করেন।
অঞ্জন বিশ্বাস এআই/এমএল এবং ডেটা অ্যানালিটিক্সের উপর ফোকাস সহ একজন সিনিয়র এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। অঞ্জন বিশ্বব্যাপী AI পরিষেবা দলের অংশ এবং গ্রাহকদের AI এবং ML-এর সাথে ব্যবসায়িক সমস্যার সমাধান বুঝতে এবং তাদের সমাধান করতে সাহায্য করার জন্য তাদের সাথে কাজ করে। অঞ্জনের গ্লোবাল সাপ্লাই চেইন, ম্যানুফ্যাকচারিং এবং খুচরা সংস্থাগুলির সাথে কাজ করার 14 বছরেরও বেশি অভিজ্ঞতা রয়েছে এবং গ্রাহকদের AWS AI পরিষেবাগুলি শুরু করতে এবং স্কেল করতে সক্রিয়ভাবে সাহায্য করছে৷
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- প্লেটোএআইস্ট্রিম। Web3 ডেটা ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- অ্যাড্রিয়েন অ্যাশলির সাথে ভবিষ্যত মিন্টিং। এখানে প্রবেশ করুন.
- PREIPO® এর সাথে PRE-IPO কোম্পানিতে শেয়ার কিনুন এবং বিক্রি করুন। এখানে প্রবেশ করুন.
- উত্স: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- : আছে
- : হয়
- :কোথায়
- $ ইউপি
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- সম্পর্কে
- প্রবেশ
- হিসাব
- কর্ম
- সক্রিয়ভাবে
- অতিরিক্ত
- উপরন্তু
- পর
- আবার
- বিরুদ্ধে
- AI
- এআই পরিষেবা
- এআই / এমএল
- সব
- অনুমতি
- এছাড়াও
- মর্দানী স্ত্রীলোক
- অ্যামাজন টেক্সট্র্যাক
- অ্যামাজন ওয়েব সার্ভিসেস
- an
- বিশ্লেষণ
- বৈশ্লেষিক ন্যায়
- এবং
- ঘোষিত
- কোন
- API
- API গুলি
- ফলিত
- রয়েছি
- কৃত্রিম
- AS
- At
- স্বয়ংক্রিয়ভাবে
- সহজলভ্য
- ডেস্কটপ AWS
- BE
- বক্স
- ভবন
- ব্যবসায়
- by
- CAN
- ক্ষমতা
- কেস
- মামলা
- চেন
- চার্জ
- বেছে নিন
- নির্বাচন
- কোড
- তুলনা
- সম্পূর্ণ
- কম্পিউটার
- বিশ্বাস
- কনসোল
- গঠন করা
- ধারণ
- সৃষ্টি
- নির্মিত
- এখন
- গ্রাহকদের
- উপাত্ত
- ডেটা বিশ্লেষণ
- তারিখ
- দিন
- গণদেবতা
- নির্ভর করে
- আকাঙ্ক্ষিত
- বিকাশ
- বিভিন্ন
- সরাসরি
- প্রদর্শক
- দলিল
- কাগজপত্র
- ডাউনলোড
- প্রতি
- সহজে
- সহজ
- দক্ষ
- পারেন
- সম্ভব
- উন্নত
- নিশ্চিত করা
- থার (eth)
- মূল্যায়ন
- মূল্যায়ন
- বিদ্যমান
- অভিজ্ঞতা
- এক্সপ্লোরিং
- বহিরাগত
- চায়ের
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- ফাইল
- নথি পত্র
- প্রথম
- কেন্দ্রবিন্দু
- দৃষ্টি নিবদ্ধ করা
- অনুসরণ
- জন্য
- বিন্যাস
- ফর্ম
- থেকে
- পাওয়া
- বিশ্বব্যাপী
- আছে
- he
- সাহায্য
- সাহায্য
- হাইলাইট
- তার
- কিভাবে
- কিভাবে
- এইচটিএমএল
- HTTP
- HTTPS দ্বারা
- মানব পাঠযোগ্য
- if
- ভাবমূর্তি
- চিত্র
- আমদানি
- গুরুত্বপূর্ণ
- আরোপ করা
- in
- স্বতন্ত্রভাবে
- তথ্য
- প্রারম্ভিক
- পরিবর্তে
- বুদ্ধিমান
- বুদ্ধিমান নথি প্রক্রিয়াকরণ
- অভিপ্রেত
- উপস্থাপক
- স্বজ্ঞাত
- IT
- JPG
- JSON
- রাখা
- বড়
- বৃহত্তর
- পরে
- চালু
- শিখতে
- শিক্ষা
- LIMIT টি
- সীমা
- অবস্থান
- মেশিন
- মেশিন লার্নিং
- করা
- তৈরি করে
- পরিচালক
- ম্যানুয়ালি
- উত্পাদন
- অনেক
- সর্বাধিক
- মে..
- মন
- ML
- অধিক
- আরো দক্ষ
- বহু
- অবশ্যই
- ন্যাভিগেশন
- প্রয়োজন
- প্রয়োজন
- নতুন
- নতুন প্রযুক্তি
- সংখ্যা
- OCR করুন
- of
- অফলাইন
- on
- একদা
- ONE
- কেবল
- অপারেশনস
- পছন্দ
- অপশন সমূহ
- or
- সংগঠন
- আউটপুট
- শেষ
- নিজের
- পৃষ্ঠা
- শার্সি
- অংশ
- পথ
- পিডিএফ
- সঞ্চালিত
- কাল
- অনুমতি
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- পোস্ট
- চর্চা
- সংরক্ষণ করা
- মূল্য
- সমস্যা
- প্রক্রিয়া
- প্রসেস
- প্রক্রিয়াজাতকরণ
- পণ্য
- পণ্য ব্যবস্থাপক
- কর্মসূচি
- প্রদান
- প্রদত্ত
- উপলব্ধ
- উদ্দেশ্য
- প্রশ্নের
- দ্রুত
- দ্রুত
- পড়া
- এলাকা
- নিয়মিত
- নির্ভর করা
- থাকা
- প্রতিবেদন
- অনুরোধ
- প্রতিক্রিয়া
- ফলাফল
- খুচরা
- এখানে ক্লিক করুন
- একই
- স্কেল
- দ্বিতীয়
- অধ্যায়
- দেখ
- নির্বাচিত
- নির্বাচন
- জ্যেষ্ঠ
- প্রেরিত
- আলাদা
- সেবা
- সেবা
- সেট
- উচিত
- স্বাক্ষর
- সহজ
- এককালে
- আয়তন
- So
- সলিউশন
- উৎস
- নিদিষ্ট
- মান
- শুরু
- অবস্থা
- প্রারম্ভিক ব্যবহারের নির্দেশাবলী
- স্টোরেজ
- বিষয়
- জমা
- পরবর্তী
- এমন
- সুপারিশ
- সরবরাহ
- সরবরাহ শৃঙ্খল
- সমর্থিত
- সমর্থন
- টীম
- কারিগরী
- প্রযুক্তি
- পরীক্ষা
- চেয়ে
- যে
- সার্জারির
- উৎস
- তাহাদিগকে
- তারপর
- অতএব
- তারা
- এই
- দ্বারা
- সময়
- থেকে
- সরঞ্জাম
- টিপিএস
- পথ
- লেনদেন
- ভ্রমণ
- দুই
- ui
- অধীনে
- বোঝা
- অসদৃশ
- আপডেট
- আপলোড করা
- আপলোড
- URL টি
- ব্যবহার
- ব্যবহার
- ব্যবহার ক্ষেত্রে
- ব্যবহৃত
- ব্যবহার
- মাধ্যমে
- দৃশ্যমান
- দেখুন
- কল্পনা
- অপেক্ষা করুন
- প্রয়োজন
- we
- ওয়েব
- ওয়েব সার্ভিস
- আমরা একটি
- কখন
- যে
- ইচ্ছা
- সঙ্গে
- মধ্যে
- ছাড়া
- কাজ
- কাজ
- লেখা
- লেখা
- বছর
- আপনি
- আপনার
- zephyrnet
- ফ্যাস্ শব্দ