Textract Amazon είναι μια υπηρεσία μηχανικής εκμάθησης (ML) που εξάγει αυτόματα κείμενο, χειρόγραφο και δεδομένα από οποιοδήποτε έγγραφο ή εικόνα. Για να είναι πιο εύκολη η αξιολόγηση των δυνατοτήτων του Amazon Textract, έχουμε κυκλοφορήσει μια νέα λειτουργία Μεταφόρτωσης Μαζικών Εγγράφων στην κονσόλα Amazon Textract που σας δίνει τη δυνατότητα να επεξεργάζεστε γρήγορα το δικό σας σύνολο εγγράφων χωρίς να γράφετε κώδικα.
Σε αυτήν την ανάρτηση, περιγράφουμε πότε και πώς να χρησιμοποιήσετε το Amazon Textract Bulk Document Uploader για να αξιολογήσετε την απόδοση του Amazon Textract στα έγγραφά σας.
Επισκόπηση της λύσης
Το πρόγραμμα μεταφόρτωσης μαζικών εγγράφων θα πρέπει να χρησιμοποιείται για γρήγορη αξιολόγηση του Amazon Textract για προκαθορισμένες περιπτώσεις χρήσης. Ανεβάζοντας πολλά έγγραφα ταυτόχρονα μέσω ενός διαισθητικού UI, μπορείτε εύκολα να μετρήσετε πόσο καλά αποδίδει το Amazon Textract στα έγγραφά σας.
Μπορείτε να ανεβάσετε και να επεξεργαστείτε έως και 150 έγγραφα ταυτόχρονα. Σε αντίθεση με τις υπάρχουσες επιδείξεις της κονσόλας Amazon Textract, οι οποίες επιβάλλουν τεχνητά όρια στον αριθμό των εγγράφων, στο μέγεθος του εγγράφου και στον μέγιστο επιτρεπόμενο αριθμό σελίδων, το Bulk Document Uploader υποστηρίζει την επεξεργασία έως και 150 εγγράφων ανά αίτημα και έχει το ίδιο μέγεθος εγγράφου και όρια σελίδας με τα Amazon Textract API. Αυτό καθιστά πιο αποτελεσματικό για εσάς να αξιολογείτε ένα μεγαλύτερο σύνολο εγγράφων.
Το πρόγραμμα μεταφόρτωσης μαζικών εγγράφων εξάγει μια τυπική απόκριση και αρχείο CSV του Amazon Textract JSON. Τα αποτελέσματα παρέχονται σε μορφή JSON για εύκολη προγραμματική ανάλυση. Επιπλέον, παρέχεται ένα αναγνώσιμο από τον άνθρωπο αρχείο CSV με βαθμολογίες εμπιστοσύνης για απλή σύγκριση και αξιολόγηση των εξαγόμενων πληροφοριών.
Όταν χρησιμοποιείτε αυτήν τη δυνατότητα, έχετε υπόψη σας τα εξής:
- Το πρόγραμμα μεταφόρτωσης μαζικών εγγράφων επεξεργάζεται έγγραφα μέσω ασύγχρονες λειτουργίες. Μπορείτε να παρακολουθείτε την κατάσταση της επεξεργασίας στην κονσόλα Amazon Textract. Μόνο DetectDocumentText (OCR), Ανάλυση εγγράφου (Πίνακες, ερωτήματα, φόρμες και υπογραφές) και AnalyzeExpense Επί του παρόντος υποστηρίζονται τα API.
- Το πρόγραμμα μεταφόρτωσης μαζικών εγγράφων παρέχει αποτελέσματα JSON των λειτουργιών API και μορφοποιημένες αναφορές CSV. Ίσως χρειαστεί να βασιστείτε σε εξωτερικά εργαλεία για την οπτικοποίηση των δεδομένων, όπως η εμφάνιση επισημάνσεων πλαισίου οριοθέτησης στο έγγραφο χρησιμοποιώντας τα αποτελέσματα JSON.
- Η χρήση αυτής της λειτουργίας για την επεξεργασία εγγράφων επιφέρει τις ίδιες χρεώσεις με την κανονική χρήση του Amazon Textract (ανάλογα με τη δυνατότητα που χρησιμοποιείται) και υπόκειται στα όρια TPS (συναλλαγές ανά δευτερόλεπτο) για API που έχουν οριστεί για τον λογαριασμό και την περιοχή. Για περισσότερες πληροφορίες σχετικά με τις τιμές, ανατρέξτε στο Τιμές Amazon Textract. Για να μάθετε περισσότερα σχετικά με τα όρια Amazon Textract, ανατρέξτε στο Ποσοστώσεις στο Amazon Textract.
- Αποδεκτές μορφές αρχείων για μαζική μεταφόρτωση είναι JPEG, PNG, TIF και PDF. Υποστηρίζονται επίσης εικόνες με κωδικοποίηση JPEG 2000 εντός αρχείων PDF. Τα αρχεία JPEG και PNG έχουν όριο μεγέθους 10 MB, ενώ τα αρχεία PDF και TIF έχουν όριο μεγέθους 500 MB. Τα πολυσέλιδα αρχεία PDF και TIF έχουν όριο 3,000 σελίδων.
Χρησιμοποιήστε το πρόγραμμα μεταφόρτωσης μαζικών εγγράφων
Το Bulk Document Uploader έχει σκοπό να σας βοηθήσει να αξιολογήσετε γρήγορα την απόδοση του Amazon Textract σε ένα σύνολο δικών σας εγγράφων, χωρίς να χρειάζεται να γράψετε κανέναν κώδικα. Μπορείτε να χρησιμοποιήσετε το Πρόγραμμα μεταφόρτωσης μαζικών εγγράφων για να επεξεργαστείτε έως και 150 έγγραφα αντί να ανεβάσετε και να επεξεργαστείτε έγγραφα μεμονωμένα. Μπορείτε να ανεβάσετε μαζικά έγγραφα απευθείας από τον υπολογιστή σας ή να εισάγετε έγγραφα από έναν υπάρχοντα Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) κάδος.
Το Πρόγραμμα μεταφόρτωσης μαζικών εγγράφων παρέχει αποτελέσματα που μπορείτε να κατεβάσετε αργότερα για έλεγχο εκτός σύνδεσης. Κάθε αρχείο ZIP με δυνατότητα λήψης περιέχει την απόκριση API του Amazon Textract σε μορφή αρχείου JSON και ένα αναγνώσιμο από τον άνθρωπο αρχείο CSV της εξόδου που περιέχει τα εξαγόμενα δεδομένα και τους βαθμούς εμπιστοσύνης. Τα αποτελέσματα εξόδου είναι διαθέσιμα για λήψη για 7 ημέρες μετά την επεξεργασία. Μετά από 14 ημέρες, τα έγγραφα διαγράφονται από το Υποβληθέντα έγγραφα Ενότητα. Για να χρησιμοποιήσετε το πρόγραμμα μεταφόρτωσης μαζικών εγγράφων, ολοκληρώστε τα ακόλουθα βήματα:
- Στην κονσόλα Amazon Textract, κάτω από Demos στο παράθυρο πλοήγησης, επιλέξτε Πρόγραμμα μεταφόρτωσης μαζικών εγγράφων.
- Επιλέξτε Μεταφόρτωση εγγράφων.
- Καθορίστε την πηγή των εγγράφων σας.
Έχετε δύο επιλογές για να ανεβάσετε έγγραφα:
- Εισαγωγή εγγράφων από τον κάδο S3 – Εάν χρησιμοποιείτε κάδο S3 για τα έγγραφά σας, δώστε τη διεύθυνση URL του κάδου και (προαιρετικά) το πρόθεμα όπου βρίσκονται τα έγγραφά σας, στο
s3://your-bucket/prefix/
μορφή. Εναλλακτικά, επιλέξτε Αναζήτηση S3 για να περιηγηθείτε και να επιλέξετε την επιθυμητή θέση των εγγράφων σας. Εάν η τοποθεσία Amazon S3 που ορίσατε περιέχει περισσότερα από 150 έγγραφα, τότε μόνο τα πρώτα 150 έγγραφα θα σταλούν στο Amazon Textract για επεξεργασία. - Ανεβάστε έγγραφα από τον υπολογιστή σας – Εάν μεταφορτώνετε έγγραφα από τον υπολογιστή σας, μπορείτε να ανεβάσετε έως και 50 έγγραφα κάθε φορά επιλέγοντας Μεταφόρτωση εγγράφων. Για να ανεβάσετε επιπλέον έγγραφα (έως 150 το μέγιστο), επιλέξτε Προσθέστε έγγραφα μετά τη μεταφόρτωση των αρχικών εγγράφων σας.
Σε αυτήν την περίπτωση, τα έγγραφά σας μεταφορτώνονται πρώτα σε έναν κάδο S3 του λογαριασμού σας που δημιουργείται για λογαριασμό σας, επομένως είναι σημαντικό να διασφαλίσετε ότι έχετε δικαιώματα πρόσβασης και αποστολής εγγράφων στο Amazon S3. Αυτή είναι μια ενέργεια μία φορά και ο ίδιος κάδος θα χρησιμοποιηθεί για όλες τις επόμενες μεταφορτώσεις από τον υπολογιστή σας. Εάν θέλετε να ανεβάσετε και να επεξεργαστείτε το ίδιο σύνολο εγγράφων, μπορείτε να χρησιμοποιήσετε τη διαδρομή προς αυτόν τον κάδο S3 χρησιμοποιώντας το Εισαγωγή εγγράφων από τον κάδο S3 επιλογή. Ο κάδος S3 που δημιουργήθηκε για λογαριασμό σας θα είναι ορατός μετά τη δημιουργία του κάδου.
- Στη συνέχεια, καθορίστε τη δυνατότητα Amazon Textract που θέλετε να χρησιμοποιήσετε για την επεξεργασία των εγγράφων σας.
Μπορείτε να επιλέξετε μόνο μία λειτουργία κάθε φορά για την επεξεργασία των εγγράφων σας. Εάν πρέπει να αξιολογήσετε πρόσθετες λειτουργίες, πρέπει να δημιουργήσετε ένα ξεχωριστό αίτημα επιλέγοντας την επιθυμητή δυνατότητα και ανεβάζοντας ξανά τα έγγραφα. Αν το AnalyzeDocument – Ερωτήματα έχει επιλεγεί η δυνατότητα, πρέπει να παρέχετε τα ερωτήματα που θέλετε να δοκιμάσετε σε σχέση με τα έγγραφά σας. Μπορείτε να καθορίσετε έως και 30 ερωτήματα κάθε φορά. Εάν τα μεταφορτωμένα έγγραφα περιέχουν πολυσέλιδα αρχεία (PDF ή TIF), τα ερωτήματα εφαρμόζονται μόνο στην πρώτη σελίδα κάθε εγγράφου. Αναφέρομαι σε Βέλτιστες πρακτικές για ερωτήματα για να μάθετε πώς να δημιουργείτε ερωτήματα.
- Επιλέξτε Ξεκινήστε την επεξεργασία να υποβάλει τα έγγραφα στο Amazon Texttract για επεξεργασία.
Μπορείτε να παρακολουθείτε την κατάσταση του εγγράφου και να κάνετε λήψη των αποτελεσμάτων εξόδου των επεξεργασμένων εγγράφων στο Υποβληθέντα έγγραφα Ενότητα. Αυτή η ενότητα ενημερώνεται περιοδικά και μπορείτε να την ανανεώσετε με μη αυτόματο τρόπο για να δείτε εάν η επεξεργασία έχει ολοκληρωθεί. Κάθε έγγραφο υποβάλλεται σε επεξεργασία ξεχωριστά, επομένως μπορείτε είτε να επιλέξετε το έγγραφο με Έτοιμο για λήψη κατάσταση ή περιμένετε να ολοκληρωθεί η επεξεργασία όλων των εγγράφων για λήψη των αποτελεσμάτων. Η έξοδος των επεξεργασμένων εγγράφων θα παραμείνει διαθέσιμη για λήψη έως και 7 ημέρες, μετά την οποία θα λήξει. Τα έγγραφα που έχουν λήξει θα διαγραφούν από το Υποβληθέντα έγγραφα ενότητα μετά από 7 επιπλέον ημέρες (14 ημέρες από την ημερομηνία επεξεργασίας). Προτείνουμε τη λήψη και τη διατήρηση των εξόδων εντός της περιόδου των 7 ημερών.
Συμπέρασμα
Σε αυτήν την ανάρτηση, ανακοινώσαμε τη νέα δυνατότητα Amazon Textract Bulk Document Uploader, η οποία σας επιτρέπει να επεξεργάζεστε γρήγορα έναν μεγάλο αριθμό εγγράφων για σκοπούς αξιολόγησης. Μπορείτε να χρησιμοποιήσετε αυτήν τη δυνατότητα για να αξιολογήσετε το Amazon Textract για μια προκαθορισμένη περίπτωση χρήσης με τα έγγραφά σας. Για να μάθετε περισσότερα σχετικά με το πώς μπορείτε να χρησιμοποιήσετε το Amazon Textract στον έξυπνο φόρτο εργασίας επεξεργασίας εγγράφων σας, επισκεφτείτε το Χαρακτηριστικά Amazon Textract και Ξεκινώντας με το Amazon Texttract.
Σχετικά με τους Συγγραφείς
Shashwat Sapre είναι Ανώτερος Τεχνικός Διευθυντής Προϊόντων με την ομάδα Amazon Textract. Επικεντρώνεται στη δημιουργία υπηρεσιών μηχανικής μάθησης για πελάτες AWS. Στον ελεύθερο χρόνο του, του αρέσει να διαβάζει για τις νέες τεχνολογίες, να ταξιδεύει και να εξερευνά διαφορετικές κουζίνες.
Anjan Biswas είναι Ανώτερος Αρχιτέκτονας Λύσεων Υπηρεσιών AI με έμφαση στο AI/ML και την ανάλυση δεδομένων. Ο Anjan είναι μέρος της παγκόσμιας ομάδας υπηρεσιών AI και συνεργάζεται με πελάτες για να τους βοηθήσει να κατανοήσουν και να αναπτύξουν λύσεις σε επιχειρηματικά προβλήματα με AI και ML. Η Anjan έχει πάνω από 14 χρόνια εμπειρίας σε συνεργασία με παγκόσμιους οργανισμούς εφοδιαστικής αλυσίδας, κατασκευής και λιανικής και βοηθά ενεργά τους πελάτες να ξεκινήσουν και να επεκτείνουν τις υπηρεσίες AWS AI.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoAiStream. Web3 Data Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- Minting the Future με την Adryenn Ashley. Πρόσβαση εδώ.
- Αγορά και πώληση μετοχών σε εταιρείες PRE-IPO με το PREIPO®. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :έχει
- :είναι
- :που
- $UP
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- Σχετικά
- πρόσβαση
- Λογαριασμός
- Ενέργειες
- δραστήρια
- Πρόσθετος
- Επιπλέον
- Μετά το
- πάλι
- κατά
- AI
- Υπηρεσίες AI
- AI / ML
- Όλα
- επιτρέπει
- Επίσης
- Amazon
- Textract Amazon
- Amazon υπηρεσίες Web
- an
- ανάλυση
- analytics
- και
- ανακοίνωσε
- κάθε
- api
- APIs
- εφαρμοσμένος
- ΕΙΝΑΙ
- τεχνητός
- AS
- At
- αυτομάτως
- διαθέσιμος
- AWS
- BE
- Κουτί
- Κτίριο
- επιχείρηση
- by
- CAN
- δυνατότητες
- περίπτωση
- περιπτώσεις
- αλυσίδα
- φορτία
- Επιλέξτε
- επιλέγοντας
- κωδικός
- σύγκριση
- πλήρης
- υπολογιστή
- εμπιστοσύνη
- πρόξενος
- κατασκευάσει
- Περιέχει
- δημιουργία
- δημιουργήθηκε
- Τη στιγμή
- Πελάτες
- ημερομηνία
- Δεδομένα Analytics
- Ημερομηνία
- Ημ.
- Demos
- Σε συνάρτηση
- επιθυμητή
- ανάπτυξη
- διαφορετικές
- κατευθείαν
- εμφάνιση
- έγγραφο
- έγγραφα
- κατεβάσετε
- κάθε
- εύκολα
- εύκολος
- αποτελεσματικός
- είτε
- δίνει τη δυνατότητα
- ενισχυμένη
- εξασφαλίζω
- Αιθέρας (ΕΤΗ)
- αξιολογήσει
- εκτίμηση
- υφιστάμενα
- εμπειρία
- Εξερευνώντας
- εξωτερικός
- Εκχυλίσματα
- Χαρακτηριστικό
- Χαρακτηριστικά
- Αρχεία
- Αρχεία
- Όνομα
- Συγκέντρωση
- επικεντρώθηκε
- Εξής
- Για
- μορφή
- μορφές
- από
- παίρνω
- Παγκόσμιο
- Έχω
- he
- βοήθεια
- βοήθεια
- ανταύγειες
- του
- Πως
- Πώς να
- HTML
- http
- HTTPS
- αναγνώσιμη από άνθρωπο
- if
- εικόνα
- εικόνες
- εισαγωγή
- σημαντικό
- επιβάλλω
- in
- Μεμονωμένα
- πληροφορίες
- αρχικός
- αντί
- Έξυπνος
- Έξυπνη επεξεργασία εγγράφων
- προορίζονται
- εισάγοντας
- διαισθητική
- IT
- jpg
- json
- Διατήρηση
- large
- μεγαλύτερος
- αργότερα
- ξεκίνησε
- ΜΑΘΑΊΝΩ
- μάθηση
- LIMIT
- όρια
- τοποθεσία
- μηχανή
- μάθηση μηχανής
- κάνω
- ΚΑΝΕΙ
- διευθυντής
- χειροκίνητα
- κατασκευής
- πολοί
- ανώτατο όριο
- Ενδέχεται..
- νου
- ML
- περισσότερο
- πιο αποτελεσματικό
- πολλαπλούς
- πρέπει
- Πλοήγηση
- Ανάγκη
- χρειάζονται
- Νέα
- Νέες τεχνολογίες
- αριθμός
- OCR
- of
- offline
- on
- μια φορά
- ONE
- αποκλειστικά
- λειτουργίες
- Επιλογή
- Επιλογές
- or
- οργανώσεις
- παραγωγή
- επί
- δική
- σελίδα
- παράθυρο
- μέρος
- μονοπάτι
- εκτελεί
- περίοδος
- δικαιώματα
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- Θέση
- πρακτικές
- διατηρώντας
- τιμολόγηση
- προβλήματα
- διαδικασια μας
- Διεργασίες
- μεταποίηση
- Προϊόν
- υπεύθυνος προϊόντων
- προγραμματικός
- παρέχουν
- παρέχεται
- παρέχει
- σκοποί
- ερωτήματα
- Γρήγορα
- γρήγορα
- Ανάγνωση
- περιοχή
- τακτικός
- βασίζονται
- παραμένουν
- Εκθέσεις
- ζητήσει
- απάντησης
- Αποτελέσματα
- λιανική πώληση
- ανασκόπηση
- ίδιο
- Κλίμακα
- Δεύτερος
- Τμήμα
- δείτε
- επιλέγονται
- επιλογή
- αρχαιότερος
- αποστέλλονται
- ξεχωριστό
- υπηρεσία
- Υπηρεσίες
- σειρά
- θα πρέπει να
- Υπογραφές
- Απλούς
- ταυτοχρόνως
- Μέγεθος
- So
- Λύσεις
- Πηγή
- καθορίζεται
- πρότυπο
- ξεκίνησε
- Κατάσταση
- Βήματα
- χώρος στο δίσκο
- θέμα
- υποβάλουν
- μεταγενέστερος
- τέτοιος
- προτείνω
- προμήθεια
- αλυσίδας εφοδιασμού
- υποστηριζόνται!
- Υποστηρίζει
- Τεχνικός
- Τεχνολογίες
- δοκιμή
- από
- ότι
- Η
- Η Πηγη
- Τους
- τότε
- επομένως
- αυτοί
- αυτό
- Μέσω
- ώρα
- προς την
- εργαλεία
- Tps
- τροχιά
- Συναλλαγές
- Ταξίδια
- δύο
- ui
- υπό
- καταλαβαίνω
- διαφορετικός
- ενημερώσεις
- Φορτώθηκε
- Ανέβασμα
- URL
- Χρήση
- χρήση
- περίπτωση χρήσης
- μεταχειρισμένος
- χρησιμοποιώντας
- μέσω
- ορατός
- Επίσκεψη
- οραματισμός
- περιμένετε
- θέλω
- we
- ιστός
- διαδικτυακές υπηρεσίες
- ΛΟΙΠΌΝ
- πότε
- Ποιό
- θα
- με
- εντός
- χωρίς
- εργαζόμενος
- λειτουργεί
- γράφω
- γραφή
- χρόνια
- εσείς
- Σας
- zephyrnet
- Zip