Extrait d'Amazon est un service d'apprentissage automatique (ML) qui extrait automatiquement le texte, l'écriture manuscrite et les données de n'importe quel document ou image. Pour simplifier l'évaluation des capacités d'Amazon Textract, nous avons lancé une nouvelle fonctionnalité Bulk Document Uploader sur la console Amazon Textract qui vous permet de traiter rapidement votre propre ensemble de documents sans écrire de code.
Dans cet article, nous expliquons quand et comment utiliser le téléchargeur de documents en masse Amazon Textract pour évaluer les performances d'Amazon Textract sur vos documents.
Présentation de la solution
Le Bulk Document Uploader doit être utilisé pour une évaluation rapide d'Amazon Textract pour des cas d'utilisation prédéterminés. En téléchargeant plusieurs documents simultanément via une interface utilisateur intuitive, vous pouvez facilement évaluer les performances d'Amazon Textract sur vos documents.
Vous pouvez télécharger et traiter jusqu'à 150 documents à la fois. Contrairement aux démonstrations de console Amazon Textract existantes, qui imposent des limites artificielles au nombre de documents, à la taille des documents et au nombre maximal de pages autorisé, le Bulk Document Uploader prend en charge le traitement jusqu'à 150 documents par demande et a la même taille de document et les mêmes limites de page que les API Amazon Textract. Cela vous permet d'évaluer plus efficacement un ensemble plus important de documents.
Le Bulk Document Uploader génère une réponse JSON Amazon Textract standard et un fichier CSV. Les résultats sont fournis au format JSON pour faciliter l'analyse programmatique. De plus, un fichier CSV lisible par l'homme avec des scores de confiance est fourni pour une comparaison et une évaluation simples des informations extraites.
Lorsque vous utilisez cette fonctionnalité, gardez à l'esprit les points suivants :
- Le Bulk Document Uploader traite les documents via opérations asynchrones. Vous pouvez suivre l'état du traitement sur la console Amazon Textract. Seul DétecterTexteDocument (OCR), AnalyserDocument (tables, requêtes, formulaires et signatures), et Analyser les dépenses Les API sont actuellement prises en charge.
- Le Bulk Document Uploader fournit des résultats JSON des opérations d'API et des rapports CSV formatés. Vous devrez peut-être vous fier à des outils externes pour la visualisation des données, tels que l'affichage des surlignages de la zone de délimitation sur le document à l'aide des résultats JSON.
- L'utilisation de cette fonctionnalité pour traiter des documents entraîne les mêmes frais que l'utilisation normale d'Amazon Textract (selon la fonctionnalité utilisée) et est soumise aux limites TPS (transactions par seconde) pour les API définies pour le compte et la région. Pour plus d'informations sur les tarifs, consultez Tarification d'Amazon Textract. Pour en savoir plus sur les limites d'Amazon Textract, consultez Quotas dans Amazon Textract.
- Les formats de fichiers acceptés pour le téléchargement groupé sont JPEG, PNG, TIF et PDF. Les images encodées en JPEG 2000 dans les fichiers PDF sont également prises en charge. Les fichiers JPEG et PNG ont une limite de taille de 10 Mo, tandis que les fichiers PDF et TIF ont une limite de taille de 500 Mo. Les fichiers PDF et TIF multipages ont une limite de 3,000 XNUMX pages.
Utiliser le téléchargeur de documents en masse
Le Bulk Document Uploader est destiné à vous aider à évaluer rapidement les performances d'Amazon Textract sur un ensemble de vos propres documents, sans avoir à écrire de code. Vous pouvez utiliser Bulk Document Uploader pour traiter jusqu'à 150 documents au lieu de télécharger et de traiter les documents individuellement. Vous pouvez télécharger des documents en bloc directement depuis votre ordinateur ou importer des documents à partir d'un Service de stockage simple Amazon (Amazon S3) seau.
Le téléchargeur de documents en masse fournit des résultats que vous pouvez télécharger ultérieurement pour un examen hors ligne. Chaque fichier ZIP téléchargeable contient la réponse de l'API Amazon Textract au format de fichier JSON et un fichier CSV lisible par l'homme de la sortie contenant les données extraites et les scores de confiance. Les résultats de sortie sont disponibles en téléchargement pendant 7 jours après le traitement. Après 14 jours, les documents sont effacés du Documents soumis section. Pour utiliser le téléchargeur de documents en masse, procédez comme suit :
- Sur la console Amazon Textract, sous Démos dans le volet de navigation, choisissez Téléchargeur de documents en masse.
- Selectionnez Télécharger des documents.
- Précisez la source de vos documents.
Vous avez deux options pour télécharger des documents :
- Importer des documents à partir du compartiment S3 – Si vous utilisez un compartiment S3 pour vos documents, fournissez l'URL du compartiment et (éventuellement) le préfixe où résident vos documents, dans
s3://your-bucket/prefix/
format. Alternativement, choisissez Parcourir S3 pour parcourir et sélectionner l'emplacement souhaité de vos documents. Si l'emplacement Amazon S3 que vous avez spécifié contient plus de 150 documents, seuls les 150 premiers documents seront envoyés à Amazon Textract pour traitement. - Télécharger des documents depuis votre ordinateur – Si vous téléchargez des documents depuis votre ordinateur, vous pouvez télécharger jusqu'à 50 documents à la fois en choisissant Télécharger des documents. Pour télécharger des documents supplémentaires (jusqu'à un maximum de 150), choisissez Ajouter des documents après le téléchargement de vos documents initiaux.
Dans ce cas, vos documents sont d'abord chargés dans un compartiment S3 de votre compte créé en votre nom. Il est donc important de vous assurer que vous disposez des autorisations nécessaires pour accéder aux documents et les charger sur Amazon S3. Il s'agit d'une action unique, et le même compartiment sera utilisé pour tous les téléchargements ultérieurs depuis votre ordinateur. Si vous souhaitez télécharger et traiter le même ensemble de documents, vous pouvez utiliser le chemin d'accès à ce compartiment S3 à l'aide de la Importer des documents à partir du compartiment S3 option. Le compartiment S3 créé en votre nom sera visible après la création du compartiment.
- Ensuite, spécifiez la fonctionnalité Amazon Textract que vous souhaitez utiliser pour traiter vos documents.
Vous ne pouvez sélectionner qu'une seule fonctionnalité à la fois pour traiter vos documents. Si vous avez besoin d'évaluer des fonctionnalités supplémentaires, vous devez créer une demande distincte en sélectionnant la fonctionnalité souhaitée et en téléchargeant à nouveau les documents. Si la AnalyseDocument – Requêtes est sélectionnée, vous devez fournir les requêtes que vous souhaitez tester sur vos documents. Vous pouvez spécifier jusqu'à 30 requêtes à la fois. Si les documents téléchargés contiennent des fichiers de plusieurs pages (PDF ou TIF), les requêtes ne sont appliquées qu'à la première page de chaque document. Faire référence à Meilleures pratiques pour les requêtes pour apprendre à construire des requêtes.
- Selectionnez Démarrer le traitement de soumettre les documents à Amazon Textract pour traitement.
Vous pouvez suivre l'état du document et télécharger les résultats de sortie des documents traités dans le Documents soumis section. Cette section est mise à jour périodiquement et vous pouvez l'actualiser manuellement pour voir si le traitement est terminé. Chaque document est traité individuellement, vous pouvez donc soit sélectionner le document avec Prêt à télécharger statut ou attendez que tous les documents soient traités pour télécharger les résultats. La sortie des documents traités restera disponible jusqu'à 7 jours pour téléchargement, après quoi ils expireront. Les documents expirés seront effacés du Documents soumis section après 7 jours supplémentaires (14 jours à compter de la date de traitement). Nous vous suggérons de télécharger et de conserver les sorties dans la période de 7 jours.
Conclusion
Dans cet article, nous avons annoncé la nouvelle fonctionnalité Amazon Textract Bulk Document Uploader, qui vous permet de traiter rapidement un grand nombre de documents à des fins d'évaluation. Vous pouvez utiliser cette fonctionnalité pour évaluer Amazon Textract pour un cas d'utilisation prédéterminé avec vos documents. Pour en savoir plus sur la façon dont vous pouvez utiliser Amazon Textract dans votre charge de travail de traitement intelligent de documents, visitez Fonctionnalités d'Amazon Textract ainsi que Premiers pas avec Amazon Textract.
À propos des auteurs
Shashwat Sapre est chef de produit technique senior au sein de l'équipe Amazon Textract. Il se concentre sur la création de services basés sur l'apprentissage automatique pour les clients AWS. Dans ses temps libres, il aime lire sur les nouvelles technologies, voyager et explorer différentes cuisines.
Anjan Biswas est un architecte senior de solutions de services d'IA avec un accent sur l'IA/ML et l'analyse de données. Anjan fait partie de l'équipe mondiale des services d'IA et travaille avec les clients pour les aider à comprendre et à développer des solutions aux problèmes commerciaux liés à l'IA et au ML. Anjan a plus de 14 ans d'expérience de travail avec des organisations mondiales de chaîne d'approvisionnement, de fabrication et de vente au détail, et aide activement les clients à démarrer et à évoluer sur les services AWS AI.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoAiStream. Intelligence des données Web3. Connaissance Amplifiée. Accéder ici.
- Frapper l'avenir avec Adryenn Ashley. Accéder ici.
- Achetez et vendez des actions de sociétés PRE-IPO avec PREIPO®. Accéder ici.
- La source: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :possède
- :est
- :où
- $UP
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- À propos
- accès
- Compte
- Action
- activement
- Supplémentaire
- En outre
- Après
- encore
- à opposer à
- AI
- Services d'IA
- AI / ML
- Tous
- permet
- aussi
- Amazon
- Extrait d'Amazon
- Amazon Web Services
- an
- selon une analyse de l’Université de Princeton
- analytique
- ainsi que
- annoncé
- tous
- api
- Apis
- appliqué
- SONT
- artificiel
- AS
- At
- automatiquement
- disponibles
- AWS
- BE
- Box
- Développement
- la performance des entreprises
- by
- CAN
- capacités
- maisons
- cas
- chaîne
- des charges
- Selectionnez
- choose
- code
- Comparaison
- complet
- ordinateur
- confiance
- Console
- construire
- contient
- engendrent
- créée
- Lecture
- Clients
- données
- Analyse de Donnée
- Date
- jours
- Démos
- Selon
- voulu
- développer
- différent
- directement
- afficher
- document
- INSTITUTIONNELS
- download
- chacun
- même
- Easy
- efficace
- non plus
- permet
- améliorée
- assurer
- Ether (ETH)
- évaluer
- évaluation
- existant
- Découvrez
- Explorant
- externe
- Extraits
- Fonctionnalité
- Fonctionnalités:
- Déposez votre dernière attestation
- Fichiers
- Prénom
- Focus
- concentré
- Abonnement
- Pour
- le format
- document
- de
- obtenez
- Global
- Vous avez
- he
- aider
- aider
- Faits saillants
- sa
- Comment
- How To
- HTML
- http
- HTTPS
- lisible par l'homme
- if
- image
- satellite
- importer
- important
- imposer
- in
- Individuellement
- d'information
- initiale
- plutôt ;
- Intelligent
- Traitement intelligent des documents
- prévu
- Découvrez le tout nouveau
- intuitif
- IT
- jpg
- json
- XNUMX éléments à
- gros
- plus importantes
- plus tard
- lancé
- APPRENTISSAGE
- apprentissage
- LIMIT
- limites
- emplacement
- click
- machine learning
- faire
- FAIT DU
- manager
- manuellement
- fabrication
- de nombreuses
- maximales
- Mai..
- l'esprit
- ML
- PLUS
- plus efficace
- plusieurs
- must
- Navigation
- Besoin
- besoin
- Nouveauté
- Les nouvelles technologies
- nombre
- OCR
- of
- direct
- on
- une fois
- ONE
- uniquement
- Opérations
- Option
- Options
- or
- organisations
- sortie
- plus de
- propre
- page
- pain
- partie
- chemin
- effectue
- période
- autorisations
- Platon
- Intelligence des données Platon
- PlatonDonnées
- Post
- pratiques
- conservation
- établissement des prix
- d'ouvrabilité
- processus
- les process
- traitement
- Produit
- chef de produit
- programmatiques
- fournir
- à condition de
- fournit
- des fins
- requêtes
- Rapide
- vite.
- en cours
- région
- Standard
- compter
- rester
- Rapports
- nécessaire
- réponse
- Résultats
- détail
- Avis
- même
- Escaliers intérieurs
- Deuxièmement
- Section
- sur le lien
- choisi
- la sélection
- supérieur
- envoyé
- séparé
- service
- Services
- set
- devrait
- Signatures
- étapes
- simultanément
- Taille
- So
- Solutions
- Identifier
- spécifié
- Standard
- j'ai commencé
- Statut
- Étapes
- storage
- sujet
- soumettre
- ultérieur
- tel
- suggérer
- la quantité
- chaîne d'approvisionnement
- Appareils
- Les soutiens
- équipe
- Technique
- Les technologies
- tester
- que
- qui
- La
- La Source
- Les
- puis
- donc
- l'ont
- this
- Avec
- fiable
- à
- les outils
- tps
- suivre
- Transactions
- Voyages
- deux
- ui
- sous
- comprendre
- contrairement à
- Actualités
- téléchargé
- Téléchargement
- URL
- Utilisation
- utilisé
- cas d'utilisation
- d'utiliser
- en utilisant
- via
- visible
- Visiter
- visualisation
- attendez
- souhaitez
- we
- web
- services Web
- WELL
- quand
- qui
- sera
- avec
- dans les
- sans
- de travail
- vos contrats
- écrire
- écriture
- années
- you
- Votre
- zéphyrnet
- Zip