Testo Amazon è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano e dati da qualsiasi documento o immagine. Per semplificare la valutazione delle capacità di Amazon Textract, abbiamo lanciato una nuova funzione Bulk Document Uploader sulla console di Amazon Textract che ti consente di elaborare rapidamente il tuo set di documenti senza scrivere alcun codice.
In questo post, esaminiamo quando e come utilizzare Amazon Textract Bulk Document Uploader per valutare le prestazioni di Amazon Textract sui tuoi documenti.
Panoramica della soluzione
Il Bulk Document Uploader dovrebbe essere utilizzato per una rapida valutazione di Amazon Textract per casi d'uso predeterminati. Caricando più documenti contemporaneamente tramite un'interfaccia utente intuitiva, puoi facilmente valutare le prestazioni di Amazon Textract sui tuoi documenti.
Puoi caricare ed elaborare fino a 150 documenti contemporaneamente. A differenza delle demo della console Amazon Textract esistenti, che impongono limiti artificiali al numero di documenti, alle dimensioni del documento e al numero massimo consentito di pagine, Bulk Document Uploader supporta l'elaborazione di un massimo di 150 documenti per richiesta e ha le stesse dimensioni del documento e gli stessi limiti di pagina di le API di Amazon Textract. Ciò rende più efficiente la valutazione di un insieme più ampio di documenti.
Bulk Document Uploader genera una risposta JSON Amazon Textract standard e un file CSV. I risultati sono forniti in formato JSON per una facile analisi programmatica. Inoltre, viene fornito un file CSV leggibile dall'uomo con punteggi di confidenza per un semplice confronto e valutazione delle informazioni estratte.
Quando utilizzi questa funzione, tieni presente quanto segue:
- Il Bulk Document Uploader elabora i documenti tramite operazioni asincrone. Puoi tenere traccia dello stato dell'elaborazione sulla console di Amazon Textract. Soltanto RilevaDocumentoTesto (OCR), AnalizzaDocumento (tabelle, query, moduli e firme), e Analizza spese Le API sono attualmente supportate.
- L'Uploader di documenti in blocco fornisce i risultati JSON delle operazioni API e i report CSV formattati. Potrebbe essere necessario affidarsi a strumenti esterni per la visualizzazione dei dati, ad esempio la visualizzazione delle evidenziazioni del riquadro di delimitazione sul documento utilizzando i risultati JSON.
- L'utilizzo di questa funzione per elaborare i documenti comporta gli stessi costi del normale utilizzo di Amazon Textract (a seconda della funzione utilizzata) ed è soggetto ai limiti TPS (transazioni al secondo) per le API impostati per l'account e la regione. Per ulteriori informazioni sui prezzi, fare riferimento a Prezzi di Amazon Textract. Per ulteriori informazioni sui limiti di Amazon Textract, consulta Quote in Amazon Texttract.
- I formati di file accettati per l'uploader in blocco sono JPEG, PNG, TIF e PDF. Sono supportate anche le immagini con codifica JPEG 2000 all'interno dei PDF. I file JPEG e PNG hanno un limite di dimensione di 10 MB, mentre i file PDF e TIF hanno un limite di dimensione di 500 MB. I file PDF e TIF multipagina hanno un limite di 3,000 pagine.
Utilizza l'Uploader di documenti in blocco
Bulk Document Uploader ha lo scopo di aiutarti a valutare rapidamente le prestazioni di Amazon Textract su una serie di tuoi documenti, senza dover scrivere alcun codice. Puoi utilizzare Bulk Document Uploader per elaborare fino a 150 documenti invece di caricare ed elaborare i documenti singolarmente. Puoi caricare documenti in blocco direttamente dal tuo computer o importare documenti da un file esistente Servizio di archiviazione semplice Amazon (Amazon S3) secchio.
L'Uploader di documenti in blocco fornisce risultati che puoi scaricare in un secondo momento per la revisione offline. Ogni file ZIP scaricabile contiene la risposta API di Amazon Textract in formato file JSON e un file CSV leggibile dell'output contenente i dati estratti e i punteggi di attendibilità. I risultati di output sono disponibili per il download per 7 giorni dopo l'elaborazione. Dopo 14 giorni, i documenti vengono cancellati dal Documenti inviati sezione. Per utilizzare Bulk Document Uploader, completare i seguenti passaggi:
- Nella console di Amazon Textract, sotto Demos nel pannello di navigazione, scegli Caricatore di documenti in blocco.
- Scegli Carica documenti.
- Specifica la fonte dei tuoi documenti.
Hai due opzioni per caricare i documenti:
- Importa documenti dal bucket S3 – Se utilizzi un bucket S3 per i tuoi documenti, fornisci l'URL del bucket e (facoltativamente) il prefisso in cui risiedono i tuoi documenti, in
s3://your-bucket/prefix/
formato. In alternativa, scegli Sfoglia S3 per sfogliare e selezionare la posizione desiderata dei tuoi documenti. Se la posizione Amazon S3 specificata contiene più di 150 documenti, solo i primi 150 documenti verranno inviati ad Amazon Textract per l'elaborazione. - Carica i documenti dal tuo computer – Se stai caricando documenti dal tuo computer, puoi caricare fino a 50 documenti alla volta scegliendo Carica documenti. Per caricare documenti aggiuntivi (fino a un massimo di 150), scegli Aggiungere documenti dopo che i tuoi documenti iniziali sono stati caricati.
In questo caso, i tuoi documenti vengono prima caricati in un bucket S3 nel tuo account creato per tuo conto, pertanto è importante assicurarsi di disporre delle autorizzazioni per accedere e caricare i documenti in Amazon S3. Questa è un'azione una tantum e lo stesso bucket verrà utilizzato per tutti i caricamenti successivi dal tuo computer. Se desideri caricare ed elaborare lo stesso set di documenti, puoi utilizzare il percorso di questo bucket S3 utilizzando il file Importa documenti dal bucket S3 opzione. Il bucket S3 creato per tuo conto sarà visibile dopo la creazione del bucket.
- Successivamente, specifica la funzionalità Amazon Textract che desideri utilizzare per elaborare i tuoi documenti.
Puoi selezionare solo una funzione alla volta per elaborare i tuoi documenti. Se è necessario valutare funzionalità aggiuntive, è necessario creare una richiesta separata selezionando la funzionalità desiderata e caricando nuovamente i documenti. Se la AnalyzeDocument – Query è selezionata la funzione, è necessario fornire le query che si desidera verificare rispetto ai propri documenti. Puoi specificare fino a 30 query alla volta. Se i documenti caricati contengono file multipagina (PDF o TIF), le query vengono applicate solo alla prima pagina di ciascun documento. Fare riferimento a Best practice per le query per imparare a costruire query.
- Scegli Inizia l'elaborazione per inviare i documenti ad Amazon Textract per l'elaborazione.
È possibile tenere traccia dello stato del documento e scaricare i risultati di output dei documenti elaborati nel file Documenti inviati sezione. Questa sezione viene aggiornata periodicamente ed è possibile aggiornarla manualmente per vedere se l'elaborazione è completa. Ogni documento viene elaborato individualmente, quindi puoi selezionare il documento con Pronto per il download stato o attendere il completamento dell'elaborazione di tutti i documenti per scaricare i risultati. L'output dei documenti elaborati rimarrà disponibile per un massimo di 7 giorni per il download, dopodiché scadrà. I documenti scaduti verranno cancellati dal Documenti inviati sezione dopo ulteriori 7 giorni (14 giorni dalla data di elaborazione). Suggeriamo di scaricare e conservare gli output entro il periodo di 7 giorni.
Conclusione
In questo post, abbiamo annunciato la nuova funzione Amazon Textract Bulk Document Uploader, che consente di elaborare rapidamente un gran numero di documenti a scopo di valutazione. Puoi utilizzare questa funzione per valutare Amazon Textract per un caso d'uso predeterminato con i tuoi documenti. Per ulteriori informazioni su come utilizzare Amazon Textract nel tuo carico di lavoro di elaborazione intelligente dei documenti, visita Caratteristiche di Amazon Textract ed Iniziare con Amazon Textract.
Informazioni sugli autori
Shashwat Sapre è un Senior Technical Product Manager con il team di Amazon Texttract. È concentrato sulla creazione di servizi basati sull'apprendimento automatico per i clienti AWS. Nel tempo libero ama leggere di nuove tecnologie, viaggiare ed esplorare cucine diverse.
Anjan Biswas è un Senior AI Services Solutions Architect con un focus su AI/ML e Data Analytics. Anjan fa parte del team di servizi AI a livello mondiale e lavora con i clienti per aiutarli a comprendere e sviluppare soluzioni ai problemi aziendali con AI e ML. Anjan ha oltre 14 anni di esperienza di lavoro con organizzazioni globali di supply chain, produzione e vendita al dettaglio e sta attivamente aiutando i clienti a iniziare e scalare i servizi AWS AI.
- Distribuzione di contenuti basati su SEO e PR. Ricevi amplificazione oggi.
- PlatoAiStream. Intelligenza dei dati Web3. Conoscenza amplificata. Accedi qui.
- Coniare il futuro con Adryenn Ashley. Accedi qui.
- Acquista e vendi azioni in società PRE-IPO con PREIPO®. Accedi qui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :ha
- :È
- :Dove
- $ SU
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- Chi siamo
- accesso
- Il mio account
- Action
- attivamente
- aggiuntivo
- Inoltre
- Dopo shavasana, sedersi in silenzio; saluti;
- ancora
- contro
- AI
- Servizi di intelligenza artificiale
- AI / ML
- Tutti
- consente
- anche
- Amazon
- Testo Amazon
- Amazon Web Services
- an
- .
- analitica
- ed
- ha annunciato
- in qualsiasi
- api
- API
- applicato
- SONO
- artificiale
- AS
- At
- automaticamente
- disponibile
- AWS
- BE
- Scatola
- Costruzione
- affari
- by
- Materiale
- funzionalità
- Custodie
- casi
- catena
- oneri
- Scegli
- la scelta
- codice
- confronto
- completamento di una
- computer
- fiducia
- consolle
- costruire
- contiene
- creare
- creato
- Attualmente
- Clienti
- dati
- Dati Analytics
- Data
- Giorni
- Demos
- Dipendente
- desiderato
- sviluppare
- diverso
- direttamente
- visualizzazione
- documento
- documenti
- scaricare
- ogni
- facilmente
- facile
- efficiente
- o
- Abilita
- migliorata
- garantire
- Etere (ETH)
- valutare
- valutazione
- esistente
- esperienza
- Esplorare
- esterno
- estratti
- caratteristica
- Caratteristiche
- Compila il
- File
- Nome
- Focus
- concentrato
- i seguenti
- Nel
- formato
- forme
- da
- ottenere
- globali
- Avere
- he
- Aiuto
- aiutare
- evidenzia
- il suo
- Come
- Tutorial
- HTML
- http
- HTTPS
- leggibile dagli umani
- if
- Immagine
- immagini
- importare
- importante
- imporre
- in
- Individualmente
- informazioni
- inizialmente
- invece
- Intelligente
- Elaborazione intelligente dei documenti
- destinato
- l'introduzione di
- intuitivo
- IT
- jpg
- json
- mantenere
- grandi
- superiore, se assunto singolarmente.
- dopo
- lanciato
- IMPARARE
- apprendimento
- LIMITE
- limiti
- località
- macchina
- machine learning
- make
- FA
- direttore
- manualmente
- consigliato per la
- molti
- massimo
- Maggio..
- mente
- ML
- Scopri di più
- più efficiente
- multiplo
- devono obbligatoriamente:
- Navigazione
- Bisogno
- che necessitano di
- New
- Nuove tecnologie
- numero
- OCR
- of
- offline
- on
- una volta
- ONE
- esclusivamente
- Operazioni
- Opzione
- Opzioni
- or
- organizzazioni
- produzione
- ancora
- proprio
- pagina
- vetro
- parte
- sentiero
- esegue
- periodo
- permessi
- Platone
- Platone Data Intelligence
- PlatoneDati
- Post
- pratiche
- preservare
- prezzi
- problemi
- processi
- i processi
- lavorazione
- Prodotto
- product manager
- programmatica
- fornire
- purché
- fornisce
- fini
- query
- Presto
- rapidamente
- Lettura
- regione
- Basic
- fare affidamento
- rimanere
- Report
- richiesta
- risposta
- Risultati
- nello specifico retail
- recensioni
- stesso
- Scala
- Secondo
- Sezione
- vedere
- selezionato
- Selezione
- anziano
- inviato
- separato
- servizio
- Servizi
- set
- dovrebbero
- firme
- Un'espansione
- contemporaneamente
- Taglia
- So
- Soluzioni
- Fonte
- specificato
- Standard
- iniziato
- Stato dei servizi
- Passi
- conservazione
- soggetto
- inviare
- successivo
- tale
- suggerire
- fornire
- supply chain
- supportato
- supporti
- team
- Consulenza
- Tecnologie
- test
- di
- che
- I
- L’ORIGINE
- Li
- poi
- perciò
- di
- questo
- Attraverso
- tempo
- a
- strumenti
- tps
- pista
- Le transazioni
- Di viaggio
- seconda
- ui
- per
- capire
- a differenza di
- Aggiornamenti
- caricato
- Caricamento
- URL
- Impiego
- uso
- caso d'uso
- utilizzato
- utilizzando
- via
- visibile
- Visita
- visualizzazione
- aspettare
- volere
- we
- sito web
- servizi web
- WELL
- quando
- quale
- volere
- con
- entro
- senza
- lavoro
- lavori
- scrivere
- scrittura
- anni
- Tu
- Trasferimento da aeroporto a Sharm
- zefiro
- Codice postale