Amazon Textil es un servicio de aprendizaje automático (ML) que extrae automáticamente texto, escritura a mano y datos de cualquier documento o imagen. Para simplificar la evaluación de las capacidades de Amazon Textract, hemos lanzado una nueva función Carga masiva de documentos en la consola de Amazon Textract que le permite procesar rápidamente su propio conjunto de documentos sin escribir ningún código.
En esta publicación, explicamos cuándo y cómo usar el cargador masivo de documentos de Amazon Textract para evaluar el rendimiento de Amazon Textract en sus documentos.
Resumen de la solución
El cargador masivo de documentos debe usarse para una evaluación rápida de Amazon Textract para casos de uso predeterminados. Al cargar varios documentos simultáneamente a través de una interfaz de usuario intuitiva, puede medir fácilmente el rendimiento de Amazon Textract en sus documentos.
Puede cargar y procesar hasta 150 documentos a la vez. A diferencia de las demostraciones existentes de la consola de Amazon Textract, que imponen límites artificiales en la cantidad de documentos, el tamaño de los documentos y la cantidad máxima permitida de páginas, el Cargador de documentos en bloque admite el procesamiento de hasta 150 documentos por solicitud y tiene el mismo tamaño de documento y límites de página que las API de Amazon Textract. Esto hace que sea más eficiente evaluar un conjunto más grande de documentos.
El cargador masivo de documentos genera una respuesta JSON estándar de Amazon Textract y un archivo CSV. Los resultados se proporcionan en formato JSON para facilitar el análisis programático. Además, se proporciona un archivo CSV legible por humanos con puntajes de confianza para una comparación y evaluación simples de la información extraída.
Al utilizar esta función, tenga en cuenta lo siguiente:
- El cargador masivo de documentos procesa documentos a través de operaciones asincrónicas. Puede realizar un seguimiento del estado del procesamiento en la consola de Amazon Textract. Solo DetectarDocumentoTexto (LOC), AnalizarDocumento (Tablas, Consultas, Formularios y Firmas), y Analizar gastos Actualmente se admiten las API.
- El cargador masivo de documentos proporciona resultados JSON de las operaciones de la API e informes CSV con formato. Es posible que deba confiar en herramientas externas para la visualización de los datos, como mostrar los resaltes del cuadro delimitador en el documento utilizando los resultados de JSON.
- El uso de esta función para procesar documentos incurre en los mismos cargos que el uso normal de Amazon Textract (según la función que se utilice) y está sujeto a los límites de TPS (transacciones por segundo) para las API que se establecen para la cuenta y la región. Para obtener más información sobre precios, consulte Precios de Amazon Textract. Para obtener más información sobre los límites de Amazon Textract, consulte Cuotas en Amazon Textract.
- Los formatos de archivo aceptados para la carga masiva son JPEG, PNG, TIF y PDF. También se admiten imágenes codificadas en JPEG 2000 dentro de archivos PDF. Los archivos JPEG y PNG tienen un límite de tamaño de 10 MB, mientras que los archivos PDF y TIF tienen un límite de tamaño de 500 MB. Los archivos PDF y TIF de varias páginas tienen un límite de 3,000 páginas.
Utilice el cargador de documentos masivos
El Cargador masivo de documentos está diseñado para ayudarlo a evaluar rápidamente el rendimiento de Amazon Textract en un conjunto de sus propios documentos, sin necesidad de escribir ningún código. Puede usar el Cargador de documentos masivos para procesar hasta 150 documentos en lugar de cargar y procesar documentos individualmente. Puede cargar documentos de forma masiva directamente desde su computadora o importar documentos desde un Servicio de almacenamiento simple de Amazon (Amazon S3) cubo.
El cargador masivo de documentos proporciona resultados que puede descargar más tarde para revisarlos sin conexión. Cada archivo ZIP descargable contiene la respuesta de la API de Amazon Textract en formato de archivo JSON y un archivo CSV legible por humanos de la salida que contiene los datos extraídos y las puntuaciones de confianza. Los resultados de salida están disponibles para su descarga durante 7 días después del procesamiento. Después de 14 días, los documentos se borran de la Documentos enviados sección. Para utilizar el cargador masivo de documentos, complete los siguientes pasos:
- En la consola de Amazon Textract, en Demos en el panel de navegación, elija Cargador de documentos masivos.
- Elige Subir documentos.
- Especifique la fuente de sus documentos.
Tienes dos opciones para subir documentos:
- Importar documentos desde el depósito S3 – Si está utilizando un depósito S3 para sus documentos, proporcione la URL del depósito y (opcionalmente) el prefijo donde residen sus documentos, en
s3://your-bucket/prefix/
formato. Alternativamente, elija Examinar S3 para buscar y seleccionar la ubicación deseada de sus documentos. Si la ubicación de Amazon S3 que especificó contiene más de 150 documentos, solo los primeros 150 documentos se enviarán a Amazon Textract para su procesamiento. - Sube documentos desde tu computadora – Si está cargando documentos desde su computadora, puede cargar hasta 50 documentos a la vez eligiendo subir documentos. Para cargar documentos adicionales (hasta un máximo de 150), elija Agregar documentos después de cargar sus documentos iniciales.
En este caso, sus documentos se cargan primero en un depósito de S3 en su cuenta que se crea en su nombre, por lo tanto, es importante asegurarse de tener permisos para acceder y cargar documentos en Amazon S3. Esta es una acción única y se usará el mismo depósito para todas las cargas subsiguientes desde su computadora. Si desea cargar y procesar el mismo conjunto de documentos, puede usar la ruta a este depósito S3 usando el Importar documentos desde el depósito S3 opción. El depósito de S3 creado en su nombre será visible después de que se cree el depósito.
- A continuación, especifique la función de Amazon Textract que desea utilizar para procesar sus documentos.
Puede seleccionar solo una función a la vez para procesar sus documentos. Si necesita evaluar funciones adicionales, debe crear una solicitud por separado seleccionando la función deseada y cargando los documentos nuevamente. Si el AnalyzeDocument – Consultas está seleccionada, debe proporcionar las consultas que desea probar en sus documentos. Puede especificar hasta 30 consultas a la vez. Si los documentos cargados contienen archivos de varias páginas (PDF o TIF), las consultas solo se aplican a la primera página de cada documento. Referirse a Prácticas recomendadas para consultas para obtener información sobre cómo construir consultas.
- Elige Empezar a procesar para enviar los documentos a Amazon Texttract para su procesamiento.
Puede realizar un seguimiento del estado del documento y descargar los resultados de salida de los documentos procesados en el Documentos enviados sección. Esta sección se actualiza periódicamente y puede actualizarla manualmente para ver si el procesamiento está completo. Cada documento se procesa individualmente, por lo que puede seleccionar el documento con Lista para descargar estado o espere a que todos los documentos terminen de procesarse para descargar los resultados. La salida de los documentos procesados permanecerá disponible hasta por 7 días para su descarga, luego de lo cual caducarán. Los documentos vencidos se borrarán de la Documentos enviados sección después de 7 días adicionales (14 días a partir de la fecha procesada). Sugerimos descargar y conservar las salidas dentro del período de 7 días.
Conclusión
En esta publicación, anunciamos la nueva función Carga masiva de documentos de Amazon Textract, que le permite procesar rápidamente una gran cantidad de documentos con fines de evaluación. Puede utilizar esta característica para evaluar Amazon Textract para un caso de uso predeterminado con sus documentos. Para obtener más información sobre cómo puede utilizar Amazon Textract en su carga de trabajo de procesamiento inteligente de documentos, visite Características de Amazon Texttract y Primeros pasos con Amazon Texttract.
Acerca de los autores
Sapre Shashwat es gerente sénior de productos técnicos en el equipo de Amazon Textract. Se centra en la creación de servicios basados en el aprendizaje automático para los clientes de AWS. En su tiempo libre le gusta leer sobre nuevas tecnologías, viajar y explorar diferentes gastronomías.
anjan biswas es un arquitecto sénior de soluciones de servicios de IA con un enfoque en IA/ML y análisis de datos. Anjan es parte del equipo mundial de servicios de IA y trabaja con los clientes para ayudarlos a comprender y desarrollar soluciones a los problemas comerciales con IA y ML. Anjan tiene más de 14 años de experiencia trabajando con organizaciones globales de cadena de suministro, fabricación y venta al por menor, y está ayudando activamente a los clientes a comenzar y escalar en los servicios de IA de AWS.
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- PlatoAiStream. Inteligencia de datos Web3. Conocimiento amplificado. Accede Aquí.
- Acuñando el futuro con Adryenn Ashley. Accede Aquí.
- Compra y Vende Acciones en Empresas PRE-IPO con PREIPO®. Accede Aquí.
- Fuente: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :posee
- :es
- :dónde
- $ UP
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- Sobre
- de la máquina
- Mi Cuenta
- la columna Acción
- activamente
- Adicionales
- Adicionalmente
- Después
- de nuevo
- en contra
- AI
- Servicios de IA
- AI / ML
- Todos
- permite
- también
- Amazon
- Amazon Textil
- Amazon Web Services
- an
- análisis
- Analytics
- y
- anunció
- cualquier
- abejas
- API
- aplicada
- somos
- artificial
- AS
- At
- automáticamente
- Hoy Disponibles
- AWS
- BE
- Box
- Construir la
- by
- PUEDEN
- capacidades
- case
- cases
- cadena
- cargos
- Elige
- la elección de
- código
- comparación
- completar
- computadora
- confianza
- Consola
- construir
- contiene
- Para crear
- creado
- En la actualidad
- Clientes
- datos
- Data Analytics
- Fecha
- Días
- Demos
- Dependiente
- deseado
- desarrollar
- una experiencia diferente
- directamente
- mostrar
- documento
- documentos
- descargar
- cada una
- pasan fácilmente
- de forma sencilla
- eficiente
- ya sea
- permite
- mejorado
- garantizar
- Éter (ETH)
- evaluar
- evaluación
- existente
- experience
- Explorar
- externo
- Extractos
- Feature
- Caracteristicas
- Archive
- archivos
- Nombre
- Focus
- centrado
- siguiendo
- formato
- Formularios
- en
- obtener
- Buscar
- Tienen
- he
- ayuda
- ayudando
- destacados
- su
- Cómo
- Como Hacer
- HTML
- http
- HTTPS
- legible por humanos
- if
- imagen
- imágenes
- importar
- importante
- impuesta
- in
- Individualmente
- información
- inicial
- De Operación
- Procesamiento inteligente de documentos
- Destinado a
- Presentamos
- intuitivo
- IT
- jpg
- json
- Guardar
- large
- mayores
- luego
- lanzado
- APRENDE:
- aprendizaje
- LIMITE LAS
- límites
- Ubicación
- máquina
- máquina de aprendizaje
- para lograr
- HACE
- gerente
- a mano
- Fabricación
- muchos
- máximas
- Puede..
- mente
- ML
- más,
- más eficiente
- múltiples
- debe
- Navegación
- ¿ Necesita ayuda
- necesidad
- Nuevo
- Nuevas tecnologías
- número
- OCR
- of
- digital fuera de línea.
- on
- una vez
- ONE
- , solamente
- Operaciones
- Optión
- Opciones
- or
- para las fiestas.
- salida
- Más de
- EL DESARROLLADOR
- página
- cristal
- parte
- camino
- (PDF)
- realiza
- período
- permisos
- Platón
- Inteligencia de datos de Platón
- PlatónDatos
- Publicación
- prácticas
- conservación
- cotización
- problemas
- en costes
- tratamiento
- Producto
- gerente de producto
- programático
- proporcionar
- previsto
- proporciona un
- fines
- consultas
- Búsqueda
- con rapidez
- Reading
- región
- regular
- confiar
- permanecer
- Informes
- solicita
- respuesta
- Resultados
- el comercio minorista
- una estrategia SEO para aparecer en las búsquedas de Google.
- mismo
- Escala
- Segundo
- Sección
- ver
- seleccionado
- seleccionar
- mayor
- expedido
- separado
- de coches
- Servicios
- set
- tienes
- Firmas
- sencillos
- simultáneamente
- Tamaño
- So
- Soluciones
- Fuente
- especificado
- estándar
- fundó
- Estado
- pasos
- STORAGE
- sujeto
- enviar
- posterior
- tal
- sugieren
- suministro
- cadena de suministro
- Soportado
- soportes
- equipo
- Técnico
- Tecnologías
- test
- que
- esa
- El
- La Fuente
- Les
- luego
- por lo tanto
- ellos
- así
- A través de esta formación, el personal docente y administrativo de escuelas y universidades estará preparado para manejar los recursos disponibles que derivan de la diversidad cultural de sus estudiantes. Además, un mejor y mayor entendimiento sobre estas diferencias y similitudes culturales permitirá alcanzar los objetivos de inclusión previstos.
- equipo
- a
- TPS
- seguir
- Transacciones
- Viajar
- dos
- ui
- bajo
- entender
- diferente a
- Actualizaciones
- subido
- ¿Cómo subir tu libro?
- Enlance
- Uso
- utilizan el
- caso de uso
- usado
- usando
- vía
- visibles
- Visite
- visualización
- esperar
- quieres
- we
- web
- servicios web
- WELL
- cuando
- que
- seguirá
- dentro de
- sin
- trabajando
- funciona
- escribir
- la escritura
- años
- Usted
- tú
- zephyrnet
- Zip