아마존 텍사스 모든 문서나 이미지에서 텍스트, 필기, 데이터를 자동으로 추출하는 머신러닝(ML) 서비스입니다. Amazon Textract의 기능을 더 쉽게 평가할 수 있도록 Amazon Textract 콘솔에서 코드를 작성하지 않고도 자체 문서 세트를 빠르게 처리할 수 있는 새로운 대량 문서 업로더 기능을 출시했습니다.
이 게시물에서는 Amazon Textract Bulk Document Uploader를 사용하여 Amazon Textract가 문서에서 수행하는 방식을 평가하는 시기와 방법을 살펴봅니다.
솔루션 개요
Bulk Document Uploader는 미리 결정된 사용 사례에 대해 Amazon Textract를 빠르게 평가하는 데 사용해야 합니다. 직관적인 UI를 통해 여러 문서를 동시에 업로드하면 Amazon Textract가 문서에서 얼마나 잘 수행되는지 쉽게 측정할 수 있습니다.
한 번에 최대 150개의 문서를 업로드하고 처리할 수 있습니다. 문서 수, 문서 크기 및 최대 허용 페이지 수에 인위적인 제한을 두는 기존 Amazon Textract 콘솔 데모와 달리 Bulk Document Uploader는 요청당 최대 150개의 문서 처리를 지원하며 동일한 문서 크기 및 페이지 제한을 가집니다. Amazon Textract API. 이렇게 하면 더 큰 문서 집합을 보다 효율적으로 평가할 수 있습니다.
대량 문서 업로더는 표준 Amazon Textract JSON 응답 및 CSV 파일을 출력합니다. 결과는 쉽게 프로그래밍 방식으로 분석할 수 있도록 JSON 형식으로 제공됩니다. 또한 추출된 정보의 간단한 비교 및 평가를 위해 신뢰도 점수가 포함된 사람이 읽을 수 있는 CSV 파일이 제공됩니다.
이 기능을 사용할 때 다음 사항에 유의하십시오.
- 대량 문서 업로더는 다음을 통해 문서를 처리합니다. 비동기 작업. Amazon Textract 콘솔에서 처리 상태를 추적할 수 있습니다. 오직 문서 텍스트 감지 (OCR), 문서 분석 (테이블, 쿼리, 양식 및 서명) 및 비용 분석 API는 현재 지원됩니다.
- 대량 문서 업로더는 API 작업의 JSON 결과와 형식이 지정된 CSV 보고서를 제공합니다. JSON 결과를 사용하여 문서에 경계 상자 하이라이트를 표시하는 것과 같이 데이터 시각화를 위해 외부 도구에 의존해야 할 수도 있습니다.
- 이 기능을 사용하여 문서를 처리하면 일반 Amazon Textract 사용과 동일한 요금이 부과되며(사용되는 기능에 따라 다름) 계정 및 리전에 대해 설정된 API에 대한 TPS(초당 트랜잭션) 제한이 적용됩니다. 가격 책정에 대한 자세한 내용은 다음을 참조하십시오. Amazon Textract 요금. Amazon Textract 제한에 대한 자세한 내용은 다음을 참조하십시오. Amazon Textract의 할당량.
- 일괄 업로더에 허용되는 파일 형식은 JPEG, PNG, TIF 및 PDF입니다. PDF 내의 JPEG 2000 인코딩 이미지도 지원됩니다. JPEG 및 PNG 파일의 크기 제한은 10MB인 반면 PDF 및 TIF 파일의 크기 제한은 500MB입니다. 다중 페이지 PDF 및 TIF 파일은 3,000페이지로 제한됩니다.
대량 문서 업로더 사용
Bulk Document Uploader는 코드를 작성할 필요 없이 Amazon Textract가 자체 문서 세트에서 수행하는 방식을 신속하게 평가하는 데 도움을 주기 위한 것입니다. 문서를 개별적으로 업로드하고 처리하는 대신 대량 문서 업로더를 사용하여 최대 150개의 문서를 처리할 수 있습니다. 컴퓨터에서 직접 문서를 일괄 업로드하거나 기존에서 문서를 가져올 수 있습니다. 아마존 단순 스토리지 서비스 (Amazon S3) 버킷.
대량 문서 업로더는 나중에 오프라인 검토를 위해 다운로드할 수 있는 결과를 제공합니다. 다운로드 가능한 각 ZIP 파일에는 JSON 파일 형식의 Amazon Textract API 응답과 추출된 데이터 및 신뢰도 점수가 포함된 출력의 사람이 읽을 수 있는 CSV 파일이 포함되어 있습니다. 출력 결과는 처리 후 7일간 다운로드 가능합니다. 14일 후, 문서는 제출서류 부분. 대량 문서 업로더를 사용하려면 다음 단계를 완료하세요.
- Amazon Textract 콘솔에서 데모 곡 탐색 창에서 대량 문서 업로더.
- 왼쪽 메뉴에서 문서 업로드.
- 문서의 출처를 지정하십시오.
문서를 업로드하는 데는 두 가지 옵션이 있습니다.
- S3 버킷에서 문서 가져오기 – 문서에 S3 버킷을 사용하는 경우 버킷 URL과 (선택 사항) 문서가 있는 접두사를 입력합니다.
s3://your-bucket/prefix/
체재. 또는 선택 S3 찾아보기 문서의 원하는 위치를 찾아보고 선택합니다. 지정한 Amazon S3 위치에 150개 이상의 문서가 포함된 경우 처음 150개 문서만 처리를 위해 Amazon Textract로 전송됩니다. - 컴퓨터에서 문서 업로드 – 컴퓨터에서 문서를 업로드하는 경우 다음을 선택하여 한 번에 최대 50개의 문서를 업로드할 수 있습니다. 문서 업로드. 추가 문서(최대 150개)를 업로드하려면 다음을 선택하십시오. 문서 추가 초기 문서가 업로드된 후.
이 경우 문서는 먼저 사용자 대신 생성된 계정의 S3 버킷에 업로드되므로 Amazon S3에 문서를 액세스하고 업로드할 수 있는 권한이 있는지 확인하는 것이 중요합니다. 이것은 일회성 작업이며 컴퓨터의 모든 후속 업로드에 동일한 버킷이 사용됩니다. 동일한 문서 세트를 업로드하고 처리하려면 다음을 사용하여 이 S3 버킷에 대한 경로를 사용할 수 있습니다. S3 버킷에서 문서 가져오기 옵션. 귀하를 대신하여 생성된 S3 버킷은 버킷이 생성된 후 표시됩니다.
- 다음으로 문서를 처리하는 데 사용할 Amazon Textract 기능을 지정합니다.
문서를 처리하기 위해 한 번에 하나의 기능만 선택할 수 있습니다. 추가 기능 평가가 필요한 경우 원하는 기능을 선택하고 문서를 다시 업로드하여 별도의 요청을 생성해야 합니다. 만약 AnalyzeDocument – 쿼리 기능이 선택되면 문서에 대해 테스트할 쿼리를 제공해야 합니다. 한 번에 최대 30개의 쿼리를 지정할 수 있습니다. 업로드된 문서에 여러 페이지(PDF 또는 TIF) 파일이 포함된 경우 쿼리는 각 문서의 첫 페이지에만 적용됩니다. 인용하다 쿼리 모범 사례 쿼리를 구성하는 방법에 대해 알아봅니다.
- 왼쪽 메뉴에서 처리 시작 처리를 위해 문서를 Amazon Textract에 제출합니다.
문서 상태를 추적하고 처리된 문서의 출력 결과를 제출서류 부분. 이 섹션은 주기적으로 업데이트되며 수동으로 새로 고쳐 처리가 완료되었는지 확인할 수 있습니다. 각 문서는 개별적으로 처리되므로 다음을 사용하여 문서를 선택할 수 있습니다. 다운로드 준비 완료 결과를 다운로드하려면 모든 문서가 처리를 완료할 때까지 기다리십시오. 처리된 문서의 출력물은 다운로드를 위해 최대 7일 동안 사용할 수 있으며 그 이후에는 만료됩니다. 만료된 문서는 제출서류 추가 7일 후(처리일로부터 14일) 7일 기간 내에 출력을 다운로드하고 보존하는 것이 좋습니다.
결론
이 게시물에서는 평가 목적으로 많은 수의 문서를 빠르게 처리할 수 있는 새로운 Amazon Textract Bulk Document Uploader 기능을 발표했습니다. 이 기능을 사용하여 문서와 함께 미리 결정된 사용 사례에 대해 Amazon Textract를 평가할 수 있습니다. 지능형 문서 처리 워크로드에서 Amazon Textract를 사용하는 방법에 대해 자세히 알아보려면 다음 사이트를 방문하십시오. Amazon Textract 기능 과 Amazon Textract 시작하기.
저자에 관하여
샤슈왓 사프레 Amazon Textract 팀의 수석 기술 제품 관리자입니다. 그는 AWS 고객을 위한 기계 학습 기반 서비스 구축에 주력하고 있습니다. 여가 시간에 그는 새로운 기술에 대해 읽고 여행하고 다양한 요리를 탐색하는 것을 좋아합니다.
안잔 비스와스 AI/ML 및 데이터 분석에 중점을 둔 선임 AI 서비스 솔루션 설계자입니다. Anjan은 전 세계 AI 서비스 팀의 일원이며 고객과 협력하여 고객이 AI 및 ML을 통해 비즈니스 문제에 대한 솔루션을 이해하고 개발하도록 돕습니다. Anjan은 글로벌 공급망, 제조 및 소매 조직에서 14년 이상 일한 경험이 있으며 고객이 AWS AI 서비스를 시작하고 확장할 수 있도록 적극적으로 돕고 있습니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoAiStream. Web3 데이터 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 미래 만들기 w Adryenn Ashley. 여기에서 액세스하십시오.
- PREIPO®로 PRE-IPO 회사의 주식을 사고 팔 수 있습니다. 여기에서 액세스하십시오.
- 출처: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-textract-bulk-document-uploader-for-enhanced-evaluation-and-analysis/
- :있다
- :이다
- :어디
- $UP
- 000
- 10
- 100
- 102
- 14
- 30
- 50
- 500
- 7
- a
- 소개
- ACCESS
- 계정
- 동작
- 활발히
- 추가
- 또한
- 후
- 다시
- 반대
- AI
- AI 서비스
- AI / ML
- All
- 수
- 또한
- 아마존
- 아마존 텍사스
- Amazon Web Services
- an
- 분석
- 분석
- 과
- 발표
- 어떤
- API를
- API
- 적용된
- 있군요
- 인조의
- AS
- At
- 자동적으로
- 가능
- AWS
- BE
- 보물상자
- 건물
- 사업
- by
- CAN
- 기능
- 케이스
- 가지 경우
- 체인
- 요금
- 왼쪽 메뉴에서
- 선택
- 암호
- 비교
- 완전한
- 컴퓨터
- 자신
- 콘솔에서
- 구축
- 이 포함되어 있습니다
- 만들
- 만든
- 현재
- 고객
- 데이터
- 데이터 분석
- 날짜
- 일
- 데모 곡
- 의존
- 원하는
- 개발
- 다른
- 직접
- 표시
- 문서
- 서류
- 다운로드
- 마다
- 용이하게
- 쉽게
- 효율적인
- 중
- 수
- 강화
- 확인
- 에테르 (ETH)
- 평가
- 평가
- 현존하는
- 경험
- 탐색
- 외부
- 추출물
- 특색
- 특징
- 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에
- 파일
- 먼저,
- 초점
- 집중
- 수행원
- 럭셔리
- 체재
- 양식
- 에
- 얻을
- 글로벌
- 있다
- he
- 도움
- 도움이
- 하이라이트
- 그의
- 방법
- How To
- HTML
- HTTP
- HTTPS
- 인간이 읽을 수있는
- if
- 영상
- 형상
- import
- 중대한
- 두다
- in
- 개별적으로
- 정보
- 처음에는
- 를 받아야 하는 미국 여행자
- 지능형
- 지능형 문서 처리
- 예정된
- 소개
- 직관적인
- IT
- JPG
- JSON
- 유지
- 넓은
- 큰
- 후에
- 시작
- 배우다
- 배우기
- 제한
- 제한
- 위치
- 기계
- 기계 학습
- 확인
- 제작
- 매니저
- 수동으로
- 제조
- .
- 최고
- XNUMX월..
- 신경
- ML
- 배우기
- 보다 효율적으로
- 여러
- 절대로 필요한 것
- 카테고리
- 필요
- 필요
- 신제품
- 새로운 기술
- 번호
- OCR
- of
- 오프라인
- on
- 일단
- ONE
- 만
- 행정부
- 선택권
- 옵션
- or
- 조직
- 출력
- 위에
- 자신의
- 페이지
- 빵
- 부품
- 통로
- 수행하다
- 기간
- 권한
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 게시하다
- 사례
- 보존
- 가격
- 문제
- 방법
- 프로세스
- 처리
- 프로덕트
- 제품 관리자
- 프로그래밍 방식의
- 제공
- 제공
- 제공
- 목적
- 쿼리
- 빠른
- 빨리
- 읽기
- 지방
- 정규병
- 의지하다
- 남아
- 보고서
- 의뢰
- 응답
- 결과
- 소매
- 리뷰
- 같은
- 규모
- 둘째
- 섹션
- 참조
- 선택된
- 선택
- 연장자
- 전송
- 별도의
- 서비스
- 서비스
- 세트
- 영상을
- 서명
- 단순, 간단, 편리
- 동시에
- 크기
- So
- 솔루션
- 출처
- 지정
- 표준
- 시작
- Status
- 단계
- 저장
- 제목
- 제출
- 후속의
- 이러한
- 제안
- 공급
- 공급망
- 지원
- 지원
- 팀
- 테크니컬
- 기술
- test
- 보다
- 그
- XNUMXD덴탈의
- 소스
- 그들
- 그때
- 따라서
- 그들
- 이
- 을 통하여
- 시간
- 에
- 검색을
- TPS
- 선로
- 거래 내역
- 여행
- 두
- ui
- 아래에
- 이해
- 같지 않은
- 업데이트
- 업로드
- 업로드
- URL
- 용법
- 사용
- 유스 케이스
- 익숙한
- 사용
- 를 통해
- 눈에 보이는
- 방문
- 심상
- 기다리다
- 필요
- we
- 웹
- 웹 서비스
- 잘
- 언제
- 어느
- 의지
- 과
- 이내
- 없이
- 일하는
- 일
- 쓰다
- 쓰기
- 년
- 당신
- 너의
- 제퍼 넷
- 지퍼