공식 언어가 여러 개인 국가 또는 여러 지역에서 사업을 운영하는 경우 오디오 파일에 다른 언어가 포함될 수 있습니다. 참가자는 완전히 다른 언어를 사용하거나 언어를 전환할 수 있습니다. 다국어 인구가 많은 지역의 문제를 보고하기 위해 고객 서비스 전화를 고려하십시오. 대화는 한 언어로 시작할 수 있지만 고객이 편안함 수준이나 다른 언어 사용 선호도에 따라 문제를 설명하기 위해 다른 언어로 변경할 수 있습니다. 비슷한 맥락에서 고객 관리 담당자는 작동 또는 문제 해결 지침을 전달하는 동안 언어를 전환할 수 있습니다.
최소 3초의 오디오와 함께, 아마존 전사 사람이 언어를 지정할 필요 없이 오디오에서 말하는 언어로 대본을 자동으로 식별하고 효율적으로 생성할 수 있습니다. 이는 고객 통화 기록, 음성 메일을 텍스트로 변환, 회의 상호 작용 캡처, 사용자 포럼 통신 추적 또는 미디어 콘텐츠 제작 및 현지화 워크플로 모니터링과 같은 다양한 사용 사례에 적용됩니다.
이 게시물은 Amazon Transcribe를 사용하여 다국어 오디오 파일을 기록하는 단계를 안내합니다. Amazon Transcribe에서 오디오 파일을 사용할 수 있게 하고 Amazon Transcribe API를 호출할 때 다국어 오디오 파일의 트랜스크립션을 활성화하는 방법에 대해 설명합니다.
솔루션 개요
Amazon Transcribe는 음성을 텍스트로 쉽게 변환할 수 있는 AWS 서비스입니다. 자동 음성 인식(ASR) 서비스인 Amazon Transcribe를 사용하면 모든 애플리케이션에 음성을 텍스트로 변환하는 기능을 간단하게 추가할 수 있습니다. Amazon Transcribe를 사용하여 오디오 입력을 수집하고, 읽고 검토하기 쉬운 명확한 트랜스크립트를 생성하고, 사용자 지정을 통해 정확성을 높이고, 정보를 필터링하여 클라이언트 개인 정보를 보호할 수 있습니다.
솔루션은 또한 다음을 사용합니다. 아마존 단순 스토리지 서비스 (Amazon S3), 어디에서나 원하는 양의 데이터를 저장하고 검색하도록 구축된 개체 스토리지 서비스입니다. 매우 저렴한 비용으로 업계 최고의 내구성, 가용성, 성능, 보안 및 거의 무제한의 확장성을 제공하는 간단한 스토리지 서비스입니다. Amazon S3에 데이터를 저장할 때 다음과 같은 리소스로 작업합니다. 양동이 과 사물. 버킷은 객체의 컨테이너입니다. 개체는 파일 및 파일을 설명하는 모든 메타데이터입니다.
이 게시물에서는 다국어 오디오 전사 솔루션을 구현하기 위한 다음 단계를 안내합니다.
- S3 버킷을 생성합니다.
- 오디오 파일을 버킷에 업로드합니다.
- 기록 작업을 만듭니다.
- 작업 출력을 검토합니다.
사전 조건
이 연습에서는 다음과 같은 전제 조건이 있어야합니다.
Amazon Transcribe는 전사된 출력을 서비스 관리형 또는 고객 관리형 S3 버킷에 저장할 수 있는 옵션을 제공합니다. 이 게시물에서는 Amazon Transcribe가 결과를 서비스 관리형 S3 버킷에 기록하도록 했습니다.
Amazon Transcribe는 리전 서비스이며 호출되는 Amazon Transcribe API 엔드포인트는 S3 버킷과 동일한 리전에 있어야 합니다.
오디오 입력 파일을 저장할 S3 버킷 생성
S3 버킷을 생성하려면 다음 단계를 완료하십시오.
- Amazon S3 콘솔에서 버킷 만들기.
- 럭셔리 버킷 이름, 버킷의 전역적으로 고유한 이름을 입력합니다.
- 럭셔리 AWS 리전, Amazon Transcribe API 엔드포인트와 동일한 리전을 선택합니다.
- 모든 기본값을 그대로 둡니다.
- 왼쪽 메뉴에서 버킷 만들기.
오디오 파일을 S3 버킷에 업로드
AWS 계정의 S3 버킷에 다국어 오디오 파일을 업로드합니다. 이 연습의 목적을 위해 다음 샘플을 사용합니다. 다국어 오디오 파일. 영어 및 스페인어와 관련된 고객 지원 전화를 캡처합니다..
- Amazon S3 콘솔에서 버킷 탐색 창에서
- 입력 오디오 파일을 저장하기 위해 이전에 생성한 버킷을 선택합니다.
- 왼쪽 메뉴에서 가이드라가.
- 왼쪽 메뉴에서 파일을 추가합니다.
- 로컬 컴퓨터에서 기록할 오디오 파일을 선택합니다.
- 왼쪽 메뉴에서 가이드라가.
오디오 파일은 곧 S3 버킷에서 사용할 수 있습니다.
전사 작업 만들기
오디오 파일이 업로드되었으므로 이제 전사 작업을 생성합니다.
- Amazon Transcribe 콘솔에서 다음을 선택합니다. 전사 작업 탐색 창에서
- 왼쪽 메뉴에서 직업 만들기.
- 럭셔리 성함, 작업의 고유한 이름을 입력합니다.
출력 성적표 파일의 이름이기도 합니다. - 럭셔리 언어 설정, 고르다 자동 다중 언어 식별.
이 기능을 사용하면 Amazon Transcribe가 오디오 파일에서 말하는 모든 언어를 자동으로 식별하고 전사할 수 있습니다. - 럭셔리 자동 언어 식별을 위한 언어 옵션, 선택하지 않은 상태로 둡니다.
Amazon Transcribe는 오디오에서 말하는 모든 언어를 자동으로 식별하고 기록합니다. 필사 정확도를 개선하기 위해 선택적으로 오디오에서 말한 두 개 이상의 언어를 선택할 수 있습니다. - 럭셔리 모델 유형, 오직 일반 모델 이 게시물을 작성하는 시점에 옵션을 사용할 수 있습니다.
- 럭셔리 입력 데이터선택한다. S3 찾아보기.
- 이전에 업로드한 오디오 소스 파일을 선택합니다.
- 럭셔리 출력 데이터, 다음 중 하나를 선택할 수 있습니다. 서비스 관리형 S3 버킷 or 고객이 지정한 S3 버킷. 이 게시물의 경우 선택 서비스 관리형 S3 버킷.
- 왼쪽 메뉴에서 다음 보기.
- 왼쪽 메뉴에서 직업 만들기.
작업 출력 검토
아래로 스크롤하여 전사 미리보기 부분. 오디오 기록이 화면에 표시됩니다. 본문 탭. 기록에는 대화의 영어와 스페인어 부분이 모두 포함됩니다.
선택적으로 사본을 JSON 파일로 다운로드하여 추가로 사용할 수 있습니다. 통화 후 분석.
정리
향후 요금이 발생하지 않도록 하려면 입력 오디오 소스 파일을 저장하기 위해 생성한 S3 버킷을 비우고 삭제하십시오. 버킷에 포함된 모든 개체가 영구적으로 제거되므로 파일을 다른 위치에 저장했는지 확인하십시오. Amazon Transcribe 콘솔에서 트랜스크립션을 위해 이전에 생성한 작업을 선택하고 삭제합니다.
결론
이 게시물에서는 코드를 작성하지 않고 다국어 오디오 파일의 식별 및 전사를 자동화하는 종단 간 워크플로를 만들었습니다. Amazon Transcribe의 새로운 기능을 사용하여 오디오 파일에서 다양한 언어를 자동으로 식별하고 각 언어를 올바르게 기록했습니다.
자세한 내용은 배치 트랜스크립션 작업을 통한 언어 식별.
저자에 관하여
무르투자 부트왈라 AI/ML 기술에 관심이 있는 AWS의 선임 솔루션 아키텍트입니다. 그는 고객이 비즈니스 성과를 달성하도록 돕기 위해 고객과 함께 일하는 것을 즐깁니다. 직장 밖에서는 야외 활동을 즐기며 가족과 시간을 보냅니다.
빅터 로조 AI/ML 및 소프트웨어 개발에 열정적입니다. 그는 미국과 멕시코에서 Amazon Alexa를 시작하고 실행하는 데 도움을 주었습니다. 또한 Amazon Textract를 AWS 파트너에게 제공하고 AWS CCI(Contact Center Intelligence)를 시작했습니다. 그는 현재 대화형 AI 파트너의 글로벌 기술 리더입니다.
바부 스 리니 바산 시카고에 기반을 둔 AWS Sr. Specialist SA(Language AI Services)입니다. 그는 Amazon Transcribe(음성에서 텍스트로)에 중점을 두고 고객이 AI 서비스를 사용하여 비즈니스 문제를 해결하도록 돕습니다. 일 외에는 목공과 마술쇼를 즐긴다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- 플라토 블록체인. Web3 메타버스 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 출처: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- 소개
- 계정
- 달성
- 가로질러
- 방과 후 액티비티
- AI
- AI 서비스
- AI / ML
- 알렉사
- All
- 이기는하지만
- 아마존
- 아마존 텍사스
- 아마존 전사
- 양
- 과
- 다른
- 어딘가에
- API를
- API
- 어플리케이션
- 지역
- 오디오
- 자동화
- 자동화
- Automatic
- 자동적으로
- 유효성
- 가능
- AWS
- 기반으로
- 때문에
- 존재
- 사이에
- 가져
- 내장
- 사업
- 전화
- 라는
- 부름
- 통화
- 캡처
- 캡처
- 한
- 가지 경우
- 센터
- 이전 단계로 돌아가기
- 요금
- 시카고
- 왼쪽 메뉴에서
- 선명한
- 클라이언트
- 암호
- 위로
- 커뮤니케이션
- 완전한
- 컴퓨터
- 고려
- 콘솔에서
- CONTACT
- 연락 센터
- 컨테이너
- 함유량
- 대화
- 이야기 잘하는
- 대화 형 AI
- 변하게 하다
- 비용
- 수
- 국가
- 만들
- 만든
- 현재
- 고객
- 고객 센터
- 고객센터
- 고객
- 사용자 정의
- 데이터
- 기본값
- 의존
- 설명
- 개발
- 다른
- 토론
- 아래 (down)
- 다운로드
- 내구성
- 마다
- 효율적으로
- 중
- 다른
- 가능
- 수
- 끝으로 종료
- 영어
- 엔터 버튼
- 전적으로
- 에테르 (ETH)
- 운동
- 가족
- 실행할 수 있는
- 특색
- 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에
- 파일
- 필터링
- 집중
- 수행원
- 포럼
- 에
- 기능
- 추가
- 미래
- 생성
- 얻을
- 글로벌
- 세계적으로
- 육로
- 도움
- 도움
- 도움이
- 방법
- How To
- HTML
- HTTPS
- 인간
- 식별
- 식별하다
- 확인
- 구현
- 개선
- in
- 포함
- 증가
- 업계 최고의
- 정보
- 입력
- 명령
- 인텔리전스
- 상호 작용
- 관심
- IT
- 일
- JSON
- 알아
- 알려진
- 언어
- 언어
- 리더
- 휴가
- 레벨
- 지방의
- 현지화
- 낮은
- 마법
- 확인
- 제작
- 관리
- 미디어
- 회의
- 메타 데이터
- 맥시코
- 수도
- 최저한의
- 모니터링
- 배우기
- 여러
- name
- 카테고리
- 필요
- 필요
- 신제품
- 대상
- 사물
- 제공
- 공무원
- ONE
- 열 수
- 운영
- 운영
- 선택권
- 옵션
- 기타
- 외부
- 빵
- 참가자
- 파트너
- 열렬한
- 성능
- 실행할 수 있는
- 영구적으로
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 인구
- 게시하다
- 환경 설정
- 전제 조건
- 이전에
- 개인 정보 보호
- 문제
- 문제
- 생산
- 보호
- 제공
- 목적
- 읽기
- 인식
- 지방
- 지역적인
- 지역
- 제거
- 신고
- 대리인
- 자료
- 결과
- 리뷰
- 달리는
- SA
- 같은
- 확장성
- 초
- 섹션
- 보안
- 서비스
- 서비스
- 곧
- 영상을
- 쇼
- 비슷한
- 단순, 간단, 편리
- 소프트웨어
- 소프트웨어 개발
- 해결책
- 솔루션
- 풀다
- 출처
- 스페인어
- 말하기
- 전문가
- 지정
- 연설
- 음성 인식
- 지출
- 단계
- 저장
- 저장
- 저장
- 실질적인
- 이러한
- SUPPORT
- 스위치
- 기술
- 기술
- XNUMXD덴탈의
- 그들의
- 을 통하여
- 시간
- 에
- 추적
- 성적 증명서
- 전이
- 유일한
- 무제한
- 업로드
- us
- 용법
- 사용
- 사용자
- 여러
- 사실상
- 연습
- 어느
- 동안
- 의지
- 이내
- 없이
- 작업
- 워크 플로우
- 일하는
- 쓰다
- 쓰기
- 너의
- 제퍼 넷