Если вы работаете в стране с несколькими официальными языками или в нескольких регионах, ваши аудиофайлы могут содержать разные языки. Участники могут говорить на совершенно разных языках или могут переключаться между языками. Рассмотрим звонок в службу поддержки клиентов, чтобы сообщить о проблеме в районе со значительным многоязычным населением. Хотя разговор может начинаться на одном языке, вполне возможно, что клиент может перейти на другой язык для описания проблемы, в зависимости от уровня комфорта или предпочтений использования других языков. Аналогичным образом представитель службы поддержки клиентов может переключаться между языками при передаче инструкций по эксплуатации или устранению неполадок.
Минимум 3 секунды звука, Amazon транскрибировать может автоматически идентифицировать и эффективно генерировать стенограммы на языках, на которых говорят в аудиозаписи, не требуя, чтобы люди указывали языки. Это относится к различным вариантам использования, таким как расшифровка звонков клиентов, преобразование голосовой почты в текст, запись взаимодействий на собраниях, отслеживание общения пользователей на форумах или мониторинг рабочих процессов производства и локализации медиаконтента.
В этом посте описаны шаги по расшифровке многоязычного аудиофайла с помощью Amazon Transcribe. Мы обсудим, как сделать аудиофайлы доступными для Amazon Transcribe и включить расшифровку многоязычных аудиофайлов при вызове API Amazon Transcribe.
Обзор решения
Amazon Transcribe — это сервис AWS, который упрощает преобразование речи в текст. Добавить функцию преобразования речи в текст в любое приложение очень просто с помощью Amazon Transcribe, службы автоматического распознавания речи (ASR). Вы можете принимать аудиовход с помощью Amazon Transcribe, создавать четкие стенограммы, которые легко читать и просматривать, повышать точность с помощью настройки и фильтровать информацию для защиты конфиденциальности клиентов.
В решении также используется Простой сервис хранения Amazon (Amazon S3), сервис хранения объектов, созданный для хранения и извлечения любого объема данных из любого места. Это простая служба хранения данных, которая предлагает лучшую в отрасли надежность, доступность, производительность, безопасность и практически неограниченную масштабируемость по очень низкой цене. Когда вы храните данные в Amazon S3, вы работаете с ресурсами, известными как ковши и объекты. Ведро — это контейнер для объектов. Объект — это файл и любые метаданные, описывающие файл.
В этом посте мы проведем вас через следующие шаги по внедрению многоязычного решения для транскрипции аудио:
- Создайте корзину S3.
- Загрузите свой аудиофайл в корзину.
- Создайте задание транскрипции.
- Просмотрите результат задания.
Предпосылки
Для этого прохождения у вас должны быть следующие предпосылки:
Amazon Transcribe предоставляет возможность хранить транскрибированные выходные данные либо в корзине S3, управляемой службой, либо в корзине S3, управляемой клиентом. Для этого сообщения Amazon Transcribe записывает результаты в корзину SXNUMX, управляемую службой.
Обратите внимание, что Amazon Transcribe является региональной службой, и вызываемые конечные точки API Amazon Transcribe должны находиться в том же регионе, что и корзины S3.
Создайте корзину S3 для хранения входных аудиофайлов.
Чтобы создать корзину S3, выполните следующие действия:
- На консоли Amazon S3 выберите Создать ведро.
- Что касается Название ковша, введите глобально уникальное имя корзины.
- Что касается AWS Регион, выберите тот же регион, что и ваши конечные точки API Amazon Transcribe.
- Оставьте все значения по умолчанию как есть.
- Выберите Создать ведро.
Загрузите свой аудиофайл в корзину S3
Загрузите свой многоязычный аудиофайл в корзину S3 в своей учетной записи AWS. Для целей этого упражнения мы используем следующий образец многоязычный аудиофайл. Он фиксирует звонок в службу поддержки на английском и испанском языках..
- На консоли Amazon S3 выберите Ведра в навигационной панели.
- Выберите корзину, которую вы создали ранее, для хранения входных аудиофайлов.
- Выберите Загрузите.
- Выберите Добавить файлы.
- Выберите аудиофайл, который вы хотите транскрибировать с вашего локального компьютера.
- Выберите Загрузите.
Ваш аудиофайл скоро будет доступен в корзине S3.
Создайте задание транскрипции
После загрузки аудиофайла мы теперь создаем задание транскрипции.
- В консоли Amazon Transcribe выберите Работа транскрипции в навигационной панели.
- Выберите Создать работу.
- Что касается Фамилия, введите уникальное имя задания.
Это также будет имя выходного файла стенограммы. - Что касается Языковые настройки, наведите на Автоматическая идентификация нескольких языков.
Эта функция позволяет Amazon Transcribe автоматически определять и расшифровывать все языки, на которых говорят в аудиофайле. - Что касается Языковые опции для автоматической идентификации языка, оставьте его невыбранным.
Amazon Transcribe автоматически идентифицирует и расшифровывает все языки, на которых звучит аудио. Чтобы повысить точность транскрипции, вы можете дополнительно выбрать два или более языков, на которых, как вы знаете, говорили в аудио. - Что касается Тип модели, только Общая модель вариант доступен на момент написания этого поста.
- Что касается Входные данные, выберите Обзор S3.
- Выберите исходный аудиофайл, который мы загрузили ранее.
- Что касается Выходные данные, вы можете выбрать либо Сегмент S3, управляемый сервисом or Указанный клиентом сегмент S3. Для этого поста выберите Сегмент S3, управляемый службой.
- Выберите Следующая.
- Выберите Создать работу.
Просмотрите результат задания
Когда задание транскрипции завершено, откройте задание транскрипции.
Прокрутите вниз до Предварительный просмотр транскрипции раздел. Аудио транскрипция отображается на Текст вкладка Транскрипция включает как английскую, так и испанскую части разговора.
При желании вы можете загрузить копию стенограммы в виде файла JSON, который вы могли бы использовать для дальнейшего аналитика после звонка.
Убирать
Чтобы избежать будущих расходов, очистите и удалите корзину S3, которую вы создали для хранения входного исходного аудиофайла. Убедитесь, что файлы хранятся в другом месте, потому что это навсегда удалит все объекты, содержащиеся в корзине. В консоли Amazon Transcribe выберите и удалите задание, ранее созданное для расшифровки.
Заключение
В этом посте мы создали сквозной рабочий процесс для автоматизации идентификации и расшифровки многоязычных аудиофайлов без написания кода. Мы использовали новую функциональность Amazon Transcribe для автоматического определения разных языков в аудиофайле и правильной расшифровки каждого языка.
Для получения дополнительной информации обратитесь к Идентификация языка с пакетными заданиями транскрипции.
Об авторах
Муртуза Бутвала является старшим архитектором решений в AWS и интересуется технологиями AI/ML. Ему нравится работать с клиентами, чтобы помочь им достичь результатов в бизнесе. Вне работы он любит активный отдых и проводит время с семьей.
Виктор Рохо увлечен AI / ML и разработкой программного обеспечения. Он помог запустить Amazon Alexa в США и Мексике. Он также представил Amazon Textract для партнеров AWS и запустил AWS Contact Center Intelligence (CCI). В настоящее время он является глобальным техническим руководителем Conversational AI Partners.
Бабу Сринивасан является AWS Sr. Specialist SA (Language AI Services) из Чикаго. Он занимается Amazon Transcribe (преобразование речи в текст), помогая нашим клиентам использовать услуги ИИ для решения бизнес-задач. Вне работы он любит работать с деревом и устраивать магические шоу.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- О нас
- Учетная запись
- точность
- Достигать
- через
- активно
- AI
- Услуги искусственного интеллекта
- AI / ML
- Alexa
- Все
- Несмотря на то, что
- Amazon
- Амазонка Текст
- Amazon транскрибировать
- количество
- и
- Другой
- откуда угодно
- API
- API
- Применение
- ПЛОЩАДЬ
- аудио
- автоматизировать
- Автоматизированный
- Автоматический
- автоматически
- свободных мест
- доступен
- AWS
- основанный
- , так как:
- не являетесь
- между
- принес
- построенный
- бизнес
- призывают
- под названием
- вызова
- Объявления
- перехватывает
- Захват
- заботится
- случаев
- Центр
- изменение
- расходы
- Чикаго
- Выберите
- Очистить
- клиент
- код
- комфорт
- Связь
- полный
- компьютер
- Рассматривать
- Консоли
- обращайтесь
- контакт-центр
- Container
- содержание
- Разговор
- диалоговый
- разговорный ИИ
- конвертировать
- Цена
- может
- страна
- Создайте
- создали
- В настоящее время
- клиент
- Служба поддержки игроков
- служба поддержки
- Клиенты
- настройка
- данным
- по умолчанию
- в зависимости
- описывать
- Разработка
- различный
- обсуждать
- вниз
- скачать
- долговечность
- каждый
- эффективно
- или
- в другом месте
- включить
- позволяет
- впритык
- Английский
- Enter
- полностью
- Эфир (ETH)
- Упражнение
- семья
- выполнимый
- Особенность
- Файл
- Файлы
- фильтр
- фокусируется
- после
- Форум
- от
- функциональность
- далее
- будущее
- порождать
- получить
- Глобальный
- ГЛОБАЛЬНО
- земля
- помощь
- помог
- помощь
- Как
- How To
- HTML
- HTTPS
- Людей
- Идентификация
- идентифицирует
- определения
- осуществлять
- улучшать
- in
- включает в себя
- Увеличение
- отрасли
- информация
- вход
- инструкции
- Интеллекта
- взаимодействие
- интерес
- IT
- работа
- JSON
- Знать
- известный
- язык
- Языки
- лидер
- Оставлять
- уровень
- локальным
- Локализация
- Низкий
- магия
- сделать
- ДЕЛАЕТ
- управляемого
- Медиа
- заседания
- Метаданные
- Мексика
- может быть
- минимальный
- Мониторинг
- БОЛЕЕ
- с разными
- имя
- Навигация
- Необходимость
- нуждающихся
- Новые
- объект
- объекты
- Предложения
- Официальный представитель в Грузии
- ONE
- открытый
- работать
- операционный
- Опция
- Опции
- Другие контрактные услуги
- внешнюю
- хлеб
- новыми участниками
- партнеры
- страстный
- производительность
- выполнения
- постоянно
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- население
- После
- предпочтения
- предпосылки
- предварительно
- политикой конфиденциальности.
- Проблема
- проблемам
- Производство
- для защиты
- обеспечивать
- цель
- Читать
- признание
- область
- региональный
- районы
- удаление
- отчету
- представитель
- Полезные ресурсы
- Итоги
- обзоре
- Бег
- SA
- то же
- Масштабируемость
- секунды
- Раздел
- безопасность
- обслуживание
- Услуги
- вскоре
- должен
- Шоу
- аналогичный
- просто
- Software
- разработка программного обеспечения
- Решение
- Решения
- РЕШАТЬ
- Источник
- Испанский
- Говоря
- специалист
- указанный
- речь
- Распознавание речи
- Расходы
- Шаги
- диск
- магазин
- хранить
- существенный
- такие
- поддержка
- Коммутатор
- технологии
- технологии
- Ассоциация
- их
- Через
- время
- в
- Отслеживание
- Запись
- переход
- созданного
- Неограниченный
- загружено
- us
- Применение
- использование
- Информация о пользователе
- различный
- фактически
- прохождение
- который
- в то время как
- будете
- в
- без
- Работа
- Рабочие процессы
- работает
- записывать
- письмо
- ВАШЕ
- зефирнет