Якщо ви працюєте в країні з кількома офіційними мовами або в кількох регіонах, ваші аудіофайли можуть містити різні мови. Учасники можуть розмовляти абсолютно різними мовами або перемикатися між мовами. Розгляньте можливість звернення до служби підтримки клієнтів, щоб повідомити про проблему в регіоні зі значною кількістю багатомовного населення. Незважаючи на те, що розмова може початися однією мовою, цілком можливо, що клієнт може перейти на іншу мову, щоб описати проблему, залежно від рівня комфорту або переваг використання інших мов. Подібним чином представник служби підтримки клієнтів може переходити між мовами під час передачі інструкцій з експлуатації або усунення несправностей.
Щонайменше 3 секунди аудіо, Амазонська розшифровка може автоматично ідентифікувати та ефективно генерувати стенограми мовами, якими розмовляють у аудіо, не потребуючи людей для визначення мов. Це стосується різних випадків використання, таких як розшифровка дзвінків клієнтів, перетворення голосової пошти на текст, запис взаємодії на зустрічі, відстеження спілкування користувачів на форумі або моніторинг виробництва медіаконтенту та робочих процесів локалізації.
У цьому дописі описано кроки для транскрибування багатомовного аудіофайлу за допомогою Amazon Transcribe. Ми обговорюємо, як зробити аудіофайли доступними для Amazon Transcribe і ввімкнути транскрипцію багатомовних аудіофайлів під час виклику API Amazon Transcribe.
Огляд рішення
Amazon Transcribe – це служба AWS, яка спрощує конвертацію мовлення в текст. Додати функцію перетворення мовлення в текст до будь-якої програми легко за допомогою Amazon Transcribe, служби автоматичного розпізнавання мовлення (ASR). Ви можете вводити аудіовхід за допомогою Amazon Transcribe, створювати чіткі стенограми, які легко читати та переглядати, підвищувати точність за допомогою налаштування та фільтрувати інформацію для захисту конфіденційності клієнта.
Розчин також використовує Служба простого зберігання Amazon (Amazon S3), служба зберігання об’єктів, створена для зберігання та отримання будь-якої кількості даних з будь-якого місця. Це проста служба зберігання, яка пропонує найкращі в галузі довговічність, доступність, продуктивність, безпеку та практично необмежену масштабованість за дуже низькою ціною. Коли ви зберігаєте дані в Amazon S3, ви працюєте з ресурсами, відомими як Відра та об'єкти. Відро - це контейнер для предметів. Об’єкт – це файл і будь-які метадані, які описують файл.
У цій публікації ми проведемо вас через такі кроки, щоб реалізувати багатомовне рішення транскрипції аудіо:
- Створіть відро S3.
- Завантажте аудіофайл у відро.
- Створіть завдання транскрипції.
- Перегляньте результат роботи.
Передумови
Для цього покрокового керівництва ви повинні мати такі передумови:
Amazon Transcribe надає можливість зберігати транскрибований вихід у сегменті S3, керованому службою або клієнтом. У цьому дописі ми маємо Amazon Transcribe записувати результати в сегмент S3, керований службою.
Зауважте, що Amazon Transcribe є регіональною службою, а викликані кінцеві точки API Amazon Transcribe мають бути в тому самому регіоні, що й сегменти S3.
Створіть відро S3 для зберігання вхідних аудіофайлів
Щоб створити сегмент S3, виконайте такі дії:
- На консолі Amazon S3 виберіть Створити відро.
- для Назва відра, введіть глобально унікальну назву для відра.
- для Регіон AWS, виберіть той самий регіон, що й ваші кінцеві точки Amazon Transcribe API.
- Залиште всі параметри за замовчуванням як є.
- Вибирати Створити відро.
Завантажте аудіофайл у відро S3
Завантажте свій багатомовний аудіофайл у сегмент S3 у своєму обліковому записі AWS. Для цілей цієї вправи ми використовуємо наступний зразок багатомовний аудіофайл. Він фіксує дзвінок служби підтримки клієнтів англійською та іспанською мовами.
- На консолі Amazon S3 виберіть Відра у навігаційній панелі.
- Виберіть раніше створене відро для зберігання вхідних аудіофайлів.
- Вибирати Завантажувати.
- Вибирати Додати файли.
- Виберіть аудіофайл, який потрібно транскрибувати, з локального комп’ютера.
- Вибирати Завантажувати.
Ваш аудіофайл незабаром буде доступний у сегменті S3.
Створіть завдання транскрипції
Після завантаження аудіофайлу ми створюємо завдання транскрипції.
- На консолі Amazon Transcribe виберіть Роботи з транскрипції у навігаційній панелі.
- Вибирати Створити роботу.
- для ІМ'Я, введіть унікальну назву для завдання.
Це також буде назва вихідного файлу стенограми. - для Налаштування мовивиберіть Автоматична ідентифікація кількох мов.
Ця функція дозволяє Amazon Transcribe автоматично визначати та транскрибувати всі мови, якими розмовляють у аудіофайлі. - для Параметри мови для автоматичної ідентифікації мови, не вибирайте.
Amazon Transcribe автоматично визначає та транскрибує всі мови, якими розмовляють у аудіо. Щоб підвищити точність транскрипції, ви можете додатково вибрати дві або більше мов, якими, як вам відомо, говорили в аудіо. - для Тип моделі, тільки Загальна модель опція доступна на момент написання цієї публікації.
- для Вхідні данівиберіть Перегляньте S3.
- Виберіть вихідний аудіофайл, який ми завантажили раніше.
- для Вихідні дані, Ви можете вибрати будь-який Сервісно-кероване відро S3 or Ковш S3 вказав клієнт. Для цієї публікації виберіть Сервісно-кероване відро S3.
- Вибирати МАЙБУТНІ.
- Вибирати Створити роботу.
Перегляньте результати роботи
Коли завдання транскрипції буде завершено, відкрийте завдання транскрипції.
Прокрутіть вниз до Попередній перегляд транскрипції розділ. Транскрипція звуку відображається на текст вкладка. Транскрипція включає англійську та іспанську частини розмови.
За бажанням ви можете завантажити копію стенограми як файл JSON, який можна використовувати для подальшого використання аналітика після виклику.
Прибирати
Щоб уникнути майбутніх витрат, очистіть і видаліть відро S3, яке ви створили для зберігання файлу джерела вхідного аудіо. Переконайтеся, що файли зберігаються деінде, оскільки це назавжди видалить усі об’єкти, що містяться у відрі. На консолі Amazon Transcribe виберіть і видаліть раніше створене завдання для транскрипції.
Висновок
У цій публікації ми створили наскрізний робочий процес для автоматизації ідентифікації та транскрипції багатомовних аудіофайлів без написання коду. Ми використали нову функцію в Amazon Transcribe, щоб автоматично визначати різні мови в аудіофайлі та правильно транскрибувати кожну мову.
Для отримання додаткової інформації зверніться до Ідентифікація мови за допомогою завдань пакетної транскрипції.
Про авторів
Муртуза Ботвала є старшим архітектором рішень в AWS, який цікавиться технологіями AI/ML. Йому подобається працювати з клієнтами, щоб допомогти їм досягти результатів у бізнесі. Поза роботою він любить активний відпочинок і проводить час із родиною.
Віктор Ред захоплюється AI/ML і розробкою програмного забезпечення. Він допоміг запустити Amazon Alexa в США та Мексиці. Він також передав Amazon Texttract до AWS Partners і запустив AWS Contact Center Intelligence (CCI). Наразі він є глобальним технічним керівником партнерів розмовного штучного інтелекту.
Бабу Шрінівасан є старшим спеціалістом AWS SA (Language AI Services) із Чикаго. Він зосереджується на Amazon Transcribe (мовлення в текст), допомагаючи нашим клієнтам використовувати послуги ШІ для вирішення бізнес-завдань. Поза роботою він захоплюється обробкою дерева та влаштовує магічні шоу.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- МЕНЮ
- рахунки
- точність
- Achieve
- через
- діяльності
- AI
- Послуги ШІ
- AI / ML
- Alexa
- ВСІ
- хоча
- Amazon
- Текст Amazon
- Амазонська розшифровка
- кількість
- та
- Інший
- де-небудь
- API
- Інтерфейси
- додаток
- ПЛОЩА
- аудіо
- автоматизувати
- Автоматизований
- автоматичний
- автоматично
- наявність
- доступний
- AWS
- заснований
- оскільки
- буття
- між
- приніс
- побудований
- бізнес
- call
- званий
- покликання
- Виклики
- захвати
- захопивши
- який
- випадків
- Центр
- зміна
- вантажі
- Чикаго
- Вибирати
- ясно
- клієнт
- код
- комфорт
- зв'язку
- повний
- комп'ютер
- Вважати
- Консоль
- контакт
- контакт-центр
- Контейнер
- зміст
- Розмова
- діалоговий
- розмовний ШІ
- конвертувати
- Коштувати
- може
- країна
- створювати
- створений
- В даний час
- клієнт
- Контакти
- підтримка клієнтів
- Клієнти
- настройка
- дані
- за замовчуванням
- Залежно
- описувати
- розробка
- різний
- обговорювати
- вниз
- скачати
- довговічність
- кожен
- продуктивно
- або
- в іншому місці
- включіть
- дозволяє
- кінець в кінець
- англійська
- Що натомість? Створіть віртуальну версію себе у
- повністю
- Ефір (ETH)
- Здійснювати
- сім'я
- реально
- особливість
- філе
- Файли
- фільтрувати
- фокусується
- після
- форум
- від
- функціональність
- далі
- майбутнє
- породжувати
- отримати
- Глобальний
- Глобально
- Земля
- допомога
- допоміг
- допомогу
- Як
- How To
- HTML
- HTTPS
- Людей
- Ідентифікація
- ідентифікує
- ідентифікувати
- здійснювати
- удосконалювати
- in
- includes
- Augmenter
- провідний в галузі
- інформація
- вхід
- інструкції
- Інтелект
- Взаємодії
- інтерес
- IT
- робота
- json
- Знати
- відомий
- мова
- мови
- лідер
- Залишати
- рівень
- місцевий
- Локалізація
- низький
- магія
- зробити
- РОБОТИ
- вдалося
- Медіа
- засідання
- метадані
- Мексика
- може бути
- мінімальний
- моніторинг
- більше
- множинний
- ім'я
- навігація
- Необхідність
- нужденних
- Нові
- об'єкт
- об'єкти
- Пропозиції
- офіційний
- ONE
- відкрити
- працювати
- операційний
- варіант
- Опції
- Інше
- поза
- pane
- Учасники
- партнери
- пристрасний
- продуктивність
- виконанні
- постійно
- plato
- Інформація про дані Платона
- PlatoData
- населення
- пошта
- переваги
- передумови
- раніше
- недоторканність приватного життя
- Проблема
- проблеми
- Production
- захист
- забезпечувати
- мета
- Читати
- визнання
- регіон
- регіональний
- райони
- видаляти
- звітом
- представник
- ресурси
- результати
- огляд
- біг
- SA
- то ж
- масштабованість
- seconds
- розділ
- безпеку
- обслуговування
- Послуги
- Незабаром
- Повинен
- Шоу
- аналогічний
- простий
- Софтвер
- розробка програмного забезпечення
- рішення
- Рішення
- ВИРІШИТИ
- Source
- іспанська
- розмова
- спеціаліст
- зазначений
- мова
- Розпізнавання мови
- Витрати
- заходи
- зберігання
- зберігати
- зберігати
- істотний
- такі
- підтримка
- перемикач
- технології
- Технології
- Команда
- їх
- через
- час
- до
- Відстеження
- Розшифровка
- перехід
- створеного
- необмежений
- завантажено
- us
- Використання
- використання
- користувач
- різний
- фактично
- покрокове керівництво
- який
- в той час як
- волі
- в
- без
- Work
- Робочі процеси
- робочий
- запис
- лист
- вашу
- зефірнет