Ha több hivatalos nyelvet használó országban vagy több régióban működik, a hangfájlok különböző nyelveket tartalmazhatnak. Előfordulhat, hogy a résztvevők teljesen különböző nyelveket beszélnek, vagy válthatnak a nyelvek között. Fontolja meg egy ügyfélszolgálati felhívást, hogy jelentse a problémát egy olyan területen, ahol jelentős a többnyelvű lakosság. Bár a beszélgetés kezdődhet egy nyelven, elképzelhető, hogy az ügyfél egy másik nyelvre vált, hogy leírja a problémát, a kényelmi szinttől vagy a más nyelvek használati preferenciáitól függően. Hasonló módon az ügyfélszolgálati képviselő válthat a nyelvek között, miközben kezelési vagy hibaelhárítási utasításokat ad át.
Minimum 3 másodperces hanggal, Amazon átirat képes automatikusan azonosítani és hatékonyan létrehozni az átiratokat a hangban beszélt nyelveken anélkül, hogy embereknek kellene megadniuk a nyelveket. Ez vonatkozik a különféle használati esetekre, mint például az ügyfélhívások átírására, a hangpostaüzenetek szöveggé alakítására, az értekezletek interakcióinak rögzítésére, a felhasználói fórumok kommunikációjának nyomon követésére vagy a médiatartalom-előállítási és lokalizációs munkafolyamatok figyelésére.
Ez a bejegyzés végigvezeti a többnyelvű hangfájl Amazon Transcribe segítségével történő átírásának lépéseit. Megbeszéljük, hogyan lehet audiofájlokat elérhetővé tenni az Amazon Transcribe számára, és hogyan lehet engedélyezni a többnyelvű hangfájlok átírását az Amazon Transcribe API-k hívásakor.
Megoldás áttekintése
Az Amazon Transcribe egy AWS-szolgáltatás, amely megkönnyíti a beszéd szöveggé alakítását. Az Amazon Transcribe, egy automatizált beszédfelismerő (ASR) szolgáltatás segítségével bármely alkalmazáshoz egyszerűen hozzá lehet adni beszédet a szöveghez. Az Amazon Transcribe segítségével beillesztheti a hangbevitelt, könnyen olvasható és áttekinthető átiratokat készíthet, a testreszabással növelheti a pontosságot, és szűrheti az információkat az ügyfelek adatainak védelme érdekében.
A megoldás is használ Amazon egyszerű tárolási szolgáltatás (Amazon S3), egy objektumtároló szolgáltatás, amely bárhonnan tetszőleges mennyiségű adat tárolására és lekérésére készült. Ez egy egyszerű tárolási szolgáltatás, amely iparágvezető tartósságot, rendelkezésre állást, teljesítményt, biztonságot és gyakorlatilag korlátlan méretezhetőséget kínál nagyon alacsony költségek mellett. Amikor adatokat tárol az Amazon S3-ban, az úgynevezett erőforrásokkal dolgozik kanalak és a objektumok. A vödör tárgyak tárolására szolgáló tároló. Az objektum egy fájl és bármely metaadat, amely leírja a fájlt.
Ebben a bejegyzésben a következő lépéseken mutatjuk be a többnyelvű hangátírási megoldás megvalósítását:
- Hozzon létre egy S3 vödröt.
- Töltse fel a hangfájlt a vödörbe.
- Hozza létre az átírási feladatot.
- Tekintse át a munka kimenetét.
Előfeltételek
Ehhez az áttekintéshez a következő előfeltételekkel kell rendelkeznie:
Az Amazon Transcribe lehetőséget biztosít az átírt kimenet tárolására a szolgáltatás által kezelt vagy az ügyfél által kezelt S3 tárolóban. Ennél a bejegyzésnél az Amazon Transcribe megírja az eredményeket egy szolgáltatás által kezelt S3 tárolóba.
Vegye figyelembe, hogy az Amazon Transcribe egy regionális szolgáltatás, és a meghívott Amazon Transcribe API-végpontoknak ugyanabban a régióban kell lenniük, mint az S3-csoportoknak.
Hozzon létre egy S3 tárolót az audio bemeneti fájlok tárolásához
Az S3 vödör létrehozásához hajtsa végre a következő lépéseket:
- Az Amazon S3 konzolon válassza a lehetőséget Vödör létrehozása.
- A Vödör neve, adjon meg egy globálisan egyedi nevet a tárolónak.
- A AWS régió, válassza ki ugyanazt a Régiót, mint az Amazon Transcribe API-végpontjai.
- Hagyja meg az összes alapértelmezett értéket.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Vödör létrehozása.
Töltse fel hangfájlját az S3 vödörbe
Töltse fel többnyelvű hangfájlját AWS-fiókja S3 tárolójába. Ennek a gyakorlatnak a céljára a következő mintát használjuk többnyelvű hangfájl. Rögzíti az ügyfélszolgálati hívást angol és spanyol nyelven.
- Az Amazon S3 konzolon válassza a lehetőséget Kanalak a navigációs ablaktáblában.
- Válassza ki a korábban létrehozott tárolót a bemeneti hangfájlok tárolására.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Feltöltés.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Fájlok hozzáadása.
- Válassza ki az átírni kívánt hangfájlt a helyi számítógépéről.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Feltöltés.
Hangfájlja hamarosan elérhető lesz az S3 tárolóban.
Hozza létre az átírási feladatot
A feltöltött hangfájllal most létrehozunk egy átírási feladatot.
- Az Amazon Transcribe konzolon válassza a lehetőséget Átírási munkák a navigációs ablaktáblában.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Állás létrehozása.
- A Név, adjon meg egy egyedi nevet a munkának.
Ez lesz a kimeneti átiratfájl neve is. - A Nyelvi beállításokválassza Automatikus többnyelvű azonosítás.
Ez a funkció lehetővé teszi az Amazon Transcribe számára, hogy automatikusan azonosítsa és átírja az audiofájlban beszélt összes nyelvet. - A Nyelvi lehetőségek az automatikus nyelvazonosításhoz, hagyja kijelöletlenül.
Az Amazon Transcribe automatikusan azonosítja és átírja a hanganyagban beszélt összes nyelvet. Az átírás pontosságának javítása érdekében opcionálisan kiválaszthat két vagy több nyelvet, amelyekről tudja, hogy a hanganyagban beszéltek. - A Modelltípus, csak a Általános modell opció elérhető a bejegyzés írásakor.
- A Beviteli adat, választ Böngésszen az S3-ban.
- Válassza ki a korábban feltöltött hangforrásfájlt.
- A Kimeneti adatok, kiválaszthatja bármelyiket Szerviz által kezelt S3 vödör or A vevő által megadott S3 vödör. Ehhez a bejegyzéshez válassza a lehetőséget Szerviz által kezelt S3 vödör.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Állás létrehozása.
Tekintse át a munka kimenetét
Amikor az átírási feladat befejeződött, nyissa meg az átírási feladatot.
Görgessen le a gombbal Átírás előnézete szakasz. A hang átirata megjelenik a szöveg lapon. Az átirat tartalmazza a beszélgetés angol és spanyol részét is.
Opcionálisan letöltheti az átirat másolatát JSON-fájlként, amelyet további célokra használhat fel hívás utáni elemzés.
Tisztítsuk meg
A jövőbeni költségek elkerülése érdekében ürítse ki és törölje a bemeneti hangforrásfájl tárolására létrehozott S3 tárolót. Győződjön meg arról, hogy a fájlokat máshol tárolja, mert ezzel véglegesen eltávolítja a vödörben lévő összes objektumot. Az Amazon Transcribe konzolon válassza ki és törölje az átíráshoz korábban létrehozott feladatot.
Következtetés
Ebben a bejegyzésben egy teljes körű munkafolyamatot hoztunk létre a többnyelvű hangfájlok azonosításának és átírásának automatizálására kód írása nélkül. Az Amazon Transcribe új funkcióját használtuk, hogy automatikusan azonosítsuk a különböző nyelveket egy hangfájlban, és helyesen írjuk át az egyes nyelveket.
További információ: Nyelv azonosítás kötegelt átírási feladatokkal.
A szerzőkről
Murtuza Bootwala az AWS vezető megoldástervezője, aki az AI/ML technológiák iránt érdeklődik. Szívesen dolgozik az ügyfelekkel, hogy segítse őket üzleti eredményeik elérésében. A munkán kívül szeret szabadtéri tevékenységeket és a családdal eltöltött időt.
Victor Red szenvedélyes az AI/ML és a szoftverfejlesztés. Segített elindítani az Amazon Alexát az Egyesült Államokban és Mexikóban. Az Amazon Textractot az AWS Partnershez is eljuttatta, és elindította az AWS Contact Center Intelligence (CCI) szolgáltatást. Jelenleg a társalgási AI-partnerek globális technológiai vezetője.
Babu Srinivasan egy chicagói székhelyű AWS Sr. Specialist SA (Language AI Services). Az Amazon Transcribe-ra (beszédből szöveggé) összpontosít, és segít ügyfeleinknek az AI-szolgáltatások használatában az üzleti problémák megoldásában. A munkán kívül szeret famegmunkálni és bűvészműsorokat ad elő.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- Platoblockchain. Web3 metaverzum intelligencia. Felerősített tudás. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- Rólunk
- Fiók
- pontosság
- Elérése
- át
- tevékenységek
- AI
- AI szolgáltatások
- AI / ML
- Alexa
- Minden termék
- Bár
- amazon
- Amazon szöveg
- Amazon átirat
- összeg
- és a
- Másik
- bárhol
- api
- API-k
- Alkalmazás
- TERÜLET
- hang-
- automatizált
- Automatizált
- Automatikus
- automatikusan
- elérhetőség
- elérhető
- AWS
- alapján
- mert
- hogy
- között
- hozott
- épült
- üzleti
- hívás
- hívott
- hívás
- kéri
- fogások
- Rögzítése
- ami
- esetek
- Központ
- változik
- díjak
- Chicago
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- világos
- vásárló
- kód
- kényelem
- távközlés
- teljes
- számítógép
- Fontolja
- Konzol
- kapcsolat
- kapcsolatközpont
- Konténer
- tartalom
- Beszélgetés
- társalgó
- társalgási AI
- megtérít
- Költség
- tudott
- ország
- teremt
- készítette
- Jelenleg
- vevő
- Vevőszolgálat
- Vevőszolgálat
- Ügyfelek
- testreszabás
- dátum
- alapértelmezett
- attól
- leírni
- Fejlesztés
- különböző
- megvitatni
- le-
- letöltés
- tartósság
- minden
- eredményesen
- bármelyik
- máshol
- lehetővé
- lehetővé teszi
- végtől végig
- Angol
- belép
- teljesen
- Eter (ETH)
- Gyakorol
- család
- megvalósítható
- Funkció
- filé
- Fájlok
- szűrő
- koncentrál
- következő
- Fórum
- ból ből
- funkcionalitás
- további
- jövő
- generál
- kap
- Globális
- globálisan
- Földi
- segít
- segített
- segít
- Hogyan
- How To
- HTML
- HTTPS
- Az emberek
- Azonosítás
- azonosítja
- azonosítani
- végre
- javul
- in
- magában foglalja a
- Növelje
- iparágvezető
- információ
- bemenet
- utasítás
- Intelligencia
- kölcsönhatások
- kamat
- IT
- Munka
- json
- Ismer
- ismert
- nyelv
- Nyelvek
- vezető
- Szabadság
- szint
- helyi
- Honosítás
- Elő/Utó
- mágia
- csinál
- KÉSZÍT
- sikerült
- Média
- találkozó
- Metaadatok
- Mexikó
- esetleg
- minimum
- ellenőrzés
- több
- többszörös
- név
- Navigáció
- Szükség
- igénylő
- Új
- tárgy
- objektumok
- Ajánlatok
- hivatalos
- ONE
- nyitva
- működik
- üzemeltetési
- opció
- Opciók
- Más
- kívül
- üvegtábla
- résztvevők
- partnerek
- szenvedélyes
- teljesítmény
- előadó
- tartósan
- Plató
- Platón adatintelligencia
- PlatoData
- népesség
- állás
- preferenciák
- előfeltételek
- korábban
- magánélet
- Probléma
- problémák
- Termelés
- védelme
- ad
- cél
- Olvass
- elismerés
- vidék
- regionális
- régiók
- eltávolítása
- jelentést
- reprezentatív
- Tudástár
- Eredmények
- Kritika
- futás
- SA
- azonos
- skálázhatóság
- másodperc
- Rész
- biztonság
- szolgáltatás
- Szolgáltatások
- Hamarosan
- kellene
- Műsorok
- hasonló
- Egyszerű
- szoftver
- szoftverfejlesztés
- megoldások
- Megoldások
- SOLVE
- forrás
- spanyol
- beszélő
- szakember
- meghatározott
- beszéd
- Speech Recognition
- Költési
- Lépései
- tárolás
- tárolni
- memorizált
- lényeges
- ilyen
- támogatás
- kapcsoló
- tech
- Technologies
- A
- azok
- Keresztül
- idő
- nak nek
- Csomagkövetés
- Másolat
- átmenet
- egyedi
- korlátlan
- feltöltve
- us
- Használat
- használ
- használó
- különféle
- gyakorlatilag
- végigjátszás
- ami
- míg
- lesz
- belül
- nélkül
- Munka
- munkafolyamatok
- dolgozó
- ír
- írás
- A te
- zephyrnet