Om du verkar i ett land med flera officiella språk eller över flera regioner, kan dina ljudfiler innehålla olika språk. Deltagarna kan prata helt olika språk eller kan växla mellan språk. Överväg ett kundtjänstsamtal för att rapportera ett problem i ett område med en betydande flerspråkig befolkning. Även om konversationen kan börja på ett språk, är det möjligt att kunden byter till ett annat språk för att beskriva problemet, beroende på komfortnivå eller användningspreferenser med andra språk. På liknande sätt kan kundtjänstrepresentanten byta mellan språk samtidigt som han förmedlar drifts- eller felsökningsinstruktioner.
Med minst 3 sekunders ljud, Amazon Transcribe kan automatiskt identifiera och effektivt generera transkriptioner på de språk som talas i ljudet utan att människor behöver specificera språken. Detta gäller för olika användningsfall som att transkribera kundsamtal, konvertera röstmeddelanden till text, fånga mötesinteraktioner, spåra användarforums kommunikation eller övervaka medieinnehållsproduktion och arbetsflöden för lokalisering.
Det här inlägget går igenom stegen för att transkribera en flerspråkig ljudfil med Amazon Transcribe. Vi diskuterar hur man gör ljudfiler tillgängliga för Amazon Transcribe och möjliggör transkription av flerspråkiga ljudfiler när man anropar Amazon Transcribe API:er.
Lösningsöversikt
Amazon Transcribe är en AWS-tjänst som gör det enkelt för dig att konvertera tal till text. Det är enkelt att lägga till tal-till-text-funktionalitet i alla program med hjälp av Amazon Transcribe, en automatisk taligenkänningstjänst (ASR). Du kan mata in ljudinmatning med Amazon Transcribe, skapa tydliga transkriptioner som är lätta att läsa och granska, öka noggrannheten med anpassning och filtrera information för att skydda klienternas integritet.
Lösningen använder också Amazon enkel lagringstjänst (Amazon S3), en objektlagringstjänst byggd för att lagra och hämta vilken mängd data som helst var som helst. Det är en enkel lagringstjänst som erbjuder branschledande hållbarhet, tillgänglighet, prestanda, säkerhet och praktiskt taget obegränsad skalbarhet till mycket låg kostnad. När du lagrar data i Amazon S3 arbetar du med resurser som kallas hinkar och objekt. En hink är en behållare för föremål. Ett objekt är en fil och eventuell metadata som beskriver filen.
I det här inlägget går vi igenom följande steg för att implementera en flerspråkig ljudtranskriptionslösning:
- Skapa en S3-hink.
- Ladda upp din ljudfil till hinken.
- Skapa transkriptionsjobbet.
- Granska jobbresultatet.
Förutsättningar
För detta genomgång bör du ha följande förutsättningar:
Amazon Transcribe ger alternativet att lagra transkriberade utdata i antingen en tjänsthanterad eller kundhanterad S3-bucket. För det här inlägget har vi Amazon Transcribe att skriva resultaten till en tjänstehanterad S3-bucket.
Observera att Amazon Transcribe är en regional tjänst och Amazon Transcribe API-slutpunkterna som anropas måste vara i samma region som S3-hinkarna.
Skapa en S3-hink för att lagra dina ljudinmatningsfiler
Utför följande steg för att skapa din S3-skopa:
- Välj på Amazon S3-konsolen Skapa hink.
- För Hinkens namn, ange ett globalt unikt namn för hinken.
- För AWS-regionen, välj samma region som dina Amazon Transcribe API-slutpunkter.
- Lämna alla standardinställningar som de är.
- Välja Skapa hink.
Ladda upp din ljudfil till S3-hinken
Ladda upp din flerspråkiga ljudfil till S3-bucket i ditt AWS-konto. För syftet med denna övning använder vi följande exempel flerspråkig ljudfil. Den fångar ett kundsupportsamtal som involverar engelska och spanska språk.
- Välj på Amazon S3-konsolen Skopor i navigeringsfönstret.
- Välj den hink du skapade tidigare för att lagra ingående ljudfiler.
- Välja Ladda.
- Välja Lägg till filer.
- Välj den ljudfil du vill transkribera från din lokala dator.
- Välja Ladda.
Din ljudfil kommer inom kort att finnas tillgänglig i S3-hinken.
Skapa transkriptionsjobbet
Med ljudfilen uppladdad skapar vi nu ett transkriptionsjobb.
- På Amazon Transcribe-konsolen väljer du Transkription jobb i navigeringsfönstret.
- Välja Skapa jobb.
- För Namn , ange ett unikt namn för jobbet.
Detta kommer också att vara namnet på den utgående transkriptionsfilen. - För Språkinställningar, Välj Automatisk identifiering av flera språk.
Denna funktion gör det möjligt för Amazon Transcribe att automatiskt identifiera och transkribera alla språk som talas i ljudfilen. - För Språkalternativ för automatisk språkidentifiering, lämna det omarkerat.
Amazon Transcribe identifierar och transkriberar automatiskt alla språk som talas i ljudet. För att förbättra transkriptionsnoggrannheten kan du välja två eller flera språk som du vet talades i ljudet. - För Modell typ, bara Allmän modell alternativet är tillgängligt när du skriver detta inlägg.
- För Indataväljer Bläddra i S3.
- Välj den ljudkälla som vi laddade upp tidigare.
- För Utdatakan du välja endera Servicehanterad S3-skopa or Kundspecificerad S3 hink. För det här inlägget, välj Servicehanterad S3-skopa.
- Välja Nästa.
- Välja Skapa jobb.
Granska jobbresultatet
När transkriptionsjobbet är klart öppnar du transkriptionsjobbet.
Bläddra ner till Förhandsgranskning av transkription sektion. Ljudtranskriptionen visas på text flik. Transkriptionen inkluderar både den engelska och spanska delen av konversationen.
Du kan valfritt ladda ner en kopia av transkriptet som en JSON-fil, som du kan använda för ytterligare analyser efter samtal.
Städa upp
För att undvika framtida avgifter, töm och radera S3-hinken som du skapade för lagring av den ingående ljudkällan. Se till att du har filerna lagrade någon annanstans eftersom detta kommer att permanent ta bort alla objekt som finns i hinken. På Amazon Transcribe-konsolen, välj och ta bort jobbet som tidigare skapats för transkriptionen.
Slutsats
I det här inlägget skapade vi ett end-to-end-arbetsflöde för att automatisera identifiering och transkription av flerspråkiga ljudfiler, utan att skriva någon kod. Vi använde den nya funktionen i Amazon Transcribe för att automatiskt identifiera olika språk i en ljudfil och transkribera varje språk korrekt.
Mer information finns i Språkidentifiering med batch-transkriptionsjobb.
Om författarna
Murtuza Bootwala är Senior Solutions Architect på AWS med intresse för AI/ML-teknologier. Han tycker om att arbeta med kunder för att hjälpa dem att uppnå sina affärsresultat. Utanför jobbet tycker han om utomhusaktiviteter och umgås med familjen.
Victor Red brinner för AI/ML och mjukvaruutveckling. Han hjälpte till att få Amazon Alexa igång i USA och Mexiko. Han tog också med Amazon Textract till AWS Partners och fick AWS Contact Center Intelligence (CCI) igång. Han är för närvarande Global Tech Leader för Conversational AI Partners.
Babu Srinivasan är en AWS Sr. Specialist SA (Language AI Services) baserad i Chicago. Han fokuserar på Amazon Transcribe (tal till text), och hjälper våra kunder att använda AI-tjänster för att lösa affärsproblem. Utanför jobbet tycker han om att träbearbeta och att utföra magiska shower.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- Platoblockchain. Web3 Metaverse Intelligence. Kunskap förstärkt. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- Om oss
- Konto
- noggrannhet
- Uppnå
- tvärs
- aktiviteter
- AI
- AI-tjänster
- AI / ML
- alexa
- Alla
- Även
- amason
- amazontext
- Amazon Transcribe
- mängd
- och
- Annan
- var som helst
- api
- API: er
- Ansökan
- OMRÅDE
- audio
- automatisera
- Automatiserad
- Automat
- automatiskt
- tillgänglighet
- tillgänglig
- AWS
- baserat
- därför att
- Där vi får lov att vara utan att konstant prestera,
- mellan
- fört
- byggt
- företag
- Ring
- kallas
- anropande
- Samtal
- fångar
- Fångande
- vilken
- fall
- Centrum
- byta
- avgifter
- chicago
- Välja
- klar
- klient
- koda
- bekvämlighet
- Trygghet i vårdförloppet
- fullborda
- dator
- Tänk
- Konsol
- kontakta
- kontaktcenter
- Behållare
- innehåll
- Konversation
- konversera
- konversations AI
- konvertera
- Pris
- kunde
- land
- skapa
- skapas
- För närvarande
- kund
- Kundservice
- Helpdesk
- Kunder
- anpassning
- datum
- defaults
- beroende
- beskriva
- Utveckling
- olika
- diskutera
- ner
- ladda ner
- hållbarhet
- varje
- effektivt
- antingen
- annorstädes
- möjliggöra
- möjliggör
- början till slut
- Engelska
- ange
- helt
- Eter (ETH)
- Motionera
- familj
- möjlig
- Leverans
- Fil
- Filer
- filtrera
- fokuserar
- efter
- Forum
- från
- funktionalitet
- ytterligare
- framtida
- generera
- skaffa sig
- Välgörenhet
- Globalt
- Marken
- hjälpa
- hjälpte
- hjälpa
- Hur ser din drömresa ut
- How To
- html
- HTTPS
- Människa
- Identifiering
- identifierar
- identifiera
- genomföra
- förbättra
- in
- innefattar
- Öka
- branschledande
- informationen
- ingång
- instruktioner
- Intelligens
- interaktioner
- intresse
- IT
- Jobb
- json
- Vet
- känd
- språk
- Språk
- ledare
- Lämna
- Nivå
- lokal
- Lokalisering
- Låg
- magi
- göra
- GÖR
- förvaltade
- Media
- möte
- metadata
- Mexico
- kanske
- minsta
- övervakning
- mer
- multipel
- namn
- Navigering
- Behöver
- behöver
- Nya
- objektet
- objekt
- Erbjudanden
- tjänsteman
- ONE
- öppet
- driva
- drift
- Alternativet
- Tillbehör
- Övriga
- utanför
- panelen
- deltagare
- partner
- brinner
- prestanda
- utför
- permanent
- plato
- Platon Data Intelligence
- PlatonData
- befolkning
- Inlägg
- preferenser
- förutsättningar
- tidigare
- privatpolicy
- Problem
- problem
- Produktion
- skydda
- ge
- Syftet
- Läsa
- erkännande
- region
- regionala
- regioner
- ta bort
- rapport
- representativ
- Resurser
- Resultat
- översyn
- rinnande
- SA
- Samma
- skalbarhet
- sekunder
- §
- säkerhet
- service
- Tjänster
- Inom kort
- skall
- Visar
- liknande
- Enkelt
- Mjukvara
- mjukvaruutveckling
- lösning
- Lösningar
- LÖSA
- Källa
- spanska
- tala
- specialist
- specificerade
- tal
- Taligenkänning
- Spendera
- Steg
- förvaring
- lagra
- lagras
- väsentlig
- sådana
- stödja
- Växla
- tech
- Tekniken
- Smakämnen
- deras
- Genom
- tid
- till
- Spårning
- Avskrift
- övergång
- unika
- obegränsat
- uppladdad
- us
- Användning
- användning
- Användare
- olika
- praktiskt taget
- genomgång
- som
- medan
- kommer
- inom
- utan
- Arbete
- arbetsflöden
- arbetssätt
- skriva
- skrivning
- Din
- zephyrnet