Kui tegutsete riigis, kus on mitu ametlikku keelt või mitmes piirkonnas, võivad teie helifailid sisaldada erinevaid keeli. Osalejad võivad rääkida täiesti erinevates keeltes või vahetada keeli. Kaaluge klienditeeninduskõnet, et teatada probleemist piirkonnas, kus on palju keelt kõneleva elanikkonnaga. Kuigi vestlus võib alata ühes keeles, on võimalik, et klient võib probleemi kirjeldamiseks mõne teise keele vahetada, olenevalt mugavustasemest või kasutuseelistustest teiste keelte puhul. Sarnaselt võib klienditeeninduse esindaja kasutus- või tõrkeotsingu juhiseid edastades keelte vahel vahetada.
Vähemalt 3-sekundilise heliga, Amazoni transkribeerimine suudab automaatselt tuvastada ja luua tõhusalt transkripte helis räägitavates keeltes, ilma et inimesed peaksid keeli määrama. See kehtib erinevate kasutusjuhtude kohta, nagu kliendikõnede transkribeerimine, kõnepostisõnumite teisendamine tekstiks, koosolekute interaktsioonide jäädvustamine, kasutajate foorumi suhtluse jälgimine või meediumisisu tootmise ja lokaliseerimise töövoogude jälgimine.
See postitus tutvustab Amazon Transcribe'i abil mitmekeelse helifaili transkribeerimise samme. Arutame, kuidas muuta helifailid Amazon Transcribe'ile kättesaadavaks ja lubada mitmekeelsete helifailide transkriptsiooni, kui helistate Amazon Transcribe API-dele.
Lahenduse ülevaade
Amazon Transcribe on AWS-teenus, mis muudab kõne tekstiks teisendamise lihtsaks. Automaatse kõnetuvastusteenuse (ASR) Amazon Transcribe abil on kõne teksti funktsioonide lisamine mis tahes rakendusse lihtne. Saate Amazon Transcribe'i abil sisse võtta helisisendi, luua selgeid ärakirju, mida on lihtne lugeda ja üle vaadata, suurendada kohandamisega täpsust ja filtreerida teavet, et kaitsta kliendi privaatsust.
Lahendus kasutab ka Amazoni lihtne salvestusteenus (Amazon S3), objektide salvestusteenus, mis on loodud mis tahes hulga andmete salvestamiseks ja toomiseks kõikjalt. See on lihtne salvestusteenus, mis pakub väga madalate kuludega valdkonnas juhtivat vastupidavust, saadavust, jõudlust, turvalisust ja praktiliselt piiramatut mastaapsust. Kui salvestate andmeid Amazon S3-s, töötate ressurssidega, mida nimetatakse Ämbrid ja esemeid. Kopp on konteiner esemete jaoks. Objekt on fail ja mis tahes metaandmed, mis faili kirjeldavad.
Selles postituses juhendame teid mitme mitmekeelse heli transkriptsioonilahenduse rakendamiseks järgmiste sammudega.
- Looge S3 ämber.
- Laadige oma helifail ämbrisse üles.
- Looge transkriptsioonitöö.
- Vaadake üle töö väljund.
Eeldused
Selle ülevaate jaoks peaksid teil olema järgmised eeltingimused.
Amazon Transcribe pakub võimalust salvestada transkribeeritud väljund kas teenuse hallatavasse või kliendi hallatavasse S3 ämbrisse. Selle postituse jaoks on meil Amazon Transcribe kirjutanud tulemused teenuse hallatavasse S3 ämbrisse.
Pange tähele, et Amazon Transcribe on piirkondlik teenus ja kutsutavad Amazon Transcribe API lõpp-punktid peavad asuma samas piirkonnas kui S3 ämbrid.
Looge oma helisisendifailide salvestamiseks S3-salv
S3 ämbri loomiseks toimige järgmiselt.
- Amazon S3 konsoolil valige Loo ämber.
- eest Ämbri nimi, sisestage ämbrile globaalselt kordumatu nimi.
- eest AWS piirkond, valige sama piirkond kui teie Amazon Transcribe API lõpp-punktid.
- Jätke kõik vaikeseaded samaks.
- Vali Loo ämber.
Laadige oma helifail üles S3 ämbrisse
Laadige oma mitmekeelne helifail üles oma AWS-i konto S3 ämbrisse. Selle harjutuse jaoks kasutame järgmist näidist mitmekeelne helifail. See salvestab klienditoe kõne, mis hõlmab inglise ja hispaania keelt.
- Amazon S3 konsoolil valige Kopad navigeerimispaanil.
- Valige sisendhelifailide salvestamiseks eelnevalt loodud ämber.
- Vali Täiendava.
- Vali Lisa failid.
- Valige oma kohalikust arvutist helifail, mida soovite transkribeerida.
- Vali Täiendava.
Teie helifail on peagi saadaval S3 ämbris.
Looge transkriptsioonitöö
Kui helifail on üles laaditud, loome nüüd transkriptsioonitöö.
- Amazon Transcribe'i konsoolil valige Transkriptsioonitööd navigeerimispaanil.
- Vali Loo töökoht.
- eest Nimi, sisestage töö kordumatu nimi.
See on ka väljundi ärakirja faili nimi. - eest Keele seadedvalige Automaatne mitme keele tuvastamine.
See funktsioon võimaldab Amazon Transcribel automaatselt tuvastada ja transkribeerida kõik helifailis räägitavad keeled. - eest Keelevalikud keele automaatseks tuvastamiseks, jätke see valimata.
Amazon Transcribe tuvastab ja transkribeerib automaatselt kõik helis räägitavad keeled. Transkriptsiooni täpsuse parandamiseks saate valida kaks või enam keelt, mida helis räägiti. - eest Mudelitüüp, ainult Üldmudel valik on saadaval selle postituse kirjutamise ajal.
- eest Sisendandmed, vali Sirvige S3.
- Valige heliallika fail, mille me varem üles laadisime.
- eest Väljundandmed, saate valida kummagi Teenindusega hallatav S3 kopp or Kliendi määratud S3 kopp. Selle postituse jaoks valige Hooldusjuhitav S3 kopp.
- Vali järgmine.
- Vali Loo töökoht.
Vaadake üle töö väljund
Kui transkribeerimistöö on lõpetatud, avage transkribeerimistöö.
Liikuge alla Transkriptsiooni eelvaade osa. Heli transkriptsioon kuvatakse ekraanil Tekst sakk. Transkriptsioon sisaldab nii vestluse inglis- kui ka hispaaniakeelset osa.
Soovi korral saate alla laadida ärakirja koopia JSON-failina, mida saate edasiseks kasutamiseks kasutada kõnejärgne analüüs.
Koristage
Edaspidiste tasude vältimiseks tühjendage ja kustutage sisendheliallika faili salvestamiseks loodud S3-salv. Veenduge, et teil on failid mujal salvestatud, sest see eemaldab jäädavalt kõik ämbris olevad objektid. Valige ja kustutage konsoolil Amazon Transcribe eelnevalt transkriptsiooni jaoks loodud töö.
Järeldus
Selles postituses lõime täieliku töövoo, et automatiseerida mitmekeelsete helifailide tuvastamist ja transkriptsiooni ilma koodi kirjutamata. Kasutasime Amazon Transcribe'i uut funktsiooni, et automaatselt tuvastada helifailis erinevad keeled ja transkribeerida iga keel õigesti.
Lisateavet leiate aadressilt Keele tuvastamine paketttranskriptsiooni töödega.
Autoritest
Murtuza Bootwala on AWS-i vanemlahenduste arhitekt, kes on huvitatud AI/ML-tehnoloogiatest. Talle meeldib töötada klientidega, et aidata neil saavutada oma äritulemusi. Töövälisel ajal meeldib talle väljas tegutseda ja perega aega veeta.
Victor Red on kirglik AI/ML ja tarkvaraarenduse vastu. Ta aitas Amazon Alexa USA-s ja Mehhikos tööle panna. Samuti tõi ta Amazon Textracti AWS Partnersile ja tõi AWS Contact Center Intelligence (CCI) käima. Praegu on ta vestluslike tehisintellekti partnerite ülemaailmne tehniline juht.
Babu Srinivasan on Chicagos asuv AWS Sr. Specialist SA (Language AI Services). Ta keskendub Amazon Transcribe'ile (kõnest tekstiks), aidates meie klientidel kasutada tehisintellekti teenuseid äriprobleemide lahendamiseks. Töövälisel ajal meeldib talle puutöö ja mustkunstietenduste esitamine.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- MEIST
- konto
- täpsus
- Saavutada
- üle
- tegevus
- AI
- AI teenused
- AI / ML
- Alexa
- Materjal: BPA ja flataatide vaba plastik
- Kuigi
- Amazon
- Amazoni tekst
- Amazoni transkribeerimine
- summa
- ja
- Teine
- kuskil
- API
- API-liidesed
- taotlus
- PIIRKOND
- heli-
- automatiseerima
- Automatiseeritud
- Automaatne
- automaatselt
- kättesaadavus
- saadaval
- AWS
- põhineb
- sest
- on
- vahel
- tõi kaasa
- ehitatud
- äri
- helistama
- kutsutud
- kutsudes
- Kutsub
- lööb
- Püüdmine
- mis
- juhtudel
- keskus
- muutma
- koormuste
- chicago
- Vali
- selge
- klient
- kood
- mugavus
- Side
- täitma
- arvuti
- Arvestama
- konsool
- kontakt
- kõnekeskus
- Konteiner
- sisu
- Vestlus
- jutukas
- jutukas AI
- muutma
- Maksma
- võiks
- riik
- looma
- loodud
- Praegu
- klient
- Kasutajatugi
- Klienditugi
- Kliendid
- kohandamine
- andmed
- vaikimisi
- Olenevalt
- kirjeldama
- & Tarkvaraarendus
- erinev
- arutama
- alla
- lae alla
- vastupidavus
- iga
- tõhusalt
- kumbki
- mujal
- võimaldama
- võimaldab
- Lõpuks-lõpuni
- Inglise
- sisene
- täielikult
- Eeter (ETH)
- Teostama
- pere
- teostatav
- tunnusjoon
- fail
- Faile
- filtreerida
- keskendub
- Järel
- foorumid
- Alates
- funktsionaalsus
- edasi
- tulevik
- tekitama
- saama
- Globaalne
- Ülemaailmselt
- Maa
- aitama
- aitas
- aidates
- Kuidas
- Kuidas
- HTML
- HTTPS
- Inimestel
- Identifitseerimine
- identifitseerib
- identifitseerima
- rakendada
- parandama
- in
- hõlmab
- Suurendama
- juhtivad
- info
- sisend
- juhised
- Intelligentsus
- interaktsioonid
- huvi
- IT
- töö
- Json
- Teadma
- teatud
- keel
- Keeled
- juht
- Lahkuma
- Tase
- kohalik
- lokaliseerimine
- Madal
- maagiline
- tegema
- TEEB
- juhitud
- Meedia
- koosolekul
- Metaandmed
- Mehhiko
- võib
- miinimum
- järelevalve
- rohkem
- mitmekordne
- nimi
- NAVIGATSIOON
- Vajadus
- vajav
- Uus
- objekt
- esemeid
- Pakkumised
- ametlik
- ONE
- avatud
- töötama
- tegutsevad
- valik
- Valikud
- Muu
- väljaspool
- pane
- osalejad
- partnerid
- kirglik
- jõudlus
- esitades
- püsivalt
- Platon
- Platoni andmete intelligentsus
- PlatoData
- rahvastik
- post
- eelistusi
- eeldused
- varem
- privaatsus
- Probleem
- probleeme
- Produktsioon
- kaitsma
- anda
- eesmärk
- Lugenud
- tunnustamine
- piirkond
- piirkondlik
- piirkondades
- kõrvaldama
- aru
- esindaja
- Vahendid
- Tulemused
- läbi
- jooksmine
- SA
- sama
- Skaalautuvus
- sekundit
- Osa
- turvalisus
- teenus
- Teenused
- Varsti
- peaks
- Näitused
- sarnane
- lihtne
- tarkvara
- tarkvaraarenduse
- lahendus
- Lahendused
- LAHENDAGE
- allikas
- hispaania
- rääkimine
- spetsialist
- määratletud
- kõne
- Kõnetuvastus
- Kulutused
- Sammud
- ladustamine
- salvestada
- ladustatud
- mahukas
- selline
- toetama
- Lüliti
- tech
- Tehnoloogiad
- .
- oma
- Läbi
- aeg
- et
- Jälgimine
- Ümberkirjutus
- üleminek
- ainulaadne
- piiramatu
- laetud
- us
- Kasutus
- kasutama
- Kasutaja
- eri
- praktiliselt
- läbikäiguks
- mis
- kuigi
- will
- jooksul
- ilma
- Töö
- Töövoogud
- töö
- kirjutama
- kirjutamine
- Sinu
- sephyrnet