Če delujete v državi z več uradnimi jeziki ali v več regijah, lahko vaše zvočne datoteke vsebujejo različne jezike. Udeleženci lahko govorijo popolnoma različne jezike ali pa preklapljajo med jeziki. Razmislite o klicu službe za pomoč strankam, da prijavite težavo na območju z veliko večjezičnega prebivalstva. Čeprav se lahko pogovor začne v enem jeziku, je možno, da se stranka spremeni v drug jezik, da opiše težavo, odvisno od ravni udobja ali preferenc uporabe drugih jezikov. Podobno lahko zastopnik za pomoč strankam med posredovanjem navodil za uporabo ali odpravljanje težav prehaja med jeziki.
Z najmanj 3 sekundami zvoka, Amazonski prepis lahko samodejno prepozna in učinkovito ustvari prepise v jezikih, ki se govorijo v zvoku, ne da bi morali ljudje določiti jezike. To velja za različne primere uporabe, kot je prepisovanje klicev strank, pretvorba glasovne pošte v besedilo, zajem interakcij na sestanku, sledenje komunikaciji uporabnikov na forumu ali spremljanje produkcije medijske vsebine in delovnih tokov lokalizacije.
Ta objava vodi skozi korake za prepis večjezične zvočne datoteke z uporabo Amazon Transcribe. Razpravljamo o tem, kako narediti zvočne datoteke na voljo storitvi Amazon Transcribe in omogočiti prepisovanje večjezičnih zvočnih datotek pri klicu API-jev Amazon Transcribe.
Pregled rešitev
Amazon Transcribe je storitev AWS, ki vam olajša pretvorbo govora v besedilo. Dodajanje funkcionalnosti govora v besedilo v katero koli aplikacijo je preprosto s pomočjo Amazon Transcribe, storitve avtomatiziranega prepoznavanja govora (ASR). Zvočni vnos lahko vnesete z uporabo storitve Amazon Transcribe, ustvarite jasne prepise, ki jih je enostavno brati in pregledati, povečate natančnost s prilagajanjem in filtrirate informacije, da zaščitite zasebnost strank.
Rešitev uporablja tudi Preprosta storitev shranjevanja Amazon (Amazon S3), storitev za shranjevanje objektov, zgrajena za shranjevanje in pridobivanje poljubne količine podatkov od koder koli. To je preprosta storitev shranjevanja, ki ponuja vodilno vzdržljivost, razpoložljivost, zmogljivost, varnost in praktično neomejeno razširljivost po zelo nizki ceni. Ko shranjujete podatke v Amazon S3, delate z viri, znanimi kot žlice in predmeti. Vedro je posoda za predmete. Objekt je datoteka in vsi metapodatki, ki opisujejo datoteko.
V tej objavi vas vodimo skozi naslednje korake za implementacijo večjezične rešitve za prepis zvoka:
- Ustvari vedro S3.
- Naložite svojo zvočno datoteko v vedro.
- Ustvarite opravilo prepisa.
- Preglejte rezultate opravila.
Predpogoji
Za ta korak morate imeti naslednje predpogoje:
Amazon Transcribe ponuja možnost shranjevanja prepisanega izhoda v vedro S3, ki ga upravlja storitev ali stranka. Za to objavo imamo Amazon Transcribe zapisati rezultate v vedro S3, ki ga upravlja storitev.
Upoštevajte, da je Amazon Transcribe regionalna storitev in da morajo biti klicane končne točke API-ja Amazon Transcribe v isti regiji kot vedra S3.
Ustvarite vedro S3 za shranjevanje zvočnih vhodnih datotek
Če želite ustvariti svoje vedro S3, dokončajte naslednje korake:
- Na konzoli Amazon S3 izberite Ustvari vedro.
- za Ime vedra, vnesite globalno edinstveno ime za vedro.
- za Regija AWS, izberite isto regijo kot vaše končne točke API-ja Amazon Transcribe.
- Vse privzete nastavitve pustite takšne, kot so.
- Izberite Ustvari vedro.
Naložite zvočno datoteko v vedro S3
Naložite svojo večjezično zvočno datoteko v vedro S3 v svojem računu AWS. Za namen te vaje uporabimo naslednji vzorec večjezična zvočna datoteka. Zajame klic podpore strankam, ki vključuje angleški in španski jezik.
- Na konzoli Amazon S3 izberite Žlice v podoknu za krmarjenje.
- Izberite vedro, ki ste ga prej ustvarili za shranjevanje vhodnih zvočnih datotek.
- Izberite Pošiljanje.
- Izberite Dodaj datoteke.
- Iz lokalnega računalnika izberite zvočno datoteko, ki jo želite prepisati.
- Izberite Pošiljanje.
Vaša zvočna datoteka bo kmalu na voljo v vedru S3.
Ustvarite opravilo prepisa
Ko je zvočna datoteka naložena, zdaj ustvarimo opravilo prepisa.
- Na konzoli Amazon Transcribe izberite Naloge za prepisovanje v podoknu za krmarjenje.
- Izberite Ustvari službo.
- za Ime, vnesite edinstveno ime za opravilo.
To bo tudi ime izhodne datoteke s prepisom. - za Jezikovne nastavitvetako, da izberete Samodejna identifikacija več jezikov.
Ta funkcija omogoča Amazon Transcribe, da samodejno prepozna in prepiše vse jezike, ki se govorijo v zvočni datoteki. - za Jezikovne možnosti za samodejno identifikacijo jezika, pustite neizbrano.
Amazon Transcribe samodejno prepozna in prepiše vse jezike, ki se govorijo v zvoku. Če želite izboljšati natančnost prepisa, lahko po želji izberete dva ali več jezikov, za katere veste, da so bili govorjeni v zvoku. - za Vrsta modela, samo Splošni model možnost je na voljo v času pisanja te objave.
- za Vhodni podatki, izberite Prebrskaj S3.
- Izberite zvočno izvorno datoteko, ki smo jo predhodno naložili.
- za Izhodni podatki, lahko izberete katero koli Storitveno upravljana žlica S3 or Stranka določi vedro S3. Za to objavo izberite Storitveno upravljana žlica S3.
- Izberite Naslednji.
- Izberite Ustvari službo.
Preglejte rezultate opravila
Ko je opravilo prepisovanja končano, odprite opravilo prepisovanja.
Pomaknite se navzdol do Predogled transkripcije razdelek. Zvočni prepis je prikazan na Besedilo zavihek. Transkripcija vključuje angleški in španski del pogovora.
Po želji lahko prenesete kopijo prepisa kot datoteko JSON, ki jo lahko uporabite za nadaljnje analitika po klicu.
Čiščenje
Da se izognete prihodnjim stroškom, izpraznite in izbrišite vedro S3, ki ste ga ustvarili za shranjevanje vhodne zvočne izvorne datoteke. Prepričajte se, da imate datoteke shranjene drugje, ker boste s tem trajno odstranili vse predmete v vedru. Na konzoli Amazon Transcribe izberite in izbrišite opravilo, ki je bilo predhodno ustvarjeno za prepis.
zaključek
V tej objavi smo ustvarili potek dela od konca do konca za avtomatizacijo identifikacije in prepisovanja večjezičnih zvočnih datotek brez pisanja kode. Uporabili smo novo funkcionalnost v storitvi Amazon Transcribe za samodejno prepoznavanje različnih jezikov v zvočni datoteki in pravilen prepis vsakega jezika.
Za več informacij glejte Identifikacija jezika z opravili paketnega prepisovanja.
O avtorjih
Murtuza Bootwala je višji arhitekt rešitev pri AWS in se zanima za tehnologije AI/ML. Uživa v delu s strankami, da bi jim pomagal doseči njihove poslovne rezultate. Izven dela se rad ukvarja z aktivnostmi na prostem in preživlja čas z družino.
Victor Red je navdušen nad AI/ML in razvojem programske opreme. Pomagal je vzpostaviti in delovati Amazon Alexa v ZDA in Mehiki. Prav tako je prinesel Amazon Texttract partnerjem AWS in zagnal AWS Contact Center Intelligence (CCI). Trenutno je globalni tehnološki vodja za pogovorne partnerje AI.
Babu Srinivasan je AWS Sr. Specialist SA (Language AI Services) s sedežem v Chicagu. Osredotoča se na Amazon Transcribe (govor v besedilo), ki našim strankam pomaga pri uporabi storitev umetne inteligence za reševanje poslovnih težav. Zunaj dela uživa v obdelavi lesa in izvajanju čarovniških predstav.
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- Platoblockchain. Web3 Metaverse Intelligence. Razširjeno znanje. Dostopite tukaj.
- vir: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- O meni
- Račun
- natančnost
- Doseči
- čez
- dejavnosti
- AI
- Storitve AI
- AI / ML
- Alexa
- vsi
- Čeprav
- Amazon
- Amazonovo besedilo
- Amazonski prepis
- znesek
- in
- Še ena
- kjerkoli
- API
- API-ji
- uporaba
- OBMOČJE
- audio
- avtomatizirati
- Avtomatizirano
- Samodejno
- samodejno
- razpoložljivost
- Na voljo
- AWS
- temeljijo
- ker
- počutje
- med
- prinesel
- zgrajena
- poslovni
- klic
- se imenuje
- kliče
- poziva
- ujame
- Zajemanje
- ki
- primeri
- center
- spremenite
- Stroški
- Chicago
- Izberite
- jasno
- stranke
- Koda
- udobje
- Communications
- dokončanje
- računalnik
- Razmislite
- Konzole
- kontakt
- kontaktni center
- Posoda
- vsebina
- Pogovor
- pogovorni
- pogovorni AI
- pretvorbo
- strošek
- bi
- država
- ustvarjajo
- ustvaril
- Trenutno
- stranka
- Za stranke
- Pomoč strankam
- Stranke, ki so
- customization
- datum
- privzeto
- Odvisno
- opisati
- Razvoj
- drugačen
- razpravlja
- navzdol
- prenesi
- trajnost
- vsak
- učinkovito
- bodisi
- drugje
- omogočajo
- omogoča
- konec koncev
- Angleščina
- Vnesite
- popolnoma
- Eter (ETH)
- Vaja
- družina
- izvedljivo
- Feature
- file
- datoteke
- filter
- Osredotoča
- po
- Forum
- iz
- funkcionalnost
- nadalje
- Prihodnost
- ustvarjajo
- dobili
- Globalno
- Globalno
- Igrišče
- pomoč
- pomagal
- pomoč
- Kako
- Kako
- HTML
- HTTPS
- Ljudje
- Identifikacija
- identificira
- identificirati
- izvajati
- izboljšanje
- in
- vključuje
- Povečajte
- vodilne
- Podatki
- vhod
- Navodila
- Intelligence
- interakcije
- obresti
- IT
- Job
- json
- Vedite
- znano
- jezik
- jeziki
- Vodja
- pustite
- Stopnja
- lokalna
- Lokalizacija
- nizka
- magic
- Znamka
- IZDELA
- upravlja
- mediji
- srečanja
- metapodatki
- Mexico
- morda
- minimalna
- spremljanje
- več
- več
- Ime
- ostalo
- Nimate
- potrebujejo
- Novo
- predmet
- predmeti
- Ponudbe
- Uradni
- ONE
- odprite
- deluje
- deluje
- Možnost
- možnosti
- Ostalo
- zunaj
- podokno
- Udeleženci
- partnerji
- strastno
- performance
- izvajati
- trajno
- platon
- Platonova podatkovna inteligenca
- PlatoData
- prebivalstvo
- Prispevek
- nastavitve
- predpogoji
- prej
- zasebnost
- problem
- Težave
- proizvodnja
- zaščito
- zagotavljajo
- Namen
- Preberi
- Priznanje
- okolica
- regionalni
- regije
- odstrani
- poročilo
- predstavnik
- viri
- Rezultati
- pregleda
- tek
- SA
- Enako
- Prilagodljivost
- sekund
- Oddelek
- varnost
- Storitev
- Storitve
- Kmalu
- shouldnt
- Razstave
- Podoben
- Enostavno
- Software
- Razvoj programske opreme
- Rešitev
- rešitve
- SOLVE
- vir
- španski
- gledano
- specialist
- določeno
- govor
- Prepoznavanje govora
- Poraba
- Koraki
- shranjevanje
- trgovina
- shranjeni
- precejšen
- taka
- podpora
- Preklop
- tech
- Tehnologije
- O
- njihove
- skozi
- čas
- do
- Sledenje
- Prepis
- Prehod
- edinstven
- neomejeno
- naložili
- us
- Uporaba
- uporaba
- uporabnik
- različnih
- praktično
- walkthrough
- ki
- medtem
- bo
- v
- brez
- delo
- delovnih tokov
- deluje
- pisati
- pisanje
- Vaša rutina za
- zefirnet