אם אתה פועל במדינה עם מספר שפות רשמיות או על פני מספר אזורים, קובצי האודיו שלך יכולים להכיל שפות שונות. ייתכן שהמשתתפים דוברים שפות שונות לחלוטין או עשויים לעבור בין שפות. שקול להתקשר לשירות לקוחות כדי לדווח על בעיה באזור עם אוכלוסייה רב לשונית. למרות שהשיחה יכולה להתחיל בשפה אחת, ייתכן שהלקוח יחליף לשפה אחרת כדי לתאר את הבעיה, בהתאם לרמת הנוחות או העדפות השימוש בשפות אחרות. ברוח דומה, נציג שירות הלקוחות עשוי לעבור בין שפות תוך העברת הוראות הפעלה או פתרון בעיות.
עם לפחות 3 שניות של שמע, אמזון תעתיק יכול לזהות באופן אוטומטי ולייצר תמלילים בשפות המדוברות באודיו ללא צורך בבני אדם כדי לציין את השפות. זה חל על מקרי שימוש שונים כגון תמלול שיחות מלקוחות, המרת הודעות קוליות לטקסט, לכידת אינטראקציות בפגישות, מעקב אחר תקשורת בפורומים של משתמשים, או ניטור ייצור תוכן מדיה ולוקליזציה.
פוסט זה עובר על השלבים לתמלול קובץ אודיו רב שפות באמצעות Amazon Transcribe. אנו דנים כיצד להפוך קבצי אודיו לזמינים עבור Amazon Transcribe ומאפשרים תמלול של קבצי אודיו רב-לשוניים בעת קריאה לממשקי API של Amazon Transcribe.
סקירת פתרונות
Amazon Transcribe הוא שירות AWS שמקל עליך להמיר דיבור לטקסט. הוספת פונקציונליות דיבור לטקסט לכל יישום היא פשוטה בעזרת Amazon Transcribe, שירות זיהוי דיבור אוטומטי (ASR). אתה יכול להטמיע קלט אודיו באמצעות Amazon Transcribe, ליצור תמלילים ברורים שקל לקרוא ולסקור, להגביר את הדיוק עם התאמה אישית ולסנן מידע כדי להגן על פרטיות הלקוח.
הפתרון משתמש גם שירות אחסון פשוט של אמזון (Amazon S3), שירות אחסון אובייקטים שנבנה לאחסון ושליפה של כל כמות נתונים מכל מקום. זהו שירות אחסון פשוט המציע עמידות, זמינות, ביצועים, אבטחה ומדרגיות כמעט בלתי מוגבלת בעלות נמוכה מאוד. כאשר אתה מאחסן נתונים באמזון S3, אתה עובד עם משאבים הידועים בשם דליים ו אובייקטים. דלי הוא מיכל לחפצים. אובייקט הוא קובץ וכל מטא נתונים שמתארים את הקובץ.
בפוסט זה, אנו מדריכים אותך דרך השלבים הבאים ליישום פתרון תמלול אודיו רב-לשוני:
- צור דלי S3.
- העלה את קובץ השמע שלך לדלי.
- צור את עבודת התמלול.
- סקור את פלט העבודה.
תנאים מוקדמים
לפריצת דרך זו, יהיו עליכם התנאים המוקדמים הבאים:
Amazon Transcribe מספקים אפשרות לאחסן פלט מתומלל בדלי S3 מנוהל שירות או מנוהל על ידי לקוחות. עבור פוסט זה, יש לנו את Amazon Transcribe לכתוב את התוצאות ל-S3 דלי מנוהל בשירות.
שימו לב ש-Amazon Transcribe הוא שירות אזורי ונקודות הקצה של Amazon Transcribe API הנקראות צריכות להיות באותו אזור כמו דלי S3.
צור דלי S3 לאחסון קבצי קלט האודיו שלך
כדי ליצור את דלי S3 שלך, בצע את השלבים הבאים:
- במסוף S3 של אמזון בחר צור דלי.
- בעד שם הדלי, הזן שם ייחודי בכל העולם עבור הדלי.
- בעד אזור AWS, בחר באותו אזור כמו נקודות הקצה של Amazon Transcribe API שלך.
- השאר את כל ברירות המחדל כפי שהן.
- לבחור צור דלי.
העלה את קובץ השמע שלך לדלי S3
העלה את קובץ השמע הרב-לשוני שלך לדלי S3 בחשבון AWS שלך. לצורך תרגיל זה, אנו משתמשים בדוגמה הבאה קובץ שמע רב לשוני. זה לוכד שיחת תמיכת לקוחות הכוללת שפות אנגלית וספרדית.
- במסוף S3 של אמזון בחר דליים בחלונית הניווט.
- בחר את הדלי שיצרת בעבר לאחסון קבצי האודיו הקלט.
- לבחור העלה.
- לבחור הוסף קבצים.
- בחר את קובץ האודיו שברצונך לתמלל מהמחשב המקומי שלך.
- לבחור העלה.
קובץ השמע שלך יהיה זמין בקרוב בדלי S3.
צור את עבודת התמלול
עם העלאת קובץ האודיו, אנו יוצרים כעת עבודת תמלול.
- במסוף התמלול של Amazon, בחר עבודות תמלול בחלונית הניווט.
- לבחור צור עבודה.
- בעד שם, הזן שם ייחודי למשרה.
זה יהיה גם השם של קובץ תמליל הפלט. - בעד הגדרות שפה, בחר זיהוי אוטומטי של מספר שפות.
תכונה זו מאפשרת ל-Amazon Transcribe לזהות ולתמלל אוטומטית את כל השפות המדוברות בקובץ האודיו. - בעד אפשרויות שפה לזיהוי שפה אוטומטי, השאר אותו לא מסומן.
Amazon Transcribe מזהה ומתמלל אוטומטית את כל השפות המדוברות באודיו. כדי לשפר את דיוק התמלול, אתה יכול לבחור שתי שפות או יותר שאתה יודע שדיברו באודיו. - בעד סוג דגם, רק ה דגם כללי האפשרות זמינה בזמן כתיבת פוסט זה.
- בעד נתוני קלט, בחר דפדף ב- S3.
- בחר את קובץ מקור האודיו שהעלינו בעבר.
- בעד נתוני פלט, אתה יכול לבחור באחד מהם דלי S3 בניהול שירות or דלי S3 שצוין על ידי הלקוח. עבור פוסט זה, בחר דלי S3 בניהול שירות.
- לבחור הַבָּא.
- לבחור צור עבודה.
סקור את פלט העבודה
כאשר עבודת התמלול הושלמה, פתח את עבודת התמלול.
גלול מטה אל תצוגה מקדימה של תמלול סָעִיף. תמלול השמע מוצג ב- טקסט לשונית. התמלול כולל גם את החלק האנגלי וגם הספרדית של השיחה.
באפשרותך להוריד עותק של התמליל כקובץ JSON, שבו תוכל להשתמש להמשך ניתוח שלאחר שיחה.
לנקות את
כדי להימנע מחיובים עתידיים, רוקן ומחק את דלי S3 שיצרת לאחסון קובץ מקור האודיו הקלט. ודא שהקבצים מאוחסנים במקום אחר מכיוון שזה יסיר לצמיתות את כל האובייקטים הכלולים בדלי. במסוף התמלול של Amazon, בחר ומחק את העבודה שנוצרה קודם לכן עבור התמלול.
סיכום
בפוסט זה, יצרנו זרימת עבודה מקצה לקצה כדי להפוך זיהוי ותמלול אוטומטי של קבצי אודיו רב-לשוניים, מבלי לכתוב קוד כלשהו. השתמשנו בפונקציונליות החדשה ב- Amazon Transcribe כדי לזהות אוטומטית שפות שונות בקובץ שמע ולתמלל כל שפה בצורה נכונה.
למידע נוסף עיין ב זיהוי שפה עם עבודות תמלול אצווה.
על הכותבים
מורטוזה בוטוואלה הוא ארכיטקט פתרונות בכיר ב-AWS עם עניין בטכנולוגיות AI/ML. הוא נהנה לעבוד עם לקוחות כדי לעזור להם להשיג את התוצאות העסקיות שלהם. מחוץ לעבודה, הוא נהנה מפעילויות חוצות ולבלות עם המשפחה.
ויקטור רוג'ו מתלהב מ-AI/ML ופיתוח תוכנה. הוא עזר להפעיל את אמזון אלקסה בארה"ב ובמקסיקו. הוא גם הביא את Amazon Textract ל-AWS Partners והוציא את AWS Contact Center Intelligence (CCI) לדרך. כיום הוא המנהיג הטכנולוגי העולמי עבור שותפי בינה מלאכותית לשיחה.
באבו סריניוואסן הוא AWS Sr. Specialist SA (Language AI Services) שבסיסה משיקגו. הוא מתמקד ב-Amazon Transcribe (דיבור לטקסט), ועוזר ללקוחותינו להשתמש בשירותי AI כדי לפתור בעיות עסקיות. מחוץ לעבודה, הוא נהנה לעבוד בעץ ולבצע מופעי קסמים.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- Platoblockchain. Web3 Metaverse Intelligence. ידע מוגבר. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- אודות
- חֶשְׁבּוֹן
- דיוק
- להשיג
- לרוחב
- פעילויות
- AI
- שירותי AI
- AI / ML
- Alexa
- תעשיות
- למרות
- אמזון בעברית
- טקסטורה באמזון
- אמזון תעתיק
- כמות
- ו
- אחר
- בְּכָל מָקוֹם
- API
- ממשקי API
- בקשה
- AREA
- אודיו
- אוטומטי
- אוטומטי
- מכני עם סלילה אוטומטית
- באופן אוטומטי
- זמינות
- זמין
- AWS
- מבוסס
- כי
- להיות
- בֵּין
- מובא
- נבנה
- עסקים
- שיחה
- נקרא
- קוראים
- שיחות
- לוכדת
- לכידה
- אשר
- מקרים
- מרכז
- שינוי
- חיובים
- שיקגו
- לבחור
- ברור
- לקוחות
- קוד
- נוחות
- תקשורת
- להשלים
- המחשב
- לשקול
- קונסול
- צור קשר
- מוקדי שירות
- מכולה
- תוכן
- שיחה
- שיחה
- AI שיחה
- להמיר
- עלות
- יכול
- מדינה
- לִיצוֹר
- נוצר
- כיום
- לקוח
- שירות לקוחות
- שירות לקוחות
- לקוחות
- התאמה אישית
- נתונים
- מחדל
- תלוי
- לתאר
- צעצועי התפתחות
- אחר
- לדון
- מטה
- להורדה
- עמידות
- כל אחד
- יעילות
- או
- במקום אחר
- לאפשר
- מאפשר
- מקצה לקצה
- אנגלית
- זן
- לַחֲלוּטִין
- Ether (ETH)
- תרגיל
- משפחה
- אפשרי
- מאפיין
- שלח
- קבצים
- לסנן
- מתמקד
- הבא
- פוֹרוּם
- החל מ-
- פונקציונלי
- נוסף
- עתיד
- ליצור
- לקבל
- גלוֹבָּלִי
- ברחבי עולם
- קרקע
- לעזור
- עזר
- עזרה
- איך
- איך
- HTML
- HTTPS
- בני אדם
- הזדהות
- מזהה
- לזהות
- ליישם
- לשפר
- in
- כולל
- להגדיל
- מובילים בתעשייה
- מידע
- קלט
- הוראות
- מוֹדִיעִין
- יחסי גומלין
- אינטרס
- IT
- עבודה
- ג'סון
- לדעת
- ידוע
- שפה
- שפות
- מנהיג
- יציאה
- רמה
- מקומי
- לוקליזציה
- נמוך
- קסם
- לעשות
- עושה
- הצליח
- מדיה
- מפגש
- מידע נוסף
- MEXICO
- יכול
- מינימום
- ניטור
- יותר
- מספר
- שם
- ניווט
- צורך
- צורך
- חדש
- אובייקט
- אובייקטים
- המיוחדות שלנו
- רשמי
- ONE
- לפתוח
- להפעיל
- פועל
- אפשרות
- אפשרויות
- אחר
- בחוץ
- זגוגית
- המשתתפים
- שותפים
- לוהט
- ביצועים
- ביצוע
- לצמיתות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- אוכלוסייה
- הודעה
- העדפות
- תנאים מוקדמים
- קוֹדֶם
- פְּרָטִיוּת
- בעיה
- בעיות
- הפקה
- להגן
- לספק
- מטרה
- חומר עיוני
- הכרה
- באזור
- אזורי
- אזורים
- להסיר
- לדווח
- נציג
- משאבים
- תוצאות
- סקירה
- ריצה
- SA
- אותו
- בקרת מערכות ותקשורת
- שניות
- סעיף
- אבטחה
- שרות
- שירותים
- בקצרה
- צריך
- הופעות
- דומה
- פָּשׁוּט
- תוכנה
- פיתוח תוכנה
- פִּתָרוֹן
- פתרונות
- לפתור
- מָקוֹר
- ספרדי
- מדבר
- מומחה
- מפורט
- נאום
- זיהוי דיבור
- הוצאה
- צעדים
- אחסון
- חנות
- מאוחסן
- ניכר
- כזה
- תמיכה
- מתג
- טק
- טכנולוגיות
- אל האני
- שֶׁלָהֶם
- דרך
- זמן
- ל
- מעקב
- תמליל
- מַעֲבָר
- ייחודי
- בלתי מוגבל
- נטען
- us
- נוֹהָג
- להשתמש
- משתמש
- שונים
- כמעט
- בהדרכה
- אשר
- בזמן
- יצטרך
- בתוך
- לְלֹא
- תיק עבודות
- זרימות עבודה
- עובד
- לכתוב
- כתיבה
- זפירנט