إذا كنت تعمل في بلد به لغات رسمية متعددة أو عبر مناطق متعددة ، يمكن أن تحتوي ملفاتك الصوتية على لغات مختلفة. قد يتحدث المشاركون لغات مختلفة تمامًا أو يمكنهم التبديل بين اللغات. ضع في اعتبارك مكالمة خدمة العملاء للإبلاغ عن مشكلة في منطقة بها عدد كبير من السكان متعددي اللغات. على الرغم من أن المحادثة يمكن أن تبدأ بلغة واحدة ، فمن الممكن أن يتغير العميل إلى لغة أخرى لوصف المشكلة ، اعتمادًا على مستوى الراحة أو تفضيلات الاستخدام مع اللغات الأخرى. على نفس المنوال ، قد ينتقل ممثل خدمة العملاء بين اللغات أثناء نقل تعليمات التشغيل أو استكشاف الأخطاء وإصلاحها.
مع ما لا يقل عن 3 ثوانٍ من الصوت ، الأمازون النسخ يمكنه تحديد النصوص تلقائيًا وإنشاؤها بكفاءة باللغات المنطوقة في الصوت دون الحاجة إلى تحديد البشر للغات. ينطبق هذا على حالات الاستخدام المختلفة مثل تحويل مكالمات العملاء أو تحويل رسائل البريد الصوتي إلى نص أو التقاط تفاعلات الاجتماع أو تتبع اتصالات منتدى المستخدم أو مراقبة إنتاج محتوى الوسائط وسير عمل الترجمة.
يستعرض هذا المنشور خطوات نسخ ملف صوتي متعدد اللغات باستخدام Amazon Transcribe. نناقش كيفية إتاحة الملفات الصوتية لـ Amazon Transcribe وتمكين نسخ الملفات الصوتية متعددة اللغات عند استدعاء Amazon Transcribe APIs.
حل نظرة عامة
Amazon Transcribe هي خدمة AWS تسهل عليك تحويل الكلام إلى نص. تعد إضافة الكلام إلى وظائف النص إلى أي تطبيق أمرًا بسيطًا بمساعدة Amazon Transcribe ، وهي خدمة التعرف التلقائي على الكلام (ASR). يمكنك استيعاب إدخال الصوت باستخدام Amazon Transcribe ، وإنشاء نصوص واضحة يسهل قراءتها ومراجعتها ، وزيادة الدقة مع التخصيص ، وتصفية المعلومات لحماية خصوصية العميل.
الحل يستخدم أيضا خدمة تخزين أمازون البسيطة (Amazon S3) ، خدمة تخزين كائنات مصممة لتخزين واسترداد أي كمية من البيانات من أي مكان. إنها خدمة تخزين بسيطة توفر المتانة والتوافر والأداء والأمان الرائدين في الصناعة وقابلية التوسع غير المحدودة تقريبًا بتكلفة منخفضة للغاية. عندما تقوم بتخزين البيانات في Amazon S3 ، فإنك تعمل مع الموارد المعروفة باسم دلاء و الأجسام. الدلو هو حاوية للأشياء. الكائن هو ملف وأي بيانات وصفية تصف الملف.
في هذا المنشور ، نوجهك عبر الخطوات التالية لتنفيذ حل نسخ صوتي متعدد اللغات:
- قم بإنشاء حاوية S3.
- تحميل ملف الصوت الخاص بك إلى دلو.
- قم بإنشاء وظيفة النسخ.
- راجع إخراج الوظيفة.
المتطلبات الأساسية المسبقة
في هذا الدليل ، يجب أن يكون لديك المتطلبات الأساسية التالية:
توفر Amazon Transcribe خيار تخزين المخرجات المكتوبة إما في حاوية S3 مُدارة بواسطة الخدمة أو بواسطة العميل. بالنسبة لهذا المنشور ، لدينا Amazon Transcribe لكتابة النتائج إلى حاوية S3 مُدارة للخدمة.
لاحظ أن Amazon Transcribe هي خدمة إقليمية وأن نقاط نهاية Amazon Transcribe API التي يتم استدعاؤها يجب أن تكون في نفس المنطقة مثل حاويات S3.
قم بإنشاء حاوية S3 لتخزين ملفات إدخال الصوت الخاصة بك
لإنشاء حاوية S3 ، أكمل الخطوات التالية:
- في وحدة تحكم Amazon S3 ، اختر إنشاء دلو.
- في حالة اسم الدلو، أدخل اسمًا فريدًا عالميًا للحاوية.
- في حالة منطقة AWS، اختر نفس المنطقة مثل نقاط نهاية Amazon Transcribe API الخاصة بك.
- اترك كل الافتراضيات كما هي.
- اختار إنشاء دلو.
قم بتحميل ملف الصوت الخاص بك إلى حاوية S3
قم بتحميل ملف الصوت متعدد اللغات إلى حاوية S3 في حساب AWS الخاص بك. لغرض هذا التمرين ، نستخدم العينة التالية ملف صوتي متعدد اللغات. إنه يلتقط مكالمة دعم العملاء التي تتضمن اللغتين الإنجليزية والإسبانية.
- في وحدة تحكم Amazon S3 ، اختر الدلاء في جزء التنقل.
- اختر الحاوية التي قمت بإنشائها مسبقًا لتخزين ملفات الصوت المدخلة.
- اختار تحميل.
- اختار إضافة ملفات.
- اختر ملف الصوت الذي تريد نسخه من جهاز الكمبيوتر المحلي الخاص بك.
- اختار تحميل.
سيكون ملفك الصوتي متاحًا قريبًا في حاوية S3.
قم بإنشاء وظيفة النسخ
مع تحميل الملف الصوتي ، نقوم الآن بإنشاء وظيفة نسخ.
- في وحدة تحكم Amazon Transcribe ، اختر وظائف النسخ في جزء التنقل.
- اختار خلق وظيفة.
- في حالة الاسم، أدخل اسمًا فريدًا للوظيفة.
سيكون هذا أيضًا اسم ملف نص الإخراج. - في حالة اعدادات اللغة، حدد تحديد تلقائي متعدد اللغات.
تمكّن هذه الميزة Amazon Transcribe من تحديد جميع اللغات المنطوقة في الملف الصوتي ونسخها تلقائيًا. - في حالة خيارات اللغة للتعرف التلقائي على اللغة، اتركه غير محدد.
يقوم Amazon Transcribe تلقائيًا بتحديد وتسجيل جميع اللغات المنطوقة في الصوت. لتحسين دقة النسخ ، يمكنك اختياريًا تحديد لغتين أو أكثر تعرف أنه تم التحدث بها في الصوت. - في حالة نوع النموذج، فقط النموذج العام الخيار متاح في وقت كتابة هذا المنشور.
- في حالة ادخال البيانات، اختر تصفح S3.
- اختر ملف مصدر الصوت الذي قمنا بتحميله مسبقًا.
- في حالة بيانات الناتج، يمكنك تحديد أي منهما حاوية S3 المُدارة بواسطة الخدمة or حدد العميل دلو S3. لهذه الوظيفة ، حدد حاوية S3 المُدارة بواسطة الخدمة.
- اختار التالى.
- اختار خلق وظيفة.
راجع إخراج الوظيفة
عند اكتمال مهمة النسخ ، افتح وظيفة النسخ.
انتقل لأسفل إلى معاينة النسخ الجزء. يتم عرض النسخ الصوتي على ملف نص التبويب. يتضمن النسخ كلا الجزأين الإنجليزية والإسبانية من المحادثة.
يمكنك اختياريًا تنزيل نسخة من النص كملف JSON ، والذي يمكنك استخدامه لمزيد من المعلومات تحليلات ما بعد المكالمة.
تنظيف
لتجنب تكبد رسوم في المستقبل ، قم بإفراغ وحذف حاوية S3 التي قمت بإنشائها لتخزين ملف مصدر صوت الإدخال. تأكد من تخزين الملفات في مكان آخر لأن هذا سيؤدي إلى إزالة جميع الكائنات الموجودة داخل الحاوية بشكل دائم. في وحدة تحكم Amazon Transcribe ، حدد وحذف الوظيفة التي تم إنشاؤها مسبقًا للنسخ.
وفي الختام
في هذا المنشور ، أنشأنا سير عمل شامل لأتمتة تحديد ونسخ ملفات الصوت متعددة اللغات ، دون كتابة أي رمز. استخدمنا الوظيفة الجديدة في Amazon Transcribe لتحديد اللغات المختلفة تلقائيًا في ملف صوتي ونسخ كل لغة بشكل صحيح.
لمزيد من المعلومات ، راجع تحديد اللغة مع وظائف النسخ الدفعي.
حول المؤلف
مورتوزا بوتوالا هو كبير مهندسي الحلول في AWS وله اهتمام بتقنيات الذكاء الاصطناعي / تعلم الآلة. إنه يستمتع بالعمل مع العملاء لمساعدتهم على تحقيق نتائج أعمالهم. خارج العمل ، يستمتع بالأنشطة في الهواء الطلق وقضاء الوقت مع العائلة.
فيكتور روجو شغوف بالذكاء الاصطناعي / تعلم الآلة وتطوير البرمجيات. ساعد في إنشاء Amazon Alexa وتشغيله في الولايات المتحدة والمكسيك. كما أنه أحضر Amazon Textract إلى شركاء AWS وأطلق AWS Contact Center Intelligence (CCI) بعيدًا. وهو حاليًا القائد التقني العالمي لشركاء الذكاء الاصطناعي للمحادثة.
بابو سرينيفاسان متخصص في AWS Sr. SA (خدمات الذكاء الاصطناعي اللغوي) ومقره شيكاغو. يركز على Amazon Transcribe (تحويل الكلام إلى نص) ، لمساعدة عملائنا على استخدام خدمات الذكاء الاصطناعي لحل مشاكل العمل. خارج العمل ، يستمتع بالأعمال الخشبية وأداء العروض السحرية.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- بلاتوبلوكشين. Web3 Metaverse Intelligence. تضخيم المعرفة. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- من نحن
- حسابي
- دقة
- التأهيل
- في
- أنشطة
- AI
- خدمات الذكاء الاصطناعي
- AI / ML
- اليكسا
- الكل
- بالرغم ان
- أمازون
- أمازون تيكستراك
- الأمازون النسخ
- كمية
- و
- آخر
- في أى مكان
- API
- واجهات برمجة التطبيقات
- تطبيق
- المنطقة
- سمعي
- أتمتة
- الآلي
- أوتوماتيك
- تلقائيا
- توفر
- متاح
- AWS
- على أساس
- لان
- يجري
- ما بين
- جلبت
- بنيت
- الأعمال
- دعوة
- تسمى
- دعوة
- دعوات
- يلتقط
- اسر
- يهمني
- الحالات
- مركز
- تغيير
- اسعارنا محددة من قبل وزارة العمل
- شيكاغو
- اختار
- واضح
- زبون
- الكود
- راحة
- مجال الاتصالات
- إكمال
- الكمبيوتر
- نظر
- كنسولات
- التواصل
- مركز الاتصال
- وعاء
- محتوى
- محادثة
- تحادثي
- محادثة منظمة العفو الدولية
- تحول
- التكلفة
- استطاع
- البلد
- خلق
- خلق
- حاليا
- زبون
- خدمة العملاء
- دعم العملاء
- العملاء
- التخصيص
- البيانات
- الافتراضات
- اعتمادا
- وصف
- التطوير التجاري
- مختلف
- بحث
- إلى أسفل
- بإمكانك تحميله
- متانة
- كل
- بكفاءة
- إما
- في مكان آخر
- تمكين
- تمكن
- النهائي إلى نهاية
- عربي
- أدخل
- تماما
- الأثير (ETH)
- ممارسة
- للعائلات
- قابليه
- الميزات
- قم بتقديم
- ملفات
- تصفية
- ويركز
- متابعيك
- المنتدى
- تبدأ من
- وظيفة
- إضافي
- مستقبل
- توليد
- دولار فقط واحصل على خصم XNUMX% على جميع
- العالمية
- على الصعيد العالمي
- أرض
- مساعدة
- ساعد
- مساعدة
- كيفية
- كيفية
- HTML
- HTTPS
- البشر
- هوية
- يحدد
- تحديد
- تنفيذ
- تحسن
- in
- يشمل
- القيمة الاسمية
- الرائدة في صناعة
- معلومات
- إدخال
- تعليمات
- رؤيتنا
- التفاعلات
- مصلحة
- IT
- وظيفة
- جسون
- علم
- معروف
- لغة
- اللغات
- زعيم
- يترك
- مستوى
- محلي
- التعريب
- منخفض
- سحر
- جعل
- يصنع
- تمكن
- الوسائط
- الاجتماع
- البيانات الوصفية
- المكسيك
- ربما
- الحد الأدنى
- مراقبة
- الأكثر من ذلك
- متعدد
- الاسم
- قائمة الإختيارات
- حاجة
- الحاجة
- جديد
- موضوع
- الأجسام
- عروض
- رسمي
- ONE
- جاكيت
- طريقة التوسع
- تعمل
- خيار
- مزيد من الخيارات
- أخرى
- في الخارج
- خبز
- المشاركون
- شركاء
- عاطفي
- أداء
- أداء
- بشكل دائم
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- سكان
- منشور
- التفضيلات
- الشروط
- سابقا
- خصوصية
- المشكلة
- مشاكل
- الإنتــاج
- حماية
- تزود
- غرض
- عرض
- اعتراف
- منطقة
- إقليمي
- المناطق
- إزالة
- تقرير
- ممثل
- الموارد
- النتائج
- مراجعة
- تشغيل
- SA
- نفسه
- التدرجية
- ثواني
- القسم
- أمن
- الخدمة
- خدمات
- قريبا
- ينبغي
- يظهر
- مماثل
- الاشارات
- تطبيقات الكمبيوتر
- تطوير البرمجيات
- حل
- الحلول
- حل
- مصدر
- الإسبانية
- تحدث
- متخصص
- محدد
- خطاب
- التعرف على الكلام
- الإنفاق
- خطوات
- تخزين
- متجر
- تخزين
- جوهري
- هذه
- الدعم
- مفاتيح
- التكنولوجيا
- التكنولوجيا
- •
- من مشاركة
- عبر
- الوقت
- إلى
- تتبع الشحنة
- النص الكامل
- انتقال
- فريد من نوعه
- غير محدود
- تم التحميل
- us
- الأستعمال
- تستخدم
- مستخدم
- مختلف
- عمليا
- تجول
- التي
- في حين
- سوف
- في غضون
- بدون
- للعمل
- سير العمل
- عامل
- اكتب
- جاري الكتابة
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت