หากคุณทำงานในประเทศที่มีภาษาทางการหลายภาษาหรือในหลายภูมิภาค ไฟล์เสียงของคุณอาจมีภาษาต่างๆ ผู้เข้าร่วมอาจพูดภาษาที่แตกต่างกันโดยสิ้นเชิงหรืออาจสลับไปมาระหว่างภาษาต่างๆ พิจารณาการโทรติดต่อฝ่ายบริการลูกค้าเพื่อรายงานปัญหาในพื้นที่ที่มีประชากรหลายภาษาจำนวนมาก แม้ว่าการสนทนาจะเริ่มต้นในภาษาเดียว แต่ก็มีความเป็นไปได้ที่ลูกค้าจะเปลี่ยนเป็นภาษาอื่นเพื่ออธิบายปัญหา ทั้งนี้ขึ้นอยู่กับระดับความสะดวกสบายหรือการตั้งค่าการใช้งานกับภาษาอื่น ในทำนองเดียวกัน ตัวแทนฝ่ายดูแลลูกค้าอาจเปลี่ยนระหว่างภาษาต่างๆ ในขณะที่ถ่ายทอดคำแนะนำในการใช้งานหรือการแก้ไขปัญหา
ด้วยเสียงอย่างน้อย 3 วินาที ถอดความจากอเมซอน สามารถระบุและสร้างการถอดเสียงโดยอัตโนมัติอย่างมีประสิทธิภาพในภาษาที่พูดในเสียง โดยไม่จำเป็นต้องให้มนุษย์ระบุภาษา สิ่งนี้นำไปใช้กับกรณีการใช้งานต่างๆ เช่น การถอดเสียงการโทรของลูกค้า การแปลงข้อความเสียงเป็นข้อความ การจับภาพการโต้ตอบในการประชุม การติดตามการสื่อสารในฟอรัมของผู้ใช้ หรือการตรวจสอบการผลิตเนื้อหาสื่อและเวิร์กโฟลว์การแปลเป็นภาษาท้องถิ่น
โพสต์นี้จะแนะนำขั้นตอนสำหรับการถอดเสียงไฟล์เสียงหลายภาษาโดยใช้ Amazon Transcribe เราจะหารือเกี่ยวกับวิธีทำให้ไฟล์เสียงพร้อมใช้งานสำหรับ Amazon Transcribe และเปิดใช้งานการถอดเสียงของไฟล์เสียงหลายภาษาเมื่อเรียกใช้ Amazon Transcribe API
ภาพรวมโซลูชัน
Amazon Transcribe เป็นบริการของ AWS ที่ช่วยให้คุณแปลงคำพูดเป็นข้อความได้ง่าย การเพิ่มฟังก์ชันเสียงพูดเป็นข้อความในแอปพลิเคชันใดๆ นั้นง่ายดายด้วยความช่วยเหลือของ Amazon Transcribe ซึ่งเป็นบริการการรู้จำเสียงพูดอัตโนมัติ (ASR) คุณสามารถรับอินพุตเสียงโดยใช้ Amazon Transcribe สร้างการถอดเสียงที่ชัดเจนซึ่งอ่านและตรวจสอบได้ง่าย เพิ่มความแม่นยำด้วยการปรับแต่ง และกรองข้อมูลเพื่อปกป้องความเป็นส่วนตัวของลูกค้า
สารละลายยังใช้ บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) บริการจัดเก็บวัตถุที่สร้างขึ้นเพื่อจัดเก็บและดึงข้อมูลจำนวนเท่าใดก็ได้จากทุกที่ เป็นบริการจัดเก็บข้อมูลที่เรียบง่ายซึ่งนำเสนอความทนทาน ความพร้อมใช้งาน ประสิทธิภาพ ความปลอดภัย และความสามารถในการปรับขนาดได้ไม่จำกัดในระดับชั้นนำของอุตสาหกรรมด้วยต้นทุนที่ต่ำมาก เมื่อคุณจัดเก็บข้อมูลใน Amazon S3 คุณจะทำงานกับทรัพยากรที่เรียกว่า บุ้งกี๋ และ วัตถุ. บัคเก็ตคือคอนเทนเนอร์สำหรับวัตถุ วัตถุคือไฟล์และข้อมูลเมตาใดๆ ที่อธิบายถึงไฟล์
ในโพสต์นี้ เราจะแนะนำคุณเกี่ยวกับขั้นตอนต่อไปนี้เพื่อใช้โซลูชันการถอดเสียงหลายภาษา:
- สร้างบัคเก็ต S3
- อัปโหลดไฟล์เสียงของคุณไปที่บัคเก็ต
- สร้างงานถอดความ
- ตรวจสอบผลลัพธ์ของงาน
เบื้องต้น
สำหรับคำแนะนำนี้ คุณควรมีข้อกำหนดเบื้องต้นต่อไปนี้:
Amazon Transcribe มีตัวเลือกในการจัดเก็บเอาต์พุตที่ถอดเสียงไว้ในบัคเก็ต S3 ที่จัดการโดยบริการหรือที่จัดการโดยลูกค้า สำหรับโพสต์นี้ เรามี Amazon Transcribe เขียนผลลัพธ์ไปยังบัคเก็ต S3 ที่จัดการโดยบริการ
โปรดทราบว่า Amazon Transcribe เป็นบริการระดับภูมิภาคและตำแหน่งข้อมูล Amazon Transcribe API ที่ถูกเรียกใช้ต้องอยู่ในภูมิภาคเดียวกับบัคเก็ต S3
สร้างบัคเก็ต S3 เพื่อจัดเก็บไฟล์อินพุตเสียงของคุณ
หากต้องการสร้างบัคเก็ต S3 ให้ทำตามขั้นตอนต่อไปนี้:
- บนคอนโซล Amazon S3 ให้เลือก สร้างที่เก็บข้อมูล.
- สำหรับ ชื่อถังป้อนชื่อเฉพาะส่วนกลางสำหรับบัคเก็ต
- สำหรับ ภูมิภาค AWSเลือกภูมิภาคเดียวกับตำแหน่งข้อมูล Amazon Transcribe API ของคุณ
- ปล่อยค่าเริ่มต้นทั้งหมดตามที่เป็นอยู่
- Choose สร้างที่เก็บข้อมูล.
อัปโหลดไฟล์เสียงของคุณไปยังบัคเก็ต S3
อัปโหลดไฟล์เสียงหลายภาษาไปยังบัคเก็ต S3 ในบัญชี AWS ของคุณ สำหรับจุดประสงค์ของแบบฝึกหัดนี้ เราใช้ตัวอย่างต่อไปนี้ ไฟล์เสียงหลายภาษา. โดยจะจับสายสนับสนุนลูกค้าที่เกี่ยวข้องกับภาษาอังกฤษและสเปน.
- บนคอนโซล Amazon S3 ให้เลือก บุ้งกี๋ ในบานหน้าต่างนำทาง
- เลือกที่เก็บข้อมูลที่คุณสร้างไว้ก่อนหน้านี้เพื่อจัดเก็บไฟล์เสียงอินพุต
- Choose อัพโหลด.
- Choose เพิ่มไฟล์.
- เลือกไฟล์เสียงที่คุณต้องการคัดลอกจากเครื่องคอมพิวเตอร์ของคุณ
- Choose อัพโหลด.
ไฟล์เสียงของคุณจะพร้อมใช้งานในบัคเก็ต S3 ในไม่ช้า
สร้างงานถอดความ
เมื่ออัปโหลดไฟล์เสียงแล้ว ตอนนี้เราสร้างงานการถอดความ
- บนคอนโซล Amazon Transcribe ให้เลือก งานถอดความ ในบานหน้าต่างนำทาง
- Choose สร้างงาน.
- สำหรับ Nameป้อนชื่อเฉพาะสำหรับงาน
นี่จะเป็นชื่อของไฟล์การถอดเสียงเอาต์พุตด้วย - สำหรับ ตั้งค่าภาษาให้เลือก การระบุหลายภาษาโดยอัตโนมัติ.
คุณลักษณะนี้ทำให้ Amazon Transcribe สามารถระบุและถอดเสียงทุกภาษาที่พูดในไฟล์เสียงได้โดยอัตโนมัติ - สำหรับ ตัวเลือกภาษาสำหรับการระบุภาษาอัตโนมัติให้ปล่อยไว้โดยไม่เลือก
Amazon Transcribe จะระบุและถอดเสียงทุกภาษาที่พูดในเสียงโดยอัตโนมัติ เพื่อปรับปรุงความแม่นยำในการถอดเสียง คุณสามารถเลือกได้สองภาษาหรือมากกว่าที่คุณรู้ว่ามีการพูดในเสียง - สำหรับ ประเภทรุ่น, เพียง รุ่นทั่วไป ตัวเลือกสามารถใช้ได้ในขณะที่เขียนโพสต์นี้
- สำหรับ ป้อนข้อมูลเลือก เรียกดู S3.
- เลือกไฟล์ต้นฉบับเสียงที่เราอัปโหลดไว้ก่อนหน้านี้
- สำหรับ ข้อมูลเอาต์พุตคุณสามารถเลือกอย่างใดอย่างหนึ่ง บัคเก็ต S3 ที่จัดการโดยบริการ or ลูกค้าระบุที่เก็บข้อมูล S3. สำหรับโพสต์นี้ เลือก บัคเก็ต S3 ที่จัดการโดยบริการ
- Choose ถัดไป.
- Choose สร้างงาน.
ตรวจสอบผลงาน
เมื่องานถอดความเสร็จสมบูรณ์ ให้เปิดงานถอดความ
เลื่อนลงไปที่ ตัวอย่างการถอดความ ส่วน. การถอดเสียงจะแสดงบน ข้อความ แท็บ การถอดความมีทั้งส่วนที่เป็นภาษาอังกฤษและสเปนของการสนทนา
คุณสามารถเลือกดาวน์โหลดสำเนาการถอดเสียงเป็นไฟล์ JSON ซึ่งนำไปใช้เพิ่มเติมได้ การวิเคราะห์หลังการโทร.
ทำความสะอาด
เพื่อหลีกเลี่ยงค่าใช้จ่ายในอนาคต ให้ล้างข้อมูลและลบบัคเก็ต S3 ที่คุณสร้างขึ้นสำหรับจัดเก็บไฟล์ต้นฉบับเสียงอินพุต ตรวจสอบให้แน่ใจว่าคุณจัดเก็บไฟล์ไว้ที่อื่น เพราะการดำเนินการนี้จะลบวัตถุทั้งหมดที่อยู่ในบัคเก็ตอย่างถาวร ในคอนโซล Amazon Transcribe ให้เลือกและลบงานที่สร้างไว้ก่อนหน้านี้สำหรับการถอดเสียง
สรุป
ในโพสต์นี้ เราได้สร้างเวิร์กโฟลว์แบบ end-to-end เพื่อทำให้การระบุและการถอดเสียงไฟล์เสียงหลายภาษาเป็นไปโดยอัตโนมัติ โดยไม่ต้องเขียนโค้ดใดๆ เราใช้ฟังก์ชันใหม่ใน Amazon Transcribe เพื่อระบุภาษาต่างๆ ในไฟล์เสียงโดยอัตโนมัติ และถอดเสียงแต่ละภาษาได้อย่างถูกต้อง
สำหรับข้อมูลเพิ่มเติมโปรดดูที่ การระบุภาษาพร้อมงานการถอดความแบบกลุ่ม.
เกี่ยวกับผู้เขียน
มูร์ตูซา บูทวาลา เป็นสถาปนิกโซลูชันอาวุโสของ AWS ที่มีความสนใจในเทคโนโลยี AI/ML เขาสนุกกับการทำงานร่วมกับลูกค้าเพื่อช่วยให้บรรลุผลลัพธ์ทางธุรกิจ นอกเวลางาน เขาชอบทำกิจกรรมกลางแจ้งและใช้เวลากับครอบครัว
วิกเตอร์สีแดง มีความหลงใหลเกี่ยวกับ AI/ML และการพัฒนาซอฟต์แวร์ เขาช่วยให้ Amazon Alexa ใช้งานได้ในสหรัฐอเมริกาและเม็กซิโก เขายังนำ Amazon Textract มาสู่ AWS Partners และได้รับ AWS Contact Center Intelligence (CCI) อีกด้วย ปัจจุบันเขาเป็นผู้นำเทคโนโลยีระดับโลกสำหรับพันธมิตร AI แบบสนทนา
บาบู ศรีนิวาสัน เป็น AWS Sr. Specialist SA (Language AI Services) จากชิคาโก เขามุ่งเน้นไปที่ Amazon Transcribe (แปลงคำพูดเป็นข้อความ) ช่วยให้ลูกค้าของเราใช้บริการ AI เพื่อแก้ปัญหาทางธุรกิจ นอกเวลางาน เขาชอบงานไม้และการแสดงมายากล
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- เกี่ยวกับเรา
- ลงชื่อเข้าใช้
- ความถูกต้อง
- บรรลุ
- ข้าม
- กิจกรรม
- AI
- บริการ AI
- AI / ML
- Alexa
- ทั้งหมด
- แม้ว่า
- อเมซอน
- Amazon Text
- ถอดความจากอเมซอน
- จำนวน
- และ
- อื่น
- ทุกแห่ง
- API
- APIs
- การใช้งาน
- AREA
- เสียง
- โดยอัตโนมัติ
- อัตโนมัติ
- อัตโนมัติ
- อัตโนมัติ
- ความพร้อมใช้งาน
- ใช้ได้
- AWS
- ตาม
- เพราะ
- กำลัง
- ระหว่าง
- นำ
- สร้าง
- ธุรกิจ
- โทรศัพท์
- ที่เรียกว่า
- โทร
- โทร
- จับ
- จับ
- ซึ่ง
- กรณี
- ศูนย์
- เปลี่ยนแปลง
- โหลด
- ชิคาโก
- Choose
- ชัดเจน
- ไคลเอนต์
- รหัส
- ความสะดวกสบาย
- คมนาคม
- สมบูรณ์
- คอมพิวเตอร์
- พิจารณา
- ปลอบใจ
- ติดต่อเรา
- contact center
- ภาชนะ
- เนื้อหา
- การสนทนา
- การสนทนา
- AI สนทนา
- แปลง
- ราคา
- ได้
- ประเทศ
- สร้าง
- ที่สร้างขึ้น
- ขณะนี้
- ลูกค้า
- บริการลูกค้า
- Customer Support
- ลูกค้า
- การปรับแต่ง
- ข้อมูล
- ค่าเริ่มต้น
- ทั้งนี้ขึ้นอยู่กับ
- บรรยาย
- พัฒนาการ
- ต่าง
- สนทนา
- ลง
- ดาวน์โหลด
- ความทนทาน
- แต่ละ
- อย่างมีประสิทธิภาพ
- ทั้ง
- ที่อื่น ๆ
- ทำให้สามารถ
- ช่วยให้
- จบสิ้น
- ภาษาอังกฤษ
- เข้าสู่
- อย่างสิ้นเชิง
- อีเธอร์ (ETH)
- การออกกำลังกาย
- ครอบครัว
- เป็นไปได้
- ลักษณะ
- เนื้อไม่มีมัน
- ไฟล์
- กรอง
- มุ่งเน้นไปที่
- ดังต่อไปนี้
- ฟอรั่ม
- ราคาเริ่มต้นที่
- ฟังก์ชั่น
- ต่อไป
- อนาคต
- สร้าง
- ได้รับ
- เหตุการณ์ที่
- ทั่วโลก
- พื้น
- ช่วย
- ช่วย
- การช่วยเหลือ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTML
- HTTPS
- มนุษย์
- ประจำตัว
- ระบุ
- แยกแยะ
- การดำเนินการ
- ปรับปรุง
- in
- รวมถึง
- เพิ่ม
- ชั้นนำของอุตสาหกรรม
- ข้อมูล
- อินพุต
- คำแนะนำการใช้
- Intelligence
- ปฏิสัมพันธ์
- อยากเรียนรู้
- IT
- การสัมภาษณ์
- JSON
- ทราบ
- ที่รู้จักกัน
- ภาษา
- ภาษา
- ผู้นำ
- ทิ้ง
- ชั้น
- ในประเทศ
- การปรับเนื้อหาให้สอดคล้องกับท้องถิ่น
- ต่ำ
- มายากล
- ทำ
- ทำให้
- การจัดการ
- ภาพบรรยากาศ
- ที่ประชุม
- เมตาดาต้า
- เม็กซิโก
- อาจ
- ขั้นต่ำ
- การตรวจสอบ
- ข้อมูลเพิ่มเติม
- หลาย
- ชื่อ
- การเดินเรือ
- จำเป็นต้อง
- ต้อง
- ใหม่
- วัตถุ
- วัตถุ
- เสนอ
- เป็นทางการ
- ONE
- เปิด
- ทำงาน
- การดำเนินงาน
- ตัวเลือกเสริม (Option)
- Options
- อื่นๆ
- ด้านนอก
- บานหน้าต่าง
- ผู้เข้าร่วม
- พาร์ทเนอร์
- หลงใหล
- การปฏิบัติ
- ที่มีประสิทธิภาพ
- อย่างถาวร
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- ประชากร
- โพสต์
- การตั้งค่า
- ข้อกำหนดเบื้องต้น
- ก่อนหน้านี้
- ความเป็นส่วนตัว
- ปัญหา
- ปัญหาที่เกิดขึ้น
- การผลิต
- ป้องกัน
- ให้
- วัตถุประสงค์
- อ่าน
- การรับรู้
- ภูมิภาค
- ของแคว้น
- ภูมิภาค
- เอาออก
- รายงาน
- ตัวแทน
- แหล่งข้อมูล
- ผลสอบ
- ทบทวน
- วิ่ง
- SA
- เดียวกัน
- scalability
- วินาที
- Section
- ความปลอดภัย
- บริการ
- บริการ
- ในไม่ช้า
- น่า
- แสดงให้เห็นว่า
- คล้ายคลึงกัน
- ง่าย
- ซอฟต์แวร์
- การพัฒนาซอฟต์แวร์
- ทางออก
- โซลูชัน
- แก้
- แหล่ง
- สเปน
- การพูด
- ผู้เชี่ยวชาญ
- ที่ระบุไว้
- การพูด
- การรู้จำเสียง
- การใช้จ่าย
- ขั้นตอน
- การเก็บรักษา
- จัดเก็บ
- เก็บไว้
- เป็นกอบเป็นกำ
- อย่างเช่น
- สนับสนุน
- สวิตซ์
- เทคโนโลยี
- เทคโนโลยี
- พื้นที่
- ของพวกเขา
- ตลอด
- เวลา
- ไปยัง
- การติดตาม
- สำเนา
- การเปลี่ยนแปลง
- เป็นเอกลักษณ์
- ไม่ จำกัด
- อัปโหลด
- us
- การใช้
- ใช้
- ผู้ใช้งาน
- ต่างๆ
- จวน
- คำแนะนำ
- ที่
- ในขณะที่
- จะ
- ภายใน
- ไม่มี
- งาน
- ขั้นตอนการทำงาน
- การทำงาน
- เขียน
- การเขียน
- ของคุณ
- ลมทะเล