Εάν εργάζεστε σε μια χώρα με πολλές επίσημες γλώσσες ή σε πολλές περιοχές, τα αρχεία ήχου σας μπορεί να περιέχουν διαφορετικές γλώσσες. Οι συμμετέχοντες μπορεί να μιλούν εντελώς διαφορετικές γλώσσες ή μπορεί να αλλάζουν μεταξύ τους. Σκεφτείτε μια κλήση εξυπηρέτησης πελατών για να αναφέρετε ένα πρόβλημα σε μια περιοχή με σημαντικό πολύγλωσσο πληθυσμό. Αν και η συνομιλία θα μπορούσε να ξεκινήσει σε μία γλώσσα, είναι εφικτό ο πελάτης να αλλάξει σε άλλη γλώσσα για να περιγράψει το πρόβλημα, ανάλογα με το επίπεδο άνεσης ή τις προτιμήσεις χρήσης σε άλλες γλώσσες. Με παρόμοιο τρόπο, ο εκπρόσωπος εξυπηρέτησης πελατών μπορεί να κάνει μετάβαση μεταξύ γλωσσών κατά τη μεταφορά οδηγιών λειτουργίας ή αντιμετώπισης προβλημάτων.
Με τουλάχιστον 3 δευτερόλεπτα ήχου, Μεταγραφή Amazon μπορεί να αναγνωρίσει αυτόματα και να δημιουργήσει αποτελεσματικά μεταγραφές στις γλώσσες που ομιλούνται στον ήχο χωρίς να χρειάζεται ο άνθρωπος να καθορίσει τις γλώσσες. Αυτό ισχύει για διάφορες περιπτώσεις χρήσης, όπως η μεταγραφή κλήσεων πελατών, η μετατροπή φωνητικών μηνυμάτων σε κείμενο, η καταγραφή αλληλεπιδράσεων σε συσκέψεις, η παρακολούθηση των επικοινωνιών του φόρουμ χρηστών ή η παρακολούθηση της παραγωγής περιεχομένου πολυμέσων και των ροών εργασιών τοπικής προσαρμογής.
Αυτή η ανάρτηση περιγράφει τα βήματα για τη μεταγραφή ενός πολυγλωσσικού αρχείου ήχου χρησιμοποιώντας το Amazon Transcribe. Συζητάμε πώς να διαθέσουμε αρχεία ήχου στο Amazon Transcribe και να ενεργοποιήσουμε τη μεταγραφή πολύγλωσσων αρχείων ήχου κατά την κλήση των API του Amazon Transcribe.
Επισκόπηση λύσεων
Το Amazon Transcribe είναι μια υπηρεσία AWS που σας διευκολύνει να μετατρέψετε την ομιλία σε κείμενο. Η προσθήκη λειτουργιών ομιλίας σε κείμενο σε οποιαδήποτε εφαρμογή είναι απλή με τη βοήθεια του Amazon Transcribe, μιας υπηρεσίας αυτόματης αναγνώρισης ομιλίας (ASR). Μπορείτε να εισπράξετε είσοδο ήχου χρησιμοποιώντας το Amazon Transcript, να δημιουργήσετε σαφείς μεταγραφές που είναι εύκολο να διαβαστούν και να ελεγχθούν, να αυξήσετε την ακρίβεια με την προσαρμογή και να φιλτράρετε πληροφορίες για την προστασία του απορρήτου του πελάτη.
Η λύση χρησιμοποιεί επίσης Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3), μια υπηρεσία αποθήκευσης αντικειμένων που έχει σχεδιαστεί για αποθήκευση και ανάκτηση οποιουδήποτε όγκου δεδομένων από οπουδήποτε. Είναι μια απλή υπηρεσία αποθήκευσης που προσφέρει κορυφαία στον κλάδο αντοχή, διαθεσιμότητα, απόδοση, ασφάλεια και ουσιαστικά απεριόριστη επεκτασιμότητα με πολύ χαμηλό κόστος. Όταν αποθηκεύετε δεδομένα στο Amazon S3, εργάζεστε με πόρους γνωστούς ως κουβάδες και αντικειμένων. Ένας κουβάς είναι ένα δοχείο για αντικείμενα. Ένα αντικείμενο είναι ένα αρχείο και κάθε μεταδεδομένο που περιγράφει το αρχείο.
Σε αυτήν την ανάρτηση, σας καθοδηγούμε στα ακόλουθα βήματα για να εφαρμόσετε μια λύση πολυγλωσσικής μεταγραφής ήχου:
- Δημιουργήστε έναν κάδο S3.
- Ανεβάστε το αρχείο ήχου σας στον κάδο.
- Δημιουργήστε την εργασία μεταγραφής.
- Ελέγξτε το αποτέλεσμα της εργασίας.
Προϋποθέσεις
Για αυτήν την καθοδήγηση, θα πρέπει να έχετε τις ακόλουθες προϋποθέσεις:
Το Amazon Transcribe παρέχει την επιλογή αποθήκευσης των μεταγραφόμενων αποτελεσμάτων είτε σε έναν κάδο S3 που διαχειρίζεται η υπηρεσία είτε διαχειρίζεται από τον πελάτη. Για αυτήν την ανάρτηση, έχουμε το Amazon Transcribe να γράφει τα αποτελέσματα σε έναν κάδο S3 που διαχειρίζεται η υπηρεσία.
Σημειώστε ότι το Amazon Transcribe είναι μια Τοπική υπηρεσία και τα τελικά σημεία του Amazon Transcribe API που καλούνται πρέπει να βρίσκονται στην ίδια περιοχή με τους κάδους S3.
Δημιουργήστε έναν κάδο S3 για να αποθηκεύσετε τα αρχεία εισόδου ήχου σας
Για να δημιουργήσετε τον κάδο S3, ολοκληρώστε τα παρακάτω βήματα:
- Στην κονσόλα Amazon S3, επιλέξτε Δημιουργία κάδου.
- Για Όνομα κάδου, εισαγάγετε ένα παγκοσμίως μοναδικό όνομα για τον κάδο.
- Για Περιοχή AWS, επιλέξτε την ίδια περιοχή με τα τελικά σημεία του Amazon Transcribe API.
- Αφήστε όλες τις προεπιλογές ως έχουν.
- Επιλέξτε Δημιουργία κάδου.
Ανεβάστε το αρχείο ήχου σας στον κάδο S3
Ανεβάστε το πολύγλωσσο αρχείο ήχου σας στον κάδο S3 του λογαριασμού σας AWS. Για τους σκοπούς αυτής της άσκησης, χρησιμοποιούμε το παρακάτω δείγμα πολυγλωσσικό αρχείο ήχου. Καταγράφει μια κλήση υποστήριξης πελατών που περιλαμβάνει αγγλικές και ισπανικές γλώσσες.
- Στην κονσόλα Amazon S3, επιλέξτε Κουβάδες στο παράθυρο πλοήγησης.
- Επιλέξτε τον κάδο που δημιουργήσατε προηγουμένως για την αποθήκευση των αρχείων ήχου εισόδου.
- Επιλέξτε Μεταφόρτωση.
- Επιλέξτε Προσθήκη αρχείων.
- Επιλέξτε το αρχείο ήχου που θέλετε να μεταγράψετε από τον τοπικό σας υπολογιστή.
- Επιλέξτε Μεταφόρτωση.
Το αρχείο ήχου σας θα είναι σύντομα διαθέσιμο στον κάδο S3.
Δημιουργήστε την εργασία μεταγραφής
Με το αρχείο ήχου που έχει μεταφορτωθεί, δημιουργούμε τώρα μια εργασία μεταγραφής.
- Στην κονσόλα Amazon Transcribe, επιλέξτε Εργασίες μεταγραφής στο παράθυρο πλοήγησης.
- Επιλέξτε Δημιουργήστε εργασία.
- Για Όνομα, πληκτρολογήστε ένα μοναδικό όνομα για την εργασία.
Αυτό θα είναι επίσης το όνομα του αρχείου μεταγραφής εξόδου. - Για ΡΥΘΜΙΣΕΙΣ ΓΛΩΣΣΑΣ, Επιλέξτε Αυτόματη αναγνώριση πολλαπλών γλωσσών.
Αυτή η δυνατότητα επιτρέπει στο Amazon Transcribe να αναγνωρίζει και να μεταγράφει αυτόματα όλες τις γλώσσες που ομιλούνται στο αρχείο ήχου. - Για Επιλογές γλώσσας για αυτόματη αναγνώριση γλώσσας, αφήστε το μη επιλεγμένο.
Το Amazon Transcribe αναγνωρίζει και μεταγράφει αυτόματα όλες τις γλώσσες που μιλούνται στον ήχο. Για να βελτιώσετε την ακρίβεια της μεταγραφής, μπορείτε προαιρετικά να επιλέξετε δύο ή περισσότερες γλώσσες που γνωρίζετε ότι ομιλούνταν στον ήχο. - Για Τύπος μοντέλου, μόνο το Γενικό μοντέλο η επιλογή είναι διαθέσιμη τη στιγμή της σύνταξης αυτής της ανάρτησης.
- Για Εισαγωγή δεδομένων, επιλέξτε Αναζήτηση S3.
- Επιλέξτε το αρχείο πηγής ήχου που ανεβάσαμε προηγουμένως.
- Για Δεδομένα εξόδου, μπορείτε να επιλέξετε είτε Κάδος S3 με διαχείριση υπηρεσιών or Κάδος S3 που καθορίζεται από τον πελάτη. Για αυτήν την ανάρτηση, επιλέξτε Κάδος S3 με διαχείριση υπηρεσιών.
- Επιλέξτε Επόμενο.
- Επιλέξτε Δημιουργήστε εργασία.
Ελέγξτε το αποτέλεσμα της εργασίας
Όταν ολοκληρωθεί η εργασία μεταγραφής, ανοίξτε την εργασία μεταγραφής.
Κάντε κύλιση προς τα κάτω στο Προεπισκόπηση μεταγραφής Ενότητα. Η ηχητική μεταγραφή εμφανίζεται στο Κείμενο αυτί. Η μεταγραφή περιλαμβάνει τόσο το αγγλικό όσο και το ισπανικό μέρος της συνομιλίας.
Μπορείτε προαιρετικά να κατεβάσετε ένα αντίγραφο της μεταγραφής ως αρχείο JSON, το οποίο θα μπορούσατε να χρησιμοποιήσετε για περαιτέρω αναλυτικά στοιχεία μετά την κλήση.
εκκαθάριση
Για να αποφύγετε μελλοντικές χρεώσεις, αδειάστε και διαγράψτε τον κάδο S3 που δημιουργήσατε για την αποθήκευση του αρχείου πηγής ήχου εισόδου. Βεβαιωθείτε ότι έχετε αποθηκεύσει τα αρχεία αλλού, γιατί αυτό θα αφαιρέσει οριστικά όλα τα αντικείμενα που περιέχονται στον κάδο. Στην κονσόλα Amazon Transcribe, επιλέξτε και διαγράψτε την εργασία που δημιουργήθηκε προηγουμένως για τη μεταγραφή.
Συμπέρασμα
Σε αυτήν την ανάρτηση, δημιουργήσαμε μια ροή εργασίας από άκρο σε άκρο για την αυτοματοποίηση της αναγνώρισης και μεταγραφής πολύγλωσσων αρχείων ήχου, χωρίς να γράψουμε κανέναν κώδικα. Χρησιμοποιήσαμε τη νέα λειτουργία στο Amazon Transcribe για να αναγνωρίζουμε αυτόματα διαφορετικές γλώσσες σε ένα αρχείο ήχου και να μεταγράφουμε σωστά κάθε γλώσσα.
Για περισσότερες πληροφορίες, ανατρέξτε στο Ταυτοποίηση γλώσσας με εργασίες μεταγραφής παρτίδας.
Σχετικά με τους Συγγραφείς
Murtuza Bootwala είναι Senior Solutions Architect στο AWS με ενδιαφέρον για τις τεχνολογίες AI/ML. Του αρέσει να συνεργάζεται με πελάτες για να τους βοηθήσει να επιτύχουν τα επιχειρηματικά τους αποτελέσματα. Εκτός δουλειάς, του αρέσουν οι υπαίθριες δραστηριότητες και να περνά χρόνο με την οικογένεια.
Βίκτορ Ρότζο είναι παθιασμένος με την AI/ML και την ανάπτυξη λογισμικού. Βοήθησε να τεθεί σε λειτουργία η Amazon Alexa στις ΗΠΑ και το Μεξικό. Έφερε επίσης το Amazon Textract στους AWS Partners και απέκτησε το AWS Contact Center Intelligence (CCI). Αυτή τη στιγμή είναι ο παγκόσμιος ηγέτης τεχνολογίας για Συνεργάτες Τεχνητής Νοημοσύνης για συνομιλία.
Μπάμπου Σρινιβασάν είναι μια AWS Sr. Specialist SA (Language AI Services) με έδρα το Σικάγο. Επικεντρώνεται στο Amazon Transcribe (από ομιλία σε κείμενο), βοηθώντας τους πελάτες μας να χρησιμοποιούν υπηρεσίες τεχνητής νοημοσύνης για την επίλυση επιχειρηματικών προβλημάτων. Εκτός δουλειάς, του αρέσει η ξυλουργική και η παράσταση μαγικών παραστάσεων.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- Platoblockchain. Web3 Metaverse Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/automatically-identify-languages-in-multi-lingual-audio-using-amazon-transcribe/
- 100
- a
- Σχετικά
- Λογαριασμός
- ακρίβεια
- Κατορθώνω
- απέναντι
- δραστηριοτήτων
- AI
- Υπηρεσίες AI
- AI / ML
- Alexa
- Όλα
- Αν και
- Amazon
- Textract Amazon
- Μεταγραφή Amazon
- ποσό
- και
- Άλλος
- οπουδήποτε
- api
- APIs
- Εφαρμογή
- ΠΕΡΙΟΧΗ
- ήχου
- αυτοματοποίηση
- Αυτοματοποιημένη
- Αυτόματο
- αυτομάτως
- διαθεσιμότητα
- διαθέσιμος
- AWS
- βασίζονται
- επειδή
- είναι
- μεταξύ
- Έφερε
- χτισμένο
- επιχείρηση
- κλήση
- που ονομάζεται
- κλήση
- κλήσεις
- συλλαμβάνει
- Καταγραφή
- ο οποίος
- περιπτώσεις
- Κέντρο
- αλλαγή
- φορτία
- Σικάγο
- Επιλέξτε
- καθαρός
- πελάτης
- κωδικός
- άνεση
- Διαβιβάσεις
- πλήρης
- υπολογιστή
- Εξετάστε
- πρόξενος
- επικοινωνήστε μαζί μας
- κέντρο επαφών
- Δοχείο
- περιεχόμενο
- Συνομιλία
- ομιλητικός
- συνομιλία AI
- μετατρέψετε
- Κόστος
- θα μπορούσε να
- χώρα
- δημιουργία
- δημιουργήθηκε
- Τη στιγμή
- πελάτης
- Εξυπηρέτηση πελατών
- Εξυπηρέτηση πελατών
- Πελάτες
- παραμετροποίηση
- ημερομηνία
- προεπιλογές
- Σε συνάρτηση
- περιγράφουν
- Ανάπτυξη
- διαφορετικές
- συζητήσουν
- κάτω
- κατεβάσετε
- αντοχή
- κάθε
- αποτελεσματικά
- είτε
- αλλού
- ενεργοποιήσετε
- δίνει τη δυνατότητα
- από άκρη σε άκρη
- Αγγλικά
- εισάγετε
- εξ ολοκλήρου
- Αιθέρας (ΕΤΗ)
- Άσκηση
- οικογένεια
- εφικτός
- Χαρακτηριστικό
- Αρχεία
- Αρχεία
- φιλτράρισμα
- εστιάζει
- Εξής
- Φόρουμ
- από
- λειτουργικότητα
- περαιτέρω
- μελλοντικός
- παράγουν
- παίρνω
- Παγκόσμιο
- Παγκόσμια
- Έδαφος
- βοήθεια
- βοήθησε
- βοήθεια
- Πως
- Πώς να
- HTML
- HTTPS
- Οι άνθρωποι
- Αναγνώριση
- αναγνωρίζει
- προσδιορίσει
- εφαρμογή
- βελτίωση
- in
- περιλαμβάνει
- Αυξάνουν
- κορυφαία στον κλάδο
- πληροφορίες
- εισαγωγή
- οδηγίες
- Νοημοσύνη
- αλληλεπιδράσεις
- τόκος
- IT
- Δουλειά
- json
- Ξέρω
- γνωστός
- Γλώσσα
- Γλώσσες
- ηγέτης
- Άδεια
- Επίπεδο
- τοπικός
- Τοπική Προσαρμογή
- Χαμηλός
- μαγεία
- κάνω
- ΚΑΝΕΙ
- διαχειρίζεται
- Εικόνες / Βίντεο
- συνάντηση
- Μεταδεδομένα
- Μεξικό
- ενδέχεται να
- ελάχιστο
- παρακολούθηση
- περισσότερο
- πολλαπλούς
- όνομα
- Πλοήγηση
- Ανάγκη
- χρειάζονται
- Νέα
- αντικείμενο
- αντικειμένων
- προσφορές
- επίσημος ανώτερος υπάλληλος
- ONE
- ανοίξτε
- λειτουργούν
- λειτουργίας
- Επιλογή
- Επιλογές
- ΑΛΛΑ
- εκτός
- παράθυρο
- συμμετέχοντες
- Συνεργάτες
- παθιασμένος
- επίδοση
- εκτέλεση
- μόνιμα
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- πληθυσμός
- Θέση
- προτιμήσεις
- προαπαιτούμενα
- προηγουμένως
- μυστικότητα
- Πρόβλημα
- προβλήματα
- παραγωγή
- προστασία
- παρέχουν
- σκοπός
- Διάβασε
- αναγνώριση
- περιοχή
- περιφερειακός
- περιοχές
- αφαιρέστε
- αναφέρουν
- εκπρόσωπος
- Υποστηρικτικό υλικό
- Αποτελέσματα
- ανασκόπηση
- τρέξιμο
- SA
- ίδιο
- Απεριόριστες δυνατότητες
- δευτερόλεπτα
- Τμήμα
- ασφάλεια
- υπηρεσία
- Υπηρεσίες
- Σύντομα
- θα πρέπει να
- Δείχνει
- παρόμοιες
- Απλούς
- λογισμικό
- ανάπτυξη λογισμικού
- λύση
- Λύσεις
- SOLVE
- Πηγή
- Ισπανικά
- ομιλία
- ειδικός
- καθορίζεται
- ομιλία
- Αναγνώριση ομιλίας
- Δαπάνες
- Βήματα
- χώρος στο δίσκο
- κατάστημα
- αποθηκεύονται
- ουσιώδης
- τέτοιος
- υποστήριξη
- διακόπτης
- tech
- Τεχνολογίες
- Η
- τους
- Μέσω
- ώρα
- προς την
- Παρακολούθηση
- Αντίγραφο
- μετάβαση
- μοναδικός
- απεριόριστες
- Φορτώθηκε
- us
- Χρήση
- χρήση
- Χρήστες
- διάφορα
- πρακτικώς
- περιδιάβαση
- Ποιό
- ενώ
- θα
- εντός
- χωρίς
- Εργασία
- ροές εργασίας
- εργαζόμενος
- γράφω
- γραφή
- Σας
- zephyrnet