Μπρους Γουόρινγκτον μέσω Unsplash
Ο λόγος για τον οποίο τα μοντέλα μηχανικής μάθησης γενικά γίνονται πιο έξυπνα οφείλεται στην εξάρτησή τους από τη χρήση δεδομένων με ετικέτα για να τα βοηθήσουν να διακρίνουν μεταξύ δύο όμοιων αντικειμένων.
Ωστόσο, χωρίς αυτά τα επισημασμένα σύνολα δεδομένων, θα συναντήσετε μεγάλα εμπόδια κατά τη δημιουργία του πιο αποτελεσματικού και αξιόπιστου μοντέλου μηχανικής μάθησης. Τα επισημασμένα σύνολα δεδομένων κατά τη φάση εκπαίδευσης ενός μοντέλου είναι σημαντικά.
Η βαθιά μάθηση έχει χρησιμοποιηθεί ευρέως για την επίλυση εργασιών όπως η όραση υπολογιστή με χρήση εποπτευόμενης μάθησης. Ωστόσο, όπως συμβαίνει με πολλά πράγματα στη ζωή, έρχεται με περιορισμούς. Η εποπτευόμενη ταξινόμηση απαιτεί υψηλή ποσότητα και ποιότητα επισημασμένων δεδομένων εκπαίδευσης προκειμένου να παραχθεί ένα ισχυρό μοντέλο. Αυτό σημαίνει ότι το μοντέλο ταξινόμησης δεν μπορεί να χειριστεί μη ορατές κλάσεις.
Και όλοι γνωρίζουμε πόση υπολογιστική ισχύ, επανεκπαίδευση, χρόνο και χρήματα χρειάζονται για να εκπαιδεύσουμε ένα μοντέλο βαθιάς μάθησης.
Μπορεί όμως ένα μοντέλο να μπορεί ακόμα να διακρίνει δύο αντικείμενα χωρίς να έχει χρησιμοποιήσει δεδομένα εκπαίδευσης; Ναι, λέγεται μηδενική μάθηση. Η εκμάθηση μηδενικής βολής είναι η ικανότητα ενός μοντέλου να μπορεί να ολοκληρώσει μια εργασία χωρίς να έχει λάβει ή να χρησιμοποιήσει κανένα παράδειγμα εκπαίδευσης.
Οι άνθρωποι είναι εκ φύσεως ικανοί να μάθουν μηδενικά χωρίς να χρειάζεται να καταβάλουν μεγάλη προσπάθεια. Ο εγκέφαλός μας αποθηκεύει ήδη λεξικά και μας επιτρέπει να διαφοροποιούμε αντικείμενα εξετάζοντας τις φυσικές τους ιδιότητες λόγω της τρέχουσας βάσης γνώσεών μας. Μπορούμε να χρησιμοποιήσουμε αυτή τη βάση γνώσεων για να δούμε τις ομοιότητες και τις διαφορές μεταξύ των αντικειμένων και να βρούμε τη σύνδεση μεταξύ τους.
Για παράδειγμα, ας πούμε ότι προσπαθούμε να οικοδομήσουμε ένα μοντέλο ταξινόμησης σε ζωικά είδη. Σύμφωνα με Our WorldInData, υπήρχαν 2.13 εκατομμύρια είδη που υπολογίστηκαν το 2021. Επομένως, αν θέλουμε να δημιουργήσουμε το πιο αποτελεσματικό μοντέλο ταξινόμησης για τα ζωικά είδη, θα χρειαζόμασταν 2.13 εκατομμύρια διαφορετικές κατηγορίες. Θα χρειαστούν επίσης πολλά δεδομένα. Δεδομένα υψηλής ποσότητας και ποιότητας είναι δύσκολο να συναντηθούν.
Πώς λοιπόν η μηδενική μάθηση λύνει αυτό το πρόβλημα;
Επειδή η εκμάθηση μηδενικής λήψης δεν απαιτεί από το μοντέλο να έχει μάθει τα δεδομένα εκπαίδευσης και τον τρόπο ταξινόμησης των τάξεων, μας επιτρέπει να βασιζόμαστε λιγότερο στην ανάγκη του μοντέλου για δεδομένα με ετικέτα.
Ακολουθεί τι θα πρέπει να αποτελούνται τα δεδομένα σας για να προχωρήσετε στη μηδενική μάθηση.
Προβολή τάξεων
Αυτό αποτελείται από τις κατηγορίες δεδομένων που έχουν χρησιμοποιηθεί προηγουμένως για την εκπαίδευση ενός μοντέλου.
Αόρατες Τάξεις
Αυτό αποτελείται από τις κατηγορίες δεδομένων που ΔΕΝ έχουν χρησιμοποιηθεί για την εκπαίδευση ενός μοντέλου και το νέο μοντέλο μάθησης μηδενικής βολής θα γενικευτεί.
Βοηθητικές Πληροφορίες
Καθώς τα δεδομένα στις μη ορατές τάξεις δεν φέρουν ετικέτα, η εκμάθηση μηδενικής λήψης θα απαιτήσει βοηθητικές πληροφορίες προκειμένου να μάθουν και να βρουν συσχετίσεις, συνδέσμους και ιδιότητες. Αυτό μπορεί να είναι με τη μορφή ενσωματώσεων λέξεων, περιγραφών και σημασιολογικών πληροφοριών.
Μέθοδοι μάθησης μηδενικής βολής
Η μάθηση μηδενικής βολής χρησιμοποιείται συνήθως σε:
- Μέθοδοι που βασίζονται σε ταξινομητές
- Μέθοδοι που βασίζονται σε παραδείγματα
Πρακτική άσκηση
Η εκμάθηση μηδενικής λήψης χρησιμοποιείται για τη δημιουργία μοντέλων για τάξεις που δεν εκπαιδεύονται χρησιμοποιώντας δεδομένα με ετικέτα, επομένως απαιτεί αυτά τα δύο στάδια:
1. Εκπαίδευση
Το στάδιο εκπαίδευσης είναι η διαδικασία της μεθόδου μάθησης που προσπαθεί να συλλάβει όσο το δυνατόν περισσότερη γνώση για τις ποιότητες των δεδομένων. Μπορούμε να το δούμε αυτό ως τη φάση μάθησης.
2. Συμπέρασμα
Κατά τη διάρκεια του σταδίου συμπερασμάτων, όλη η γνώση που αποκτήθηκε από το στάδιο της εκπαίδευσης εφαρμόζεται και χρησιμοποιείται για την ταξινόμηση των παραδειγμάτων σε ένα νέο σύνολο τάξεων. Μπορούμε να το δούμε αυτό ως τη φάση των προβλέψεων.
Πώς λειτουργεί;
Η γνώση από τις προβλεπόμενες τάξεις θα μεταφερθεί στις μη ορατές τάξεις σε ένα διανυσματικό χώρο υψηλών διαστάσεων. αυτό ονομάζεται σημασιολογικός χώρος. Για παράδειγμα, στην ταξινόμηση εικόνων ο σημασιολογικός χώρος μαζί με την εικόνα θα υποβληθούν σε δύο βήματα:
1. Κοινός χώρος ενσωμάτωσης
Εδώ προβάλλονται τα σημασιολογικά διανύσματα και τα διανύσματα του οπτικού χαρακτηριστικού.
2. Υψηλότερη ομοιότητα
Αυτό είναι όπου τα χαρακτηριστικά ταιριάζουν με αυτά μιας αόρατης κατηγορίας.
Για να κατανοήσουμε τη διαδικασία με τα δύο στάδια (εκπαίδευση και συμπέρασμα), ας τα εφαρμόσουμε στη χρήση της ταξινόμησης εικόνων.
Εκπαίδευση
Jari Hytönen μέσω Unsplash
Ως άνθρωπος, αν επρόκειτο να διαβάσετε το κείμενο στα δεξιά στην παραπάνω εικόνα, θα υποθέτετε αμέσως ότι υπάρχουν 4 γατάκια σε ένα καφέ καλάθι. Αλλά ας πούμε ότι δεν έχετε ιδέα τι είναι «γατάκι». Θα υποθέσετε ότι υπάρχει ένα καφέ καλάθι με 4 πράγματα μέσα, τα οποία ονομάζονται «γατάκια». Μόλις συναντήσετε περισσότερες εικόνες που περιέχουν κάτι που μοιάζει με «γατάκι», θα μπορείτε να διαφοροποιήσετε ένα «γατάκι» από άλλα ζώα.
Αυτό συμβαίνει όταν χρησιμοποιείτε Προεκπαίδευση αντιθετικής γλώσσας-εικόνας (CLIP) από την OpenAI για εκμάθηση μηδενικής λήψης στην ταξινόμηση εικόνων. Είναι γνωστή ως βοηθητική πληροφορία.
Μπορεί να σκέφτεστε, "καλά αυτά είναι απλώς δεδομένα με ετικέτα". Καταλαβαίνω γιατί το νομίζεις αυτό, αλλά δεν είναι. Οι βοηθητικές πληροφορίες δεν είναι ετικέτες των δεδομένων, είναι μια μορφή εποπτείας για να βοηθήσουν το μοντέλο να μάθει κατά το στάδιο της εκπαίδευσης.
Όταν ένα μοντέλο μάθησης μηδενικής λήψης βλέπει επαρκή αριθμό ζευγών εικόνας-κειμένου, θα είναι σε θέση να διαφοροποιήσει και να κατανοήσει φράσεις και πώς συσχετίζονται με ορισμένα μοτίβα στις εικόνες. Χρησιμοποιώντας την τεχνική CLIP «αντιθετική μάθηση», το μοντέλο μάθησης μηδενικής βολής μπόρεσε να συγκεντρώσει μια καλή βάση γνώσεων για να μπορεί να κάνει προβλέψεις για εργασίες ταξινόμησης.
Αυτή είναι μια σύνοψη της προσέγγισης CLIP όπου εκπαιδεύουν έναν κωδικοποιητή εικόνας και έναν κωδικοποιητή κειμένου μαζί για να προβλέψουν τα σωστά ζεύγη μιας παρτίδας παραδειγμάτων εκπαίδευσης (εικόνα, κείμενο). Δείτε την παρακάτω εικόνα:
Εκμάθηση μεταφερόμενων οπτικών μοντέλων από την εποπτεία φυσικής γλώσσας
Συμπέρασμα
Μόλις το μοντέλο περάσει από το στάδιο εκπαίδευσης, έχει μια καλή βάση γνώσεων για το ζευγάρωμα εικόνας-κειμένου και μπορεί τώρα να χρησιμοποιηθεί για να κάνει προβλέψεις. Αλλά προτού μπορέσουμε να κάνουμε προβλέψεις, πρέπει να ρυθμίσουμε την εργασία ταξινόμησης δημιουργώντας μια λίστα με όλες τις πιθανές ετικέτες που θα μπορούσε να παράγει το μοντέλο.
Για παράδειγμα, τηρώντας την εργασία ταξινόμησης εικόνων στα ζωικά είδη, θα χρειαστούμε μια λίστα με όλα τα είδη ζώων. Κάθε μία από αυτές τις ετικέτες θα είναι κωδικοποιημένη, T? στο Τ; χρησιμοποιώντας τον προεκπαιδευμένο κωδικοποιητή κειμένου που προέκυψε στο στάδιο της εκπαίδευσης.
Αφού κωδικοποιηθούν οι ετικέτες, μπορούμε να εισάγουμε εικόνες μέσω του προκαταρτισμένου κωδικοποιητή εικόνων. Θα χρησιμοποιήσουμε τη μετρική ομοιότητα συνημιτόνου απόστασης για να υπολογίσουμε τις ομοιότητες μεταξύ της κωδικοποίησης εικόνας και κάθε κωδικοποίησης ετικέτας κειμένου.
Η ταξινόμηση της εικόνας γίνεται με βάση την ετικέτα με τη μεγαλύτερη ομοιότητα με την εικόνα. Και έτσι επιτυγχάνεται η μάθηση μηδενικής λήψης, ειδικά στην ταξινόμηση εικόνων.
Σπανιότητα Δεδομένων
Όπως αναφέρθηκε προηγουμένως, τα δεδομένα υψηλής ποσότητας και ποιότητας είναι δύσκολο να τα βρείτε στα χέρια σας. Σε αντίθεση με τους ανθρώπους που διαθέτουν ήδη τη μηδενική ικανότητα μάθησης, οι μηχανές απαιτούν δεδομένα με ετικέτα εισόδου για να μάθουν και στη συνέχεια να είναι σε θέση να προσαρμοστούν σε διακυμάνσεις που μπορεί να προκύψουν φυσικά.
Αν δούμε το παράδειγμα των ζωικών ειδών, ήταν τόσα πολλά. Και καθώς ο αριθμός των κατηγοριών συνεχίζει να αυξάνεται σε διαφορετικούς τομείς, θα χρειαστεί πολλή δουλειά για να συμβαδίσετε με τη συλλογή σχολιασμένων δεδομένων.
Λόγω αυτού, η μηδενική μάθηση έχει γίνει πιο πολύτιμη για εμάς. Όλο και περισσότεροι ερευνητές ενδιαφέρονται για την αυτόματη αναγνώριση χαρακτηριστικών για να αντισταθμίσουν την έλλειψη διαθέσιμων δεδομένων.
Επισήμανση δεδομένων
Ένα άλλο πλεονέκτημα της μηδενικής μάθησης είναι οι ιδιότητες επισήμανσης δεδομένων. Η επισήμανση δεδομένων μπορεί να είναι εντατική και πολύ κουραστική, και λόγω αυτού, μπορεί να οδηγήσει σε σφάλματα κατά τη διαδικασία. Η επισήμανση δεδομένων απαιτεί ειδικούς, όπως επαγγελματίες ιατρούς που εργάζονται σε ένα βιοϊατρικό σύνολο δεδομένων, το οποίο είναι ιδιαίτερα δαπανηρό και χρονοβόρο.
Η μάθηση με μηδενική λήψη γίνεται πιο δημοφιλής λόγω των παραπάνω περιορισμών δεδομένων. Υπάρχουν μερικά άρθρα που θα σας συνιστούσα να διαβάσετε αν σας ενδιαφέρουν οι ικανότητές του:
Nisha Arya είναι Επιστήμονας Δεδομένων και Ανεξάρτητος Τεχνικός Συγγραφέας. Ενδιαφέρεται ιδιαίτερα να παρέχει συμβουλές σταδιοδρομίας ή σεμινάρια της Επιστήμης Δεδομένων και γνώσεις βασισμένες στη θεωρία γύρω από την Επιστήμη των Δεδομένων. Επιθυμεί επίσης να εξερευνήσει τους διαφορετικούς τρόπους με τους οποίους η Τεχνητή Νοημοσύνη μπορεί/μπορεί να ωφελήσει τη μακροζωία της ανθρώπινης ζωής. Μια δεινή μαθήτρια, που επιδιώκει να διευρύνει τις τεχνολογικές της γνώσεις και τις δεξιότητες γραφής, βοηθώντας παράλληλα να καθοδηγήσει άλλους.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- Platoblockchain. Web3 Metaverse Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- πηγή: https://www.kdnuggets.com/2022/12/zeroshot-learning-explained.html?utm_source=rss&utm_medium=rss&utm_campaign=zero-shot-learning-explained
- 2021
- a
- ικανότητες
- ικανότητα
- Ικανός
- Σχετικά
- πάνω από
- Σύμφωνα με
- Συσσωρεύω
- επιτευχθεί
- απέναντι
- προσαρμόσει
- συμβουλές
- κατά
- Όλα
- επιτρέπει
- ήδη
- ποσό
- και
- ζώο
- αγελάδων
- εφαρμοσμένος
- Εφαρμογή
- πλησιάζω
- γύρω
- τεχνητός
- τεχνητή νοημοσύνη
- Αυτόματο
- διαθέσιμος
- βάση
- βασίζονται
- καλάθι
- γίνονται
- να γίνει
- πριν
- είναι
- παρακάτω
- όφελος
- μεταξύ
- βιοϊατρικής
- ευρύνω
- χτίζω
- υπολογίζεται
- που ονομάζεται
- Μπορεί να πάρει
- δεν μπορώ
- ικανός
- πιάνω
- Σταδιοδρομία
- κατηγορίες
- ορισμένες
- τάξη
- τάξεις
- ταξινόμηση
- Ταξινόμηση
- Συλλέγοντας
- Ελάτε
- πλήρης
- υπολογιστική δύναμη
- Υπολογίστε
- υπολογιστή
- Computer Vision
- συνεχίζεται
- θα μπορούσε να
- δημιουργία
- δημιουργία
- Ρεύμα
- ημερομηνία
- επιστημονικά δεδομένα
- επιστήμονας δεδομένων
- σύνολα δεδομένων
- βαθύς
- βαθιά μάθηση
- Εξάρτηση
- διαφορές
- διαφορετικές
- διαφοροποιούν
- απόσταση
- domains
- κατά την διάρκεια
- κάθε
- Αποτελεσματικός
- προσπάθεια
- λάθη
- παράδειγμα
- παραδείγματα
- ακριβά
- εμπειρογνώμονες
- εξήγησε
- διερευνήσει
- Χαρακτηριστικό
- Χαρακτηριστικά
- λίγοι
- Εύρεση
- Εξής
- μορφή
- ανεξάρτητος
- από
- General
- παίρνω
- καλός
- μεγαλύτερη
- Grow
- καθοδηγήσει
- λαβή
- τα χέρια
- συμβαίνει
- Σκληρά
- που έχει
- βοήθεια
- βοήθεια
- Ψηλά
- υψηλότερο
- υψηλά
- Πως
- Πώς να
- Ωστόσο
- HTTPS
- ανθρώπινος
- Οι άνθρωποι
- ιδέα
- εικόνα
- Ταξινόμηση εικόνας
- εικόνες
- σημαντικό
- in
- πληροφορίες
- εισαγωγή
- Νοημοσύνη
- ενδιαφερόμενος
- IT
- Keen
- Διατήρηση
- Ξέρω
- γνώση
- γνωστός
- επιγραφή
- τιτλοφόρηση
- Ετικέτες
- Έλλειψη
- Γλώσσα
- οδηγήσει
- ΜΑΘΑΊΝΩ
- μάθει
- μάθηση
- ζωή
- περιορισμούς
- LINK
- ΣΥΝΔΕΣΜΟΙ
- Λίστα
- μακροβιότητα
- ματιά
- κοιτάζοντας
- ΦΑΊΝΕΤΑΙ
- Παρτίδα
- μηχανή
- μάθηση μηχανής
- μηχανήματα
- μεγάλες
- κάνω
- Κατασκευή
- πολοί
- μέσα
- ιατρικών
- που αναφέρθηκαν
- μέθοδος
- μέθοδοι
- μετρικός
- ενδέχεται να
- εκατομμύριο
- μοντέλο
- μοντέλα
- χρήματα
- περισσότερο
- πλέον
- Φυσικό
- Ανάγκη
- Νέα
- αριθμός
- αντικειμένων
- εμπόδια
- συνέβη
- ONE
- OpenAI
- τάξη
- ΑΛΛΑ
- Άλλα
- αντιστοίχιση
- ζευγαρώματα
- χαρτιά
- ιδιαίτερα
- πρότυπα
- φάση
- φράσεις
- φυσικός
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- σας παρακαλούμε
- Δημοφιλής
- δυνατός
- δύναμη
- προβλέψει
- Προβλέψεις
- προηγουμένως
- Πρόβλημα
- διαδικασια μας
- παράγει
- επαγγελματίες
- προβλέπεται
- ιδιότητες
- χορήγηση
- βάζω
- ιδιότητες
- ποιότητα
- ποσότητα
- Διάβασε
- λόγος
- έλαβε
- αναγνώριση
- συνιστώ
- απαιτούν
- Απαιτεί
- ερευνητές
- περιορισμούς
- εύρωστος
- Επιστήμη
- Επιστήμονας
- αναζήτηση
- βλέπει
- σειρά
- παρόμοιες
- ομοιότητες
- δεξιότητες
- εξυπνότερα
- So
- SOLVE
- κάτι
- Χώρος
- ειδικά
- Στάδιο
- στάδια
- Βήματα
- κολλάει
- Ακόμη
- κατάστημα
- τέτοιος
- επαρκής
- ΠΕΡΙΛΗΨΗ
- εποπτεία
- Πάρτε
- παίρνει
- Έργο
- εργασίες
- tech
- Τεχνικός
- Η
- τους
- επομένως
- πράγματα
- Σκέψη
- Μέσω
- ώρα
- χρονοβόρος
- προς την
- μαζι
- Τρένο
- Εκπαίδευση
- μεταφέρονται
- αξιόπιστος
- tutorials
- συνήθως
- καταλαβαίνω
- us
- χρήση
- χρησιμοποιούνται
- Πολύτιμος
- μέσω
- Δες
- όραμα
- τρόπους
- Τι
- Ποιό
- Ενώ
- Ο ΟΠΟΊΟΣ
- ευρέως
- θα
- χωρίς
- λέξη
- Εργασία
- εργαζόμενος
- θα
- συγγραφέας
- γραφή
- Σας
- zephyrnet
- Μηδενική Εκμάθηση