Meta Researchers Build An AI That Learns Equally Well From Visual, Written Or Spoken Materials

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Οι πρόοδοι στον τομέα της τεχνητής νοημοσύνης εμφανίζονται συνεχώς, αλλά τείνουν να περιορίζονται σε έναν μόνο τομέα: Για παράδειγμα, μια νέα νέα μέθοδος για την παραγωγή συνθετικής ομιλίας δεν είναι Επίσης ένας τρόπος αναγνώρισης εκφράσεων στα ανθρώπινα πρόσωπα. Οι ερευνητές της Meta (AKA Facebook) εργάζονται σε κάτι λίγο πιο ευέλικτο: μια τεχνητή νοημοσύνη που μπορεί να μάθει ικανά από μόνη της είτε το κάνει σε προφορικό, γραπτό ή οπτικό υλικό.

Ο παραδοσιακός τρόπος εκπαίδευσης ενός μοντέλου τεχνητής νοημοσύνης ώστε να ερμηνεύει σωστά κάτι είναι να του δίνουμε πολλά και πολλά (όπως εκατομμύρια) παραδείγματα με ετικέτα. Μια εικόνα μιας γάτας με το μέρος της γάτας επισημασμένο, μια συνομιλία με τους ομιλητές και λέξεις μεταγραμμένες, κ.λπ. Αλλά αυτή η προσέγγιση δεν είναι πλέον της μόδας καθώς οι ερευνητές διαπίστωσαν ότι δεν ήταν πλέον εφικτό να δημιουργήσουν με μη αυτόματο τρόπο βάσεις δεδομένων με τα μεγέθη που απαιτούνται για την επόμενη εκπαίδευση -gen AI. Ποιος θέλει να επισημάνει 50 εκατομμύρια φωτογραφίες γατών; Εντάξει, λίγοι άνθρωποι πιθανώς — αλλά ποιος θέλει να επισημάνει 50 εκατομμύρια φωτογραφίες κοινών φρούτων και λαχανικών;

Επί του παρόντος, μερικά από τα πιο πολλά υποσχόμενα συστήματα τεχνητής νοημοσύνης είναι αυτά που ονομάζονται αυτο-εποπτευόμενα: μοντέλα που μπορούν να λειτουργήσουν από μεγάλες ποσότητες δεδομένων χωρίς ετικέτα, όπως βιβλία ή βίντεο με ανθρώπους που αλληλεπιδρούν, και να δημιουργήσουν τη δική τους δομημένη κατανόηση για το ποιοι είναι οι κανόνες του συστήματος. Για παράδειγμα, διαβάζοντας χίλια βιβλία θα μάθει τις σχετικές θέσεις των λέξεων και των ιδεών σχετικά με τη γραμματική δομή, χωρίς κανείς να του λέει τι είναι τα αντικείμενα ή τα άρθρα ή τα κόμματα — το πήρε αντλώντας συμπεράσματα από πολλά παραδείγματα.

Αυτό μοιάζει διαισθητικά περισσότερο με το πώς μαθαίνουν οι άνθρωποι, κάτι που είναι μέρος του γιατί αρέσει στους ερευνητές. Αλλά τα μοντέλα εξακολουθούν να τείνουν να είναι μονοτροπικά και όλη η δουλειά που κάνετε για να δημιουργήσετε ένα ημι-εποπτευόμενο σύστημα εκμάθησης για την αναγνώριση ομιλίας δεν θα ισχύει καθόλου για την ανάλυση εικόνας — είναι απλώς πολύ διαφορετικά. Εκεί είναι η τελευταία έρευνα του Facebook/Meta, το πιασάρικα όνομα data2vec, Έρχεται σε.

Η ιδέα για το data2vec ήταν να δημιουργήσει ένα πλαίσιο τεχνητής νοημοσύνης που θα μάθαινε με πιο αφηρημένο τρόπο, που σημαίνει ότι ξεκινώντας από το μηδέν, θα μπορούσατε να του δώσετε βιβλία για ανάγνωση ή εικόνες για σάρωση ή ομιλία για να ακούγεται και μετά από λίγη εκπαίδευση. μάθετε κάποιο από αυτά τα πράγματα. Είναι λίγο σαν να ξεκινάς με έναν μόνο σπόρο, αλλά ανάλογα με τη φυτική τροφή που του δίνεις, μεγαλώνει σε ασφόδελο, πανσέ ή τουλίπα.

Η δοκιμή του data2vec αφού το άφησε να εκπαιδεύεται σε διάφορα corpi δεδομένων έδειξε ότι ήταν ανταγωνιστικό και μάλιστα ξεπέρασε σε απόδοση παρόμοιου μεγέθους αποκλειστικά μοντέλα για αυτόν τον τρόπο. (Δηλαδή, εάν όλα τα μοντέλα περιορίζονται στα 100 megabyte, το data2vec τα πήγε καλύτερα — τα εξειδικευμένα μοντέλα θα εξακολουθούσαν να έχουν πιθανώς καλύτερη απόδοση καθώς μεγαλώνουν.)

«Η βασική ιδέα αυτής της προσέγγισης είναι να μάθουμε γενικότερα: η τεχνητή νοημοσύνη θα πρέπει να μπορεί να μάθει να κάνει πολλές διαφορετικές εργασίες, συμπεριλαμβανομένων εκείνων που είναι εντελώς άγνωστες». έγραψε η ομάδα σε μια ανάρτηση στο blog. «Ελπίζουμε επίσης ότι το data2vec θα μας φέρει πιο κοντά σε έναν κόσμο όπου οι υπολογιστές χρειάζονται πολύ λίγα δεδομένα με ετικέτα για να ολοκληρώσουν εργασίες».

«Οι άνθρωποι βιώνουν τον κόσμο μέσω ενός συνδυασμού όρασης, ήχου και λέξεων, και συστήματα όπως αυτό θα μπορούσαν κάποια μέρα να κατανοήσουν τον κόσμο όπως εμείς», σχολίασε ο διευθύνων σύμβουλος Mark Zuckerberg στην έρευνα.

Αυτή είναι ακόμα έρευνα πρώιμου σταδίου, οπότε μην περιμένετε να εμφανιστεί ξαφνικά η θρυλική «γενική τεχνητή νοημοσύνη» — αλλά το να έχετε μια τεχνητή νοημοσύνη που έχει μια γενικευμένη δομή μάθησης που λειτουργεί με διάφορους τομείς και τύπους δεδομένων φαίνεται καλύτερο, πιο κομψή λύση από το κατακερματισμένο σύνολο μικρο-νοημοσύνης που τα καταφέρνουμε σήμερα.

Ο κώδικας για το data2vec είναι ανοιχτού κώδικα. αυτό και μερικά προεκπαιδευμένα μοντέλα είναι διαθέσιμα εδώ.

Πηγή: https://techcrunch.com/2022/01/20/meta-researchers-build-an-ai-that-learns-equally-well-from-visual-written-or-spoken-materials/

Σφραγίδα ώρας: Ιανουάριος 20, 2022

Περισσότερα από TechCrunch

Το Whatfix κερδίζει $ 90 εκατομμύρια για να βοηθήσει τους εργαζόμενους στο αεροσκάφος και να αξιοποιήσουν στο έπακρο τις στοίβες πληροφορικής τους

Σύμπλεγμα πηγής:

TechCrunch

Κόμβος πηγής: 892900

Σφραγίδα ώρας: 8 Ιουνίου 2021

Καθώς η M&A επιταχύνεται, οι κατασκευαστές διαπραγματεύσεων χρησιμοποιούν το AI και το ML για να συμβαδίζουν

Σύμπλεγμα πηγής:

Σύμπλεγμα πηγής:

TechCrunch

Κόμβος πηγής: 1140752

Σφραγίδα ώρας: 6 Οκτωβρίου 2021

Οι ερευνητές Meta κατασκευάζουν ένα AI που μαθαίνει εξίσου καλά από οπτικό, γραπτό ή προφορικό υλικό

Αναδημοσίευση από τον Πλάτωνα

Περισσότερα από TechCrunch

Το Whatfix κερδίζει $ 90 εκατομμύρια για να βοηθήσει τους εργαζόμενους στο αεροσκάφος και να αξιοποιήσουν στο έπακρο τις στοίβες πληροφορικής τους

Καθώς η M&A επιταχύνεται, οι κατασκευαστές διαπραγματεύσεων χρησιμοποιούν το AI και το ML για να συμβαδίζουν

Η Accel ηγείται του γύρου 16 εκατομμυρίων δολαρίων της Lucid Lane με στόχο τη θεραπεία ατόμων με εξάρτηση από φάρμακα

Η Dooly συγκεντρώνει 80 εκατομμύρια δολάρια περισσότερα για τα εργαλεία τεχνητής νοημοσύνης που βοηθούν τους πωλητές να διαχειρίζονται την πολυάσχολη εργασία τους

Η Oxbotica συγκεντρώνει 13.8 εκατομμύρια δολάρια από την Ocado για την κατασκευή αυτόνομης τεχνολογίας οχημάτων για το δίκτυο logistics του διαδικτυακού παντοπωλείου

Η Google δοκιμάζει το Project Relate, μια εφαρμογή αναγνώρισης και σύνθεσης φωνής για άτομα με προβλήματα ομιλίας

Το Resistant AI κερδίζει 16.6 εκατομμύρια δολάρια για τα εργαλεία fintech κατά της απάτης

Το ψηφιακό δίδυμο της Γης του Blackshark.ai προσελκύει χρηματοδότηση 20 εκατομμυρίων δολαρίων

Τα προσομοιωμένα πλάσματα τεχνητής νοημοσύνης δείχνουν πώς το μυαλό και το σώμα εξελίσσονται και πετυχαίνουν μαζί

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός