Το Scale AI μπαίνει στο παιχνίδι συνθετικών δεδομένων

Κόμβος πηγής: 1599948

Ο δρόμος της Scale AI για να γίνει εταιρεία 7.3 δισεκατομμυρίων δολαρίων στρώθηκε σε πραγματικά δεδομένα από εικόνες, κείμενο, φωνή και βίντεο. Τώρα, χρησιμοποιεί αυτό το θεμέλιο για να μπει στο παιχνίδι συνθετικών δεδομένων, μια από τις πιο καυτές και αναδυόμενες κατηγορίες στο AI.

Ανακοίνωσαν την Τετάρτη ένα πρόγραμμα πρώιμης πρόσβασης σε Ζυγαριά Συνθετική, ένα προϊόν που οι μηχανικοί μηχανικής εκμάθησης μπορούν να χρησιμοποιήσουν για να βελτιώσουν τα υπάρχοντα σύνολα δεδομένων τους στον πραγματικό κόσμο, σύμφωνα με την εταιρεία. Η Scale προσέλαβε δύο στελέχη για να δημιουργήσει αυτό το νέο τμήμα της επιχείρησής της. Η Scale προσέλαβε τον Joel Kronander, ο οποίος προηγουμένως ήταν επικεφαλής μηχανικής μάθησης στο Nines και ήταν πρώην μηχανικός όρασης υπολογιστών στην Apple που εργαζόταν στην τρισδιάστατη χαρτογράφηση, ως νέος επικεφαλής συνθετικών δεδομένων. Η εταιρεία προσέλαβε επίσης τον Vivek Raju Muppalla ως διευθυντή συνθετικών υπηρεσιών. Ο Muppalla ήταν προηγουμένως διευθυντής μηχανικής για AI και προσομοίωση στην Unity Technologies.

Τα συνθετικά δεδομένα είναι όπως ακούγονται: πλαστά δεδομένα που έχουν δημιουργηθεί από αλγόριθμους μηχανικής μάθησης αντί να χρησιμοποιούν πληροφορίες από τον πραγματικό κόσμο. Μπορεί να είναι ένα ισχυρό και εύχρηστο εργαλείο για τη δημιουργία δεδομένων - όπως η ιατρική απεικόνιση - όταν το απόρρητο είναι κύριο μέλημα. Οι προγραμματιστές μπορούν να χρησιμοποιήσουν συνθετικά δεδομένα για να προσθέσουν περισσότερη πολυπλοκότητα στα μοντέλα εκπαίδευσής τους και να βοηθήσουν στην εξάλειψη των προκαταλήψεων που μπορούν συχνά να βρεθούν σε συλλεγμένα σύνολα δεδομένων πραγματικού κόσμου.

Η κλίμακα συνδύασε αρχικά λογισμικό με δεδομένα πραγματικών εικόνων, κειμένου, φωνής και βίντεο που επισημάνθηκαν από ανθρώπους για να δώσει στις εταιρείες αυτόνομων οχημάτων τα δεδομένα που απαιτούνται για την εκπαίδευση μοντέλων μηχανικής εκμάθησης για την ανάπτυξη και ανάπτυξη ρομποτοξί, αυτοοδηγούμενων φορτηγών και αυτοματοποιημένων ρομπότ που χρησιμοποιούνται σε αποθήκες και παράδοση ζήτησης. Έκτοτε, η startup μετατράπηκε σε μια εταιρεία πλατφόρμας διαχείρισης δεδομένων με πελάτες που εκτείνονται σε κυβερνητικούς, χρηματοοικονομικούς, ηλεκτρονικό εμπόριο, αυτόνομα οχήματα και επιχειρήσεις.

Ο ιδρυτής και διευθύνων σύμβουλος Alexandr Wang περιέγραψε τη νέα του προσφορά ως μια υβριδική προσέγγιση δεδομένων, παρόμοια με το κρέας που καλλιεργείται στο εργαστήριο.

«Ξεκινάμε με πραγματικά δεδομένα, όπως ακριβώς το πώς το κρέας που καλλιεργείται στο εργαστήριο ξεκινά από πραγματικά ζωικά κύτταρα, και στη συνέχεια αναπτύσσεται και επαναλαμβάνει και φτιάχνει το προϊόν από εκεί», είπε στο TechCrunch. Χρησιμοποιώντας δεδομένα πραγματικού κόσμου ως βάση για τη δημιουργία συνθετικών δεδομένων, η εταιρεία είναι σε θέση να προσφέρει μια πραγματικά μοναδική και ισχυρή προσφορά για τους πελάτες, είπε ο Wang, προσθέτοντας ότι αυτό ήταν ένα κενό που είδαν στην αγορά.

Οι πελάτες της κλίμακας είδαν αυτό το κενό επίσης. Η ώθηση της εταιρείας στα συνθετικά δεδομένα ήταν ως απάντηση στη ζήτηση των πελατών της, είπε ο Wang στο TechCrunch, ο οποίος είπε ότι ξεκίνησαν να κατασκευάζουν το προϊόν πριν από λιγότερο από ένα χρόνο. Η εταιρεία ανάπτυξης τεχνολογίας αυτόνομων οχημάτων Kodiak Robotics, η Tractable AI και το Υπουργείο Άμυνας των ΗΠΑ χρησιμοποίησαν την Scale για το νέο προϊόν συνθετικών δεδομένων, είπε ο Wang.

Η Scale, η οποία σήμερα απασχολεί περίπου 450 υπαλλήλους, θεωρεί τα συνθετικά δεδομένα ως κορυφαία προτεραιότητα το 2022 και έναν τομέα στον οποίο θα συνεχίσει να επενδύει καθώς αναπτύσσει τη σειρά προϊόντων της. Αλλά αυτό δεν σημαίνει ότι θα αναλάβει την επιχείρηση πραγματικών δεδομένων. Ο Wang βλέπει τα συνθετικά δεδομένα ως ένα συμπληρωματικό εργαλείο που θα βοηθήσει τους προγραμματιστές «να κερδίσουν περισσότερα χρήματα από τους αλγορίθμους τους και άλλες τεχνητές νοημοσύνη και ιδιαίτερα με τις ακραίες θήκες.

Για παράδειγμα, οι εταιρείες αυτόνομων οχημάτων συνήθως χρησιμοποιούν προσομοίωση για να αναδημιουργήσουν σενάρια από τον πραγματικό κόσμο και να τα αναπαράγουν για να δουν πώς θα το χειριστεί το αυτόνομο σύστημα. Αλλά τα δεδομένα του πραγματικού κόσμου μπορεί να μην παρέχουν το σενάριο που αναζητούν.

«Δεν αντιμετωπίζετε σενάρια στον πραγματικό κόσμο πολύ συχνά, όπου μπορεί να υπάρχουν, για παράδειγμα 100 ποδηλάτες που διασχίζουν ταυτόχρονα», εξήγησε ο Wang. «Μπορούμε να ξεκινήσουμε από δεδομένα του πραγματικού κόσμου και στη συνέχεια να προσθέσουμε συνθετικά όλους τους ποδηλάτες ή όλους τους ανθρώπους και μετά με αυτόν τον τρόπο, μπορείτε να εκπαιδεύσετε σωστά τον αλγόριθμο».

Πηγή: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Σφραγίδα ώρας:

Περισσότερα από TechCrunch