Scale AI entra nel gioco dei dati sintetici

Nodo di origine: 1599948

Il percorso dell'intelligenza artificiale per diventare un'azienda da 7.3 miliardi di dollari è stato lastricato di dati reali provenienti da immagini, testo, voce e video. Ora sta utilizzando queste basi per entrare nel gioco dei dati sintetici, una delle categorie più calde ed emergenti dell’intelligenza artificiale.

Mercoledì hanno annunciato un programma di accesso anticipato a Scala sintetica, secondo l'azienda, un prodotto che gli ingegneri dell'apprendimento automatico possono utilizzare per migliorare i loro set di dati esistenti nel mondo reale. Scale ha assunto due dirigenti per costruire questa nuova divisione della propria attività. Scale ha assunto Joel Kronander, che in precedenza era a capo del machine learning presso Nines ed era un ex ingegnere di visione artificiale presso Apple che lavorava sulla mappatura 3D, come nuovo capo dei dati sintetici. La società ha anche assunto Vivek Raju Muppalla come direttore dei servizi sintetici. Muppalla è stato in precedenza direttore dell'ingegneria per l'intelligenza artificiale e la simulazione presso Unity Technologies.

I dati sintetici sono come sembrano: dati falsi creati da algoritmi di apprendimento automatico anziché utilizzare informazioni provenienti dal mondo reale. Può essere uno strumento potente e pratico per generare dati, come l’imaging medico, quando la privacy è una delle principali preoccupazioni. Gli sviluppatori possono utilizzare dati sintetici per aggiungere maggiore complessità ai propri modelli di formazione e contribuire a rimuovere i pregiudizi che spesso si possono riscontrare nei set di dati raccolti nel mondo reale.

Scalare il software inizialmente combinato con immagini reali, testo, dati vocali e video etichettati da persone per fornire alle aziende produttrici di veicoli autonomi i dati etichettati necessari per addestrare modelli di apprendimento automatico per sviluppare e distribuire robotaxi, camion a guida autonoma e robot automatizzati utilizzati nei magazzini e nei trasporti. richiedere la consegna. Da allora la startup si è trasformata in una società di piattaforme di gestione dei dati con clienti che spaziano dai settori governativo, finanziario, e-commerce, dei veicoli autonomi e aziendale.

Il fondatore e CEO Alexandr Wang ha descritto la sua nuova offerta come un approccio ibrido ai dati, simile alla carne coltivata in laboratorio.

"Iniziamo con dati reali, proprio come il modo in cui la carne coltivata in laboratorio inizia da cellule animali reali, quindi cresciamo, iteriamo e costruiamo il prodotto da lì", ha detto a TechCrunch. Utilizzando i dati del mondo reale come base per creare dati sintetici, l'azienda è in grado di offrire ai clienti un'offerta davvero unica e potente, ha affermato Wang, aggiungendo che questa era una lacuna che hanno visto nel mercato.

Anche i clienti in scala hanno notato questo divario. La spinta dell'azienda verso i dati sintetici è stata una risposta alla domanda dei suoi clienti, ha detto Wang a TechCrunch, che ha affermato di aver iniziato a sviluppare il prodotto meno di un anno fa. Lo sviluppatore di tecnologia per veicoli autonomi Kodiak Robotics, Tractable AI e il Dipartimento della Difesa degli Stati Uniti hanno tutti sfruttato Scale per il suo nuovo prodotto di dati sintetici, ha affermato Wang.

Scale, che oggi impiega circa 450 dipendenti, considera i dati sintetici una priorità assoluta nel 2022 e un’area in cui continuerà a investire man mano che costruisce la sua linea di prodotti. Ma ciò non significa che rileverà il business dei dati reali. Wang vede i dati sintetici come uno strumento complementare che aiuterà gli sviluppatori a “ottenere il massimo dai loro algoritmi e da altre IA, in particolare con i casi limite.

Ad esempio, le aziende produttrici di veicoli autonomi in genere utilizzano la simulazione per ricreare scenari del mondo reale e riprodurli per vedere come il sistema autonomo li gestirà. Ma i dati del mondo reale potrebbero non fornire lo scenario che stanno cercando.

"Non ci si imbatte troppo spesso in scenari nel mondo reale in cui potrebbero esserci, diciamo, 100 ciclisti che attraversano contemporaneamente", ha spiegato Wang. “Possiamo partire da dati del mondo reale e poi aggiungere sinteticamente tutti i ciclisti o tutte le persone e in questo modo è possibile addestrare adeguatamente l’algoritmo”.

Fonte: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Timestamp:

Di più da Techcrunch