Scale AI kommer ind i det syntetiske dataspil

Kildeknude: 1599948

Scale AI's vej til at blive en virksomhed til $7.3 milliarder var banet i rigtige data fra billeder, tekst, stemme og video. Nu bruger den det fundament til at komme ind i det syntetiske dataspil, en af ​​de hotteste og nye kategorier inden for AI.

De annoncerede onsdag et program for tidlig adgang til Skala Syntetisk, et produkt, som maskinlæringsingeniører kan bruge til at forbedre deres eksisterende datasæt fra den virkelige verden, ifølge virksomheden. Scale hyrede to ledere til at opbygge denne nye division af virksomheden. Scale hyrede Joel Kronander, der tidligere stod i spidsen for maskinlæring hos Nines og var tidligere computer vision-ingeniør hos Apple, der arbejdede på 3D-kortlægning, som sin nye leder af syntetiske data. Virksomheden hyrede også Vivek Raju Muppalla som direktør for syntetiske tjenester. Muppalla var tidligere direktør for engineering for AI og simulering hos Unity Technologies.

Syntetiske data er, som det lyder: falske data, der er blevet skabt af maskinlæringsalgoritmer i stedet for at bruge information fra den virkelige verden. Det kan være et kraftfuldt og handy værktøj til at generere data - som medicinsk billedbehandling - når privatlivets fred er en stor bekymring. Udviklere kan bruge syntetiske data til at tilføje mere kompleksitet til deres træningsmodeller og hjælpe med at fjerne skævheder, som ofte kan findes i indsamlede datasæt fra den virkelige verden.

Skala kombinerede oprindeligt software med rigtige billeder, tekst-, stemme- og videodata mærket af mennesker for at give autonome køretøjsvirksomheder de mærkede data, der er nødvendige for at træne maskinlæringsmodeller til at udvikle og implementere robotakser, selvkørende lastbiler og automatiserede bots, der bruges i varehuse og på- efterspørge levering. Startup'et har siden udviklet sig til en datastyringsplatformvirksomhed med kunder, der spænder over regering, finans, e-handel, autonome køretøjer og virksomhedsindustrier.

Grundlægger og administrerende direktør Alexandr Wang beskrev dets nye tilbud som en hybrid tilgang til data, beslægtet med laboratoriedyrket kød.

"Vi starter med rigtige data, ligesom hvordan laboratoriedyrket kød starter fra rigtige dyreceller, og derefter vokser og itererer og bygger produktet derfra," fortalte han TechCrunch. Ved at bruge data fra den virkelige verden som base for at skabe syntetiske data, er virksomheden i stand til at tilbyde et virkelig unikt og kraftfuldt tilbud til kunderne, sagde Wang og tilføjede, at dette var et hul, de så på markedet.

Skalakunder så også dette hul. Virksomhedens skub til syntetiske data var som reaktion på efterspørgsel fra dets kunder, fortalte Wang TechCrunch, som sagde, at de begyndte at bygge produktet ud for mindre end et år siden. Den autonome køretøjsteknologiudvikler Kodiak Robotics, Tractable AI og det amerikanske forsvarsministerium har alle benyttet Scale for sit nye syntetiske dataprodukt, sagde Wang.

Scale, som i dag beskæftiger omkring 450 medarbejdere, ser syntetiske data som en topprioritet i 2022, og et område, som de vil fortsætte med at investere i, efterhånden som de bygger sin produktlinje ud. Men det betyder ikke, at den vil overtage sin reelle dataforretning. Wang ser syntetiske data som et komplementært værktøj, der vil hjælpe udviklere med at "få mere valuta for pengene ud af deres algoritmer og anden AI og især med edge-cases.

For eksempel bruger autonome køretøjsfirmaer typisk simulering til at genskabe scenarier fra den virkelige verden og afspille dem for at se, hvordan det autonome system vil håndtere det. Men data fra den virkelige verden giver muligvis ikke det scenarie, de leder efter.

"Man støder ikke for ofte ind i scenarier i den virkelige verden, hvor der kan være, for eksempel 100 cyklister, der krydser på én gang," forklarede Wang. "Vi kan starte fra virkelige data og derefter syntetisk tilføje alle cyklister eller alle personer, og så på den måde kan du træne algoritmen ordentligt."

Kilde: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Tidsstempel:

Mere fra TechCrunch