Scale AI kommer inn i det syntetiske dataspillet

Kilde node: 1599948

Scale AIs vei til å bli et selskap på 7.3 milliarder dollar ble banet i ekte data fra bilder, tekst, tale og video. Nå bruker den det grunnlaget for å komme inn i det syntetiske dataspillet, en av de hotteste og nye kategoriene innen AI.

De annonserte onsdag et tidlig tilgangsprogram til Skala Syntetisk, et produkt som maskinlæringsingeniører kan bruke til å forbedre sine eksisterende datasett fra den virkelige verden, ifølge selskapet. Scale hyret inn to ledere for å bygge ut denne nye divisjonen av virksomheten. Scale ansatte Joel Kronander, som tidligere ledet maskinlæring hos Nines og var en tidligere datasynsingeniør hos Apple som jobbet med 3D-kartlegging, som sin nye leder for syntetiske data. Selskapet ansatte også Vivek Raju Muppalla som direktør for syntetiske tjenester. Muppalla var tidligere direktør for ingeniørfag for AI og simulering hos Unity Technologies.

Syntetiske data er som det høres ut: falske data som er skapt av maskinlæringsalgoritmer i stedet for å bruke informasjon fra den virkelige verden. Det kan være et kraftig og hendig verktøy for å generere data – som medisinsk bildebehandling – når personvern er en stor bekymring. Utviklere kan bruke syntetiske data for å legge til mer kompleksitet til treningsmodellene sine og bidra til å fjerne skjevheter som ofte finnes i innsamlede datasett fra den virkelige verden.

Skala kombinerte i utgangspunktet programvare med ekte bilder, tekst, tale og videodata merket av mennesker for å gi autonome kjøretøyselskaper de merkede dataene som trengs for å trene maskinlæringsmodeller til å utvikle og distribuere robotakser, selvkjørende lastebiler og automatiserte roboter som brukes i varehus og på- kreve levering. Oppstarten har siden forvandlet seg til et dataadministrasjonsplattformselskap med kunder som spenner over myndigheter, finans, e-handel, autonome kjøretøy og bedriftsindustri.

Grunnlegger og administrerende direktør Alexandr Wang beskrev det nye tilbudet som en hybrid tilnærming til data, beslektet med laboratoriedyrket kjøtt.

"Vi starter med ekte data, akkurat som hvordan laboratoriedyrket kjøtt starter fra ekte dyreceller, og deretter vokser og itererer og bygger produktet derfra," sa han til TechCrunch. Ved å bruke virkelige data som grunnlag for å lage syntetiske data, er selskapet i stand til å tilby et virkelig unikt og kraftig tilbud for kunder, sa Wang og la til at dette var et gap de så i markedet.

Skalakunder så også dette gapet. Selskapets push til syntetiske data var som svar på etterspørsel fra kundene, fortalte Wang TechCrunch, som sa at de begynte å bygge ut produktet for mindre enn ett år siden. Den autonome kjøretøyteknologiutvikleren Kodiak Robotics, Tractable AI og det amerikanske forsvarsdepartementet har alle benyttet Scale for sitt nye syntetiske dataprodukt, sa Wang.

Scale, som i dag sysselsetter rundt 450 ansatte, ser på syntetiske data som en topp prioritet i 2022, og et område de vil fortsette å investere i etter hvert som de bygger ut sin produktlinje. Men det betyr ikke at den vil ta over sin virkelige datavirksomhet. Wang ser på syntetiske data som et komplementært verktøy som vil hjelpe utviklere å "få mer igjen for pengene sine ut av algoritmene og annen AI, og spesielt med edge-tilfeller.

For eksempel bruker autonome kjøretøyselskaper vanligvis simulering for å gjenskape scenarier fra den virkelige verden og spille dem tilbake for å se hvordan det autonome systemet vil håndtere det. Men data fra den virkelige verden gir kanskje ikke scenariet de leter etter.

"Du støter ikke på scenarier i den virkelige verden for ofte der det kan være, for eksempel 100 syklister som krysser på en gang," forklarte Wang. "Vi kan starte fra virkelige data og deretter syntetisk legge til alle syklistene eller alle menneskene, og på den måten kan du trene algoritmen ordentlig."

Kilde: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Tidstempel:

Mer fra TechCrunch