Scale AI kommer in i det syntetiska dataspelet

Källnod: 1599948

Scale AI:s väg till att bli ett företag på 7.3 miljarder dollar var banad i verklig data från bilder, text, röst och video. Nu använder den den grunden för att komma in i det syntetiska dataspelet, en av de hetare och framväxande kategorierna inom AI.

De tillkännagav på onsdagen ett program för tidig tillgång till Skala Syntet, en produkt som maskininlärningsingenjörer kan använda för att förbättra sina befintliga verkliga datamängder, enligt företaget. Scale anställde två chefer för att bygga ut denna nya division av sin verksamhet. Scale anställde Joel Kronander, som tidigare ledde maskininlärning på Nines och var en före detta datorseendeingenjör på Apple som arbetade med 3D-kartläggning, som sin nya chef för syntetisk data. Företaget anställde också Vivek Raju Muppalla som sin chef för syntetiska tjänster. Muppalla var tidigare chef för teknik för AI och simulering på Unity Technologies.

Syntetisk data är som det låter: falsk data som har skapats av maskininlärningsalgoritmer snarare än att använda information från den verkliga världen. Det kan vara ett kraftfullt och praktiskt verktyg för att generera data - som medicinsk bildbehandling - när integritet är ett av de största problemen. Utvecklare kan använda syntetisk data för att lägga till mer komplexitet till sina träningsmodeller och hjälpa till att ta bort fördomar som ofta kan hittas i insamlade verkliga datamängder.

Skala kombinerade initialt mjukvara med riktiga bilder, text, röst och videodata märkta av människor för att ge autonoma fordonsföretag den märkta data som behövs för att träna maskininlärningsmodeller för att utveckla och distribuera robotaxlar, självkörande lastbilar och automatiserade robotar som används i lager och på- begära leverans. Startupen har sedan dess förvandlats till ett datahanteringsplattformsföretag med kunder som spänner över myndigheter, finans, e-handel, autonoma fordon och företagsindustrier.

Grundaren och VD:n Alexandr Wang beskrev sitt nya erbjudande som en hybridinställning till data, besläktad med labbodlat kött.

"Vi börjar med riktiga data, precis som hur labbodlat kött börjar från riktiga djurceller, och sedan växer och itererar och bygger produkten därifrån," sa han till TechCrunch. Genom att använda verklig data som bas för att skapa syntetisk data kan företaget erbjuda ett riktigt unikt och kraftfullt erbjudande för kunder, sa Wang och tillade att detta var en lucka de såg på marknaden.

Skalkunder såg också det gapet. Företagets satsning på syntetisk data var ett svar på efterfrågan från sina kunder, berättade Wang för TechCrunch, som sa att de började bygga ut produkten för mindre än ett år sedan. Autonoma fordonsteknologiutvecklare Kodiak Robotics, Tractable AI och det amerikanska försvarsdepartementet har alla utnyttjat Scale för sin nya syntetiska dataprodukt, sa Wang.

Scale, som idag sysselsätter cirka 450 anställda, ser syntetisk data som en högsta prioritet 2022, och ett område som man kommer att fortsätta att investera i när man bygger ut sin produktlinje. Men det betyder inte att det kommer att ta över sin verkliga dataverksamhet. Wang ser syntetisk data som ett kompletterande verktyg som kommer att hjälpa utvecklare att "få mer valuta för pengarna av sina algoritmer och annan AI och särskilt med kantfall.

Till exempel använder autonoma fordonsföretag vanligtvis simulering för att återskapa scenarier från den verkliga världen och spela upp det för att se hur det autonoma systemet kommer att hantera det. Men verklig data kanske inte ger det scenario de letar efter.

"Man stöter inte på scenarier i den verkliga världen för ofta där det kan finnas, säg 100 cyklister som korsar samtidigt," förklarade Wang. "Vi kan utgå från verkliga data och sedan syntetiskt lägga till alla cyklister eller alla människor och sedan på det sättet kan du träna algoritmen ordentligt."

Källa: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Tidsstämpel:

Mer från TechCrunch