Scale AI wchodzi do gry na syntetycznych danych

Węzeł źródłowy: 1599948

Skalowalna droga AI do stania się firmą o wartości 7.3 miliarda dolarów została utorowana rzeczywistymi danymi z obrazów, tekstu, głosu i wideo. Teraz wykorzystuje tę podstawę, aby wejść do gry na syntetycznych danych, jednej z najgorętszych i rozwijających się kategorii w sztucznej inteligencji.

Ogłosili w środę program wczesnego dostępu do Skala syntetyczna, produkt, który według firmy inżynierowie zajmujący się uczeniem maszynowym mogą wykorzystać do ulepszenia swoich istniejących zestawów danych w świecie rzeczywistym. Firma Scale zatrudniła dwóch dyrektorów do zbudowania nowego działu swojej działalności. Scale zatrudniła Joela Kronandera, który wcześniej kierował uczeniem maszynowym w firmie Nines i był byłym inżynierem komputerowym w Apple pracującym nad mapowaniem 3D, jako nowego szefa ds. danych syntetycznych. Firma zatrudniła również Viveka Raju Muppallę jako dyrektora ds. usług syntetycznych. Muppalla był wcześniej dyrektorem inżynierii ds. sztucznej inteligencji i symulacji w Unity Technologies.

Dane syntetyczne są takie, jak się wydaje: fałszywe dane, które zostały stworzone przez algorytmy uczenia maszynowego, zamiast wykorzystywać informacje z rzeczywistego świata. Może być potężnym i poręcznym narzędziem do generowania danych — takich jak obrazowanie medyczne — gdy prywatność jest głównym problemem. Deweloperzy mogą używać danych syntetycznych, aby zwiększyć złożoność swoich modeli szkoleniowych i pomóc w usuwaniu błędów systematycznych, które często można znaleźć w zebranych rzeczywistych zestawach danych.

Skaluj początkowo połączone oprogramowanie z rzeczywistymi obrazami, tekstem, głosem i danymi wideo oznaczonymi przez ludzi, aby zapewnić firmom zajmującym się pojazdami autonomicznymi oznakowane dane potrzebne do trenowania modeli uczenia maszynowego w celu opracowania i wdrożenia robotosi, samojezdnych ciężarówek i zautomatyzowanych botów używanych w magazynach i na- dostawa na żądanie. Od tego czasu startup przekształcił się w firmę zajmującą się platformą zarządzania danymi z klientami z sektora rządowego, finansowego, e-commerce, pojazdów autonomicznych i przedsiębiorstw.

Założyciel i dyrektor generalny Alexandr Wang opisał swoją nową ofertę jako hybrydowe podejście do danych, podobne do mięsa hodowanego w laboratorium.

„Zaczynamy od prawdziwych danych, tak jak mięso hodowane w laboratorium zaczyna się od prawdziwych komórek zwierzęcych, a następnie rośniemy, iterujemy i budujemy produkt stamtąd”, powiedział TechCrunch. Wykorzystując dane ze świata rzeczywistego jako podstawę do tworzenia danych syntetycznych, firma jest w stanie zaoferować klientom naprawdę wyjątkową i potężną ofertę, powiedział Wang, dodając, że była to luka, którą widzieli na rynku.

Klienci firmy Scale również dostrzegli tę lukę. Nacisk firmy na dane syntetyczne był odpowiedzią na zapotrzebowanie ze strony klientów, powiedział Wang TechCrunch, który powiedział, że rozpoczęli tworzenie produktu niecały rok temu. Wang powiedział, że firma Kodiak Robotics, twórca technologii pojazdów autonomicznych, Tractable AI i Departament Obrony USA, wykorzystali Scale do swojego nowego produktu danych syntetycznych.

Firma Scale, która obecnie zatrudnia około 450 pracowników, uważa syntetyczne dane za najwyższy priorytet w 2022 r. i obszar, w który będzie nadal inwestować, rozbudowując swoją linię produktów. Ale to nie znaczy, że przejmie swoją prawdziwą działalność związaną z danymi. Wang postrzega dane syntetyczne jako uzupełniające narzędzie, które pomoże programistom „uzyskać większy zwrot z ich algorytmów i innej sztucznej inteligencji, a zwłaszcza w skrajnych przypadkach.

Na przykład firmy produkujące pojazdy autonomiczne zazwyczaj używają symulacji do odtworzenia scenariuszy ze świata rzeczywistego i odtworzenia ich, aby zobaczyć, jak poradzi sobie z tym system autonomiczny. Jednak dane ze świata rzeczywistego mogą nie zapewniać oczekiwanego przez nich scenariusza.

„Nie natrafia się zbyt często na scenariusze w prawdziwym świecie, w których może być, powiedzmy, 100 rowerzystów przejeżdżających jednocześnie” – wyjaśnił Wang. „Możemy zacząć od rzeczywistych danych, a następnie syntetycznie dodać wszystkich rowerzystów lub wszystkich ludzi, a następnie w ten sposób można odpowiednio wytrenować algorytm”.

Źródło: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Znak czasu:

Więcej z Techcrunch