A Scale AI bekerül a szintetikus adatjátékba

Forrás csomópont: 1599948

A Scale AI útja a 7.3 milliárd dolláros vállalattá váláshoz a képekből, szövegekből, hangokból és videókból származó valós adatokkal volt kikövezve. Most ezt az alapot használja, hogy bekerüljön a szintetikus adatjátékba, amely az AI egyik legforróbb és feltörekvő kategóriája.

Szerdán bejelentették a korai hozzáférési programot Mérleg szintetikus, egy olyan termék, amelyet a gépi tanulási mérnökök a meglévő valós adatkészleteik bővítésére használhatnak a vállalat szerint. A Scale két vezetőt fogadott fel, hogy kiépítsék üzletének ezt az új részlegét. A Scale felvette a szintetikus adatokért felelős új vezetőjének Joel Kronandert, aki korábban a Nines gépi tanulásának vezetője volt, és az Apple korábbi számítógépes látásmérnöke volt, aki 3D-s térképezéssel foglalkozott. A cég Vivek Raju Muppalla-t is felvette a szintetikus szolgáltatások igazgatójaként. Muppalla korábban a Unity Technologies mesterséges intelligenciáért és szimulációért felelős mérnöki igazgatója volt.

A szintetikus adatok olyanok, amilyennek hangzik: hamis adatok, amelyeket gépi tanulási algoritmusok hoztak létre, nem pedig a való világból származó információkat. Hatékony és praktikus eszköz lehet adatok generálására – például orvosi képalkotásra –, amikor a magánélet a legfontosabb szempont. A fejlesztők szintetikus adatok segítségével összetettebbé tehetik képzési modelleiket, és segíthetnek eltávolítani a torzításokat, amelyek gyakran megtalálhatók az összegyűjtött valós adatkészletekben.

Kezdetben az emberek által felcímkézett valós képekkel, szövegekkel, hang- és videoadatokkal kombinált szoftverek méretezése annak érdekében, hogy az autonóm járműgyártó cégek megkapják a gépi tanulási modellek betanításához szükséges címkézett adatokat a robotaxis, az önvezető teherautók és a raktárakban használt automatizált robotok fejlesztéséhez és telepítéséhez. szállítási igény. A startup azóta egy adatkezelő platform vállalattá fejlődött, amelynek ügyfelei a kormányzat, a pénzügyek, az e-kereskedelem, az autonóm járművek és a vállalati iparágakban működnek.

Alexandr Wang alapítója és vezérigazgatója úgy jellemezte új ajánlatát, mint az adatok hibrid megközelítését, amely hasonló a laboratóriumban termesztett húshoz.

"Valódi adatokkal kezdjük, mint ahogyan a laboratóriumban termesztett hús valódi állati sejtekből indul ki, majd növesztjük, ismételjük, és onnan építjük fel a terméket" - mondta a TechCrunchnak. Azáltal, hogy valós adatokat használ a szintetikus adatok létrehozásához, a vállalat valóban egyedi és hatékony ajánlatot tud kínálni az ügyfelek számára, mondta Wang, hozzátéve, hogy ez egy hiányosság a piacon.

A méretarányos ügyfelek is látták ezt a hiányt. Wang a TechCrunch-nak elmondta, hogy a cég a szintetikus adatok felé mozdult az ügyfelei keresletére válaszul. Az autonóm járműtechnológiát fejlesztő Kodiak Robotics, a Tractable AI és az Egyesült Államok Védelmi Minisztériuma mind a Scale-t használta új szintetikus adattermékéhez, mondta Wang.

A ma körülbelül 450 alkalmazottat foglalkoztató Scale 2022-ben a szintetikus adatokat tekinti a legfontosabb prioritásnak, és egy olyan területnek tekinti, amelybe a termékcsalád kiépítése során továbbra is befektet. Ez azonban nem jelenti azt, hogy átveszi valódi adatforgalmát. Wang a szintetikus adatokat kiegészítő eszköznek tekinti, amely segít a fejlesztőknek „többet kihozni az algoritmusokból és más mesterséges intelligenciákból, különösen a szélső esetekben.

Például az autonóm járműgyártó cégek jellemzően szimulációt használnak a valós világból származó forgatókönyvek újraalkotására, majd azok visszajátszására, hogy megnézzék, hogyan kezeli az autonóm rendszer. A valós adatok azonban nem biztos, hogy azt a forgatókönyvet nyújtják, amit keresnek.

„A való világban nem túl gyakran találkozunk olyan forgatókönyvekkel, amelyekben akár 100 kerékpáros is átkelhet egyszerre” – magyarázta Wang. „Kiindulhatunk valós adatokból, majd szintetikusan hozzáadhatjuk az összes kerékpárost vagy az összes embert, és így megfelelően betaníthatjuk az algoritmust.”

Forrás: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Időbélyeg:

Még több TechCrunch