Schaal AI stapt in het spel met synthetische gegevens

Bronknooppunt: 1599948

Het pad van Scale AI om een ​​bedrijf van $7.3 miljard te worden, was geplaveid met echte gegevens uit afbeeldingen, tekst, spraak en video. Nu gebruikt het die basis om deel te nemen aan het synthetische dataspel, een van de populairste en opkomende categorieën in AI.

Ze kondigden woensdag een early access-programma aan Schaal synthetisch, een product dat machine learning-ingenieurs kunnen gebruiken om hun bestaande datasets uit de echte wereld te verbeteren, aldus het bedrijf. Scale heeft twee leidinggevenden ingehuurd om deze nieuwe divisie van het bedrijf uit te bouwen. Scale nam Joel Kronander, die voorheen hoofd machine learning bij Nines was en voormalig computer vision-ingenieur bij Apple was en aan 3D-mapping werkte, aan als nieuw hoofd van synthetische data. Het bedrijf huurde ook Vivek Raju Muppalla in als directeur van synthetische diensten. Muppalla was voorheen technisch directeur voor AI en simulatie bij Unity Technologies.

Synthetische data zijn zoals het klinkt: nepdata die zijn gecreëerd door machine learning-algoritmen in plaats van informatie uit de echte wereld te gebruiken. Het kan een krachtig en handig hulpmiddel zijn voor het genereren van gegevens – zoals medische beeldvorming – wanneer privacy een topprioriteit is. Ontwikkelaars kunnen synthetische data gebruiken om meer complexiteit aan hun trainingsmodellen toe te voegen en vooroordelen weg te nemen die vaak voorkomen in verzamelde datasets uit de echte wereld.

In eerste instantie gecombineerde software schalen met echte afbeeldingen, tekst-, spraak- en videogegevens die door mensen zijn gelabeld om autonome voertuigbedrijven de gelabelde gegevens te geven die nodig zijn om machine learning-modellen te trainen voor het ontwikkelen en inzetten van robotaxis, zelfrijdende vrachtwagens en geautomatiseerde bots die worden gebruikt in magazijnen en op de werkvloer. levering eisen. De startup is sindsdien veranderd in een datamanagementplatformbedrijf met klanten in de overheid, financiën, e-commerce, autonome voertuigen en bedrijfssectoren.

Oprichter en CEO Alexandr Wang omschreef het nieuwe aanbod als een hybride benadering van data, vergelijkbaar met vlees uit laboratoriumteelt.

“We beginnen met echte gegevens, net zoals vlees uit laboratoriumteelt begint met echte dierlijke cellen, en van daaruit groeien en itereren en het product bouwen”, vertelde hij aan TechCrunch. Door data uit de echte wereld te gebruiken als basis voor het creëren van synthetische data, kan het bedrijf klanten een werkelijk uniek en krachtig aanbod bieden, zei Wang, eraan toevoegend dat dit een gat in de markt was dat ze zagen.

Schaalklanten zagen die kloof ook. De stap van het bedrijf naar synthetische data was een reactie op de vraag van zijn klanten, vertelde Wang aan TechCrunch, die zei dat ze minder dan een jaar geleden begonnen met het ontwikkelen van het product. Kodiak Robotics, ontwikkelaar van autonome voertuigtechnologie, Tractable AI en het Amerikaanse ministerie van Defensie hebben allemaal gebruik gemaakt van Scale voor hun nieuwe synthetische dataproduct, aldus Wang.

Scale, dat momenteel ongeveer 450 werknemers in dienst heeft, beschouwt synthetische data als een topprioriteit in 2022, en een gebied waarin het bedrijf zal blijven investeren bij het uitbouwen van zijn productlijn. Maar dat betekent niet dat het zijn echte dataactiviteiten zal overnemen. Wang ziet synthetische data als een aanvullend hulpmiddel dat ontwikkelaars zal helpen “meer waar voor hun geld te krijgen uit hun algoritmen en andere AI, en vooral bij randgevallen.

Autonome voertuigbedrijven gebruiken bijvoorbeeld doorgaans simulatie om scenario's uit de echte wereld na te bootsen en deze af te spelen om te zien hoe het autonome systeem ermee om zal gaan. Maar gegevens uit de echte wereld bieden misschien niet het scenario waarnaar ze op zoek zijn.

"In de echte wereld kom je niet zo vaak scenario's tegen waarbij er bijvoorbeeld honderd fietsers tegelijk oversteken", legt Wang uit. “We kunnen uitgaan van gegevens uit de echte wereld en vervolgens alle fietsers of alle mensen synthetisch toevoegen, zodat je het algoritme op de juiste manier kunt trainen.”

Bron: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Tijdstempel:

Meer van Techcrunch