Scale AI entre dans le jeu des données synthétiques

Nœud source: 1599948

Le chemin de Scale AI pour devenir une entreprise de 7.3 milliards de dollars a été pavé de données réelles provenant d'images, de texte, de voix et de vidéo. Aujourd’hui, elle utilise cette base pour se lancer dans le jeu des données synthétiques, l’une des catégories les plus en vogue et émergentes de l’IA.

Ils ont annoncé mercredi un programme d'accès anticipé à Échelle synthétique, un produit que les ingénieurs en apprentissage automatique peuvent utiliser pour améliorer leurs ensembles de données réels existants, selon l'entreprise. Scale a embauché deux cadres pour développer cette nouvelle division de son activité. Scale a embauché Joel Kronander, qui dirigeait auparavant l'apprentissage automatique chez Nines et était un ancien ingénieur en vision par ordinateur chez Apple travaillant sur la cartographie 3D, en tant que nouveau responsable des données synthétiques. La société a également embauché Vivek Raju Muppalla en tant que directeur des services synthétiques. Muppalla était auparavant directeur de l'ingénierie pour l'IA et la simulation chez Unity Technologies.

Les données synthétiques sont, comme cela peut paraître, de fausses données créées par des algorithmes d'apprentissage automatique plutôt que d'utiliser des informations du monde réel. Il peut s’agir d’un outil puissant et pratique pour générer des données – comme l’imagerie médicale – lorsque la confidentialité est une préoccupation majeure. Les développeurs peuvent utiliser des données synthétiques pour ajouter plus de complexité à leurs modèles de formation et contribuer à éliminer les biais que l'on retrouve souvent dans les ensembles de données collectées dans le monde réel.

Scale combinait initialement un logiciel avec des images réelles, du texte, des données vocales et vidéo étiquetées par des personnes pour fournir aux entreprises de véhicules autonomes les données étiquetées nécessaires pour former des modèles d'apprentissage automatique afin de développer et de déployer des robots-taxis, des camions autonomes et des robots automatisés utilisés dans les entrepôts et sur- exiger la livraison. La startup s'est depuis transformée en une société de plateforme de gestion de données avec des clients couvrant les secteurs du gouvernement, de la finance, du commerce électronique, des véhicules autonomes et des entreprises.

Le fondateur et PDG Alexandr Wang a décrit sa nouvelle offre comme une approche hybride des données, semblable à la viande cultivée en laboratoire.

"Nous commençons avec des données réelles, tout comme la façon dont la viande cultivée en laboratoire part de vraies cellules animales, puis nous grandissons, itérons et construisons le produit à partir de là", a-t-il déclaré à TechCrunch. En utilisant des données du monde réel comme base pour créer des données synthétiques, l'entreprise est en mesure de proposer une offre vraiment unique et puissante aux clients, a déclaré Wang, ajoutant qu'il s'agissait d'une lacune qu'elle avait constatée sur le marché.

Les clients Scale ont également constaté cet écart. La poussée de l'entreprise vers les données synthétiques répondait à la demande de ses clients, a déclaré Wang à TechCrunch, qui a déclaré avoir commencé à développer le produit il y a moins d'un an. Le développeur de technologies de véhicules autonomes Kodiak Robotics, Tractable AI et le ministère américain de la Défense ont tous fait appel à Scale pour son nouveau produit de données synthétiques, a déclaré Wang.

Scale, qui emploie aujourd'hui environ 450 employés, considère les données synthétiques comme une priorité absolue en 2022 et un domaine dans lequel elle continuera d'investir au fur et à mesure du développement de sa gamme de produits. Mais cela ne signifie pas qu’il reprendra son véritable activité de données. Wang considère les données synthétiques comme un outil complémentaire qui aidera les développeurs à « tirer le meilleur parti de leurs algorithmes et autres IA, en particulier dans les cas extrêmes ».

Par exemple, les constructeurs de véhicules autonomes utilisent généralement la simulation pour recréer des scénarios du monde réel et les rejouer pour voir comment le système autonome les gérera. Mais les données réelles pourraient ne pas fournir le scénario recherché.

"Dans le monde réel, on ne rencontre pas trop souvent des scénarios où, par exemple, 100 cyclistes traversent en même temps", a expliqué Wang. "Nous pouvons partir de données du monde réel, puis ajouter synthétiquement tous les cyclistes ou toutes les personnes et ainsi, vous pouvez entraîner l'algorithme correctement."

Source : https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Horodatage:

Plus de Techcrunch