Scale AI 进入合成数据游戏

源节点: 1599948

Scale AI 成为一家价值 7.3 亿美元的公司的道路是由来自图像、文本、语音和视频的真实数据铺就的。现在,它正在利用这一基础进入合成数据游戏,这是人工智能领域最热门和新兴的类别之一。

他们周三宣布了一项抢先体验计划 规模合成据该公司称,机器学习工程师可以使用该产品来增强他们现有的现实世界数据集。 Scale 聘请了两名高管来建立这个新的业务部门。 Scale 聘请了 Joel Kronander 担任新的合成数据负责人,Joel Kronander 曾在 Nines 负责机器学习,也曾是苹果公司从事 3D 地图工作的计算机视觉工程师。该公司还聘请 Vivek Raju Muppalla 担任合成服务总监。 Muppalla 此前曾担任 Unity Technologies 的人工智能和模拟工程总监。

合成数据顾名思义:由机器学习算法创建的虚假数据,而不是使用来自现实世界的信息。当隐私成为首要问题时,它可以成为生成数据(例如医学成像)的强大且方便的工具。 开发人员可以使用合成数据来增加训练模型的复杂性,并帮助消除在收集的真实数据集中经常出现的偏差。

Scale 最初将软件与人们标记的真实图像、文本、语音和视频数据相结合,为自动驾驶汽车公司提供训练机器学习模型所需的标记数据,以开发和部署机器人出租车、自动驾驶卡车以及在仓库和现场使用的自动化机器人。要求交货。此后,这家初创公司已发展成为一家数据管理平台公司,客户遍及政府、金融、电子商务、自动驾驶汽车和企业行业。

创始人兼首席执行官 Alexandr Wang 将其新产品描述为一种混合数据方法,类似于实验室培育的肉类。

“我们从真实的数据开始,就像实验室培育的肉类从真实的动物细胞开始一样,然后从那里生长、迭代并构建产品,”他告诉 TechCrunch。王说,通过使用现实世界的数据作为创建合成数据的基础,该公司能够为客户提供真正独特且强大的产品,并补充说这是他们在市场上看到的差距。

规模客户也看到了这一差距。 Wang 告诉 TechCrunch,该公司推出合成数据是为了响应客户的需求,并表示他们不到一年前就开始开发该产品。 Wang 表示,自动驾驶汽车技术开发商 Kodiak Robotics、Tractable AI 和美国国防部都已利用 Scale 来开发其新的合成数据产品。

Scale 目前拥有约 450 名员工,该公司将合成数据视为 2022 年的首要任务,也是该公司在构建产品线时将继续投资的领域。但这并不意味着它将接管其真正的数据业务。 Wang 将合成数据视为一种补充工具,将帮助开发人员“从算法和其他人工智能中获得更多收益,特别是在边缘情况下。”

例如,自动驾驶汽车公司通常使用模拟来重新创建现实世界的场景,并回放它以了解自动驾驶系统将如何处理它。但现实世界的数据可能无法提供他们正在寻找的场景。

“在现实世界中,你不会经常遇到这样的情况,比如 100 名骑自行车的人同时过马路,”Wang 解释道。 “我们可以从现实世界的数据开始,然后综合添加所有骑自行车的人或所有的人,这样就可以正确地训练算法。”

来源:https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

时间戳记:

更多来自 Techcrunch的