AI Weekly:DeepMind 的 AlphaCode、自动年龄验证和新的开放语言模型

源节点: 1601380

在 9 月 XNUMX 日的数据峰会上在线加入当今领先的高管。 登记 此处.


本周在 AI 中,DeepMind 详细介绍了一个新的代码生成系统, 字母代码,它声称可以与顶级人类程序员竞争。 英国的连锁超市宣布他们将开始测试自动年龄验证系统,以在购买酒类时估计顾客的年龄。 EleutherAI 是一个专注于开源高性能 AI 系统的研究小组,它发布了 GPT-NeoX-20B,这是一种同类中最大的语言模型。

AlphaCode 是机器编程或自动化软件开发和维护过程的工具的更复杂示例之一。 DeepMind 声称它可以编写“竞赛级别”的代码,在最近 54.3 场编程挑战平台 Codeforces 的竞赛中平均排名在前 10% 之内。

机器编程的应用范围很广——这解释了为什么人们对它充满热情。 根据剑桥大学的一项研究,开发人员至少有一半的精力用于调试,估计软件行业每年为此花费 312 亿美元。 即使将代码库迁移到一种更高效的语言也需要一笔巨款。 例如,澳大利亚联邦银行 花费 在五年内投入约 750 亿美元将其平台从 COBOL 转换为 Java。

AlphaCode 等人工智能代码生成工具有望降低开发成本,同时让编码人员专注于创造性的、重复性较低的任务。 但 AlphaCode 并非完美无缺。 除了是 昂贵 为了维护,它并不总是产生正确的代码,并且可能——如果类似的系统有任何迹象——包含有问题的代码 偏见. 此外,如果它公开可用,恶意行为者可能会滥用它来创建恶意软件, 绕行 编程测试,和 傻瓜 网络安全研究人员。

“[A]虽然将编程的力量赋予不会编程的人的想法令人兴奋,但在我们到达那里之前我们还有很多问题需要解决,”玛丽皇后大学人工智能研究员 Mike Cook伦敦。

自动年龄验证

英国的三个连锁超市——Asada、Co-op 和 Morrisons——正在使用摄像头来估计顾客的年龄,作为英国内政部测试的一部分,内政部是负责移民、安全以及法律和秩序的英国部门。 该技术已经在伦敦 Aldi 的免结账地点使用,它可以使用在“匿名面孔数据库”上训练的算法来猜测同意的顾客的年龄, 根据 给英国广播公司。 如果它决定他们未满 25 岁,他们将必须向工作人员出示身份证件。

提供该技术的公司 Yoti 表示,它在 125,000 多张脸上进行了测试,并猜测年龄在 2.2 岁以内。 但是,尽管 Yoti 表示它不会执行面部识别或保留拍摄的图像,但该系统引发了道德问题。

与其他人工智能系统一样,年龄估计系统可能会放大用于开发系统的数据中的任何偏差。 一项研究 强调化妆的效果,可以遮盖老年斑和皱纹等年龄迹象,并发现年龄估计软件对男性来说往往更准确。 同一项研究发现,该软件高估了年轻的非白种人的年龄,低估了年长的亚裔和黑人的年龄,甚至会受到某人是否微笑的影响。

访问 Yoti 联合创始人兼首席执行官 Robin Tombs 在连线杂志上承认,该公司不确定其 AI 使用哪些面部特征来确定人们的年龄。 虽然他强调 Yoti 的“数十万”面孔训练数据集“在肤色、年龄和性别方面具有代表性”,而且其内部研究显示不同人口统计数据的错误率相似,但 学术文献 似乎另有建议。 Yoti 自己的白皮书显示,这项技术对皮肤较黑的老年女性来说最不准确。

在超市错误估计年龄可能只会带来不便(也许还有尴尬)。 但它可能使技术正常化,导致其他地方出现更多有问题的应用程序。 公民自由组织 Access Now 专注于 AI 的欧洲政策分析师 Daniel Leufer 告诉 Wired,监管机构在考虑用例时应该看看这些系统可能会失败的对象。 “通常,答案是那些经常被其他系统失败的人,”他说。

开源语言模型

EleutherAI 周三 发布 其最新的语言模型 GPT-NeoX-20B,作为其扩大对高性能文本生成 AI 的访问的使命的一部分。 根据 EleutherAI 的说法,GPT-NeoX-20B 现在可以通过 API 获得,下周将以开源形式获得,在多个领域优于其他公共语言模型,同时通常部署成本更低。

GPT-NeoX-20B——在专业云提供商 CoreWeave 提供的基础设施上开发——在 EleutherAI 的 825GB 文本数据集上进行了训练,包含 20 亿个参数,大约比 OpenAI 的 GPT-9 少 3 倍。 在机器学习中,参数是从历史训练数据中学习的模型的一部分。 一般来说,在语言领域,参数数量和复杂度之间的相关性非常好。

EleutherAI 并未声称 GPT-NeoX-20B 解决了困扰当前语言模型的任何主要问题,包括偏见和毒性等方面。 但该组织坚持认为,发布该模型以及其他类似模型的好处大于风险。 从头开始训练语言模型可能要花费数百万美元,而推理——(即实际运行经过训练的模型)是另一个障碍。 据估计,在单个 Amazon Web Services 实例上运行 GPT-3 的成本每年至少为 87,000 美元。

“从垃圾邮件和 astroturfing 到聊天机器人成瘾,今天使用这些模型已经可以体现出明显的危害,我们预计未来模型的一致性至关重要。 我们认为加速安全研究非常重要,”EleutherAI 联合创始人 Connor Leahy 在一份声明中说。

EleutherAI 之前的模型已经催生了全新的人工智能即服务初创公司。 如果历史有任何迹象,GPT-NeoX-20B 也会做同样的事情。

有关AI报道,请发送新闻提示至 凯尔·威格斯(Kyle Wiggers) —并确保订阅 人工智能周刊 并标记我们的AI频道, 机器.

感谢您的阅读,

凯尔·威格斯(Kyle Wiggers)

人工智能资深撰稿人

VentureBeat 的使命 将成为技术决策者获取有关变革性企业技术和交易知识的数字城镇广场。 了解更多

来源:https://venturebeat.com/2022/02/04/ai-weekly-deepminds-alphacode-automatic-age-verification-and-a-new-open-language-model/

时间戳记:

更多来自 人工智能– VentureBeat