作者对 Nvidia 的 NeMo 提出版权诉讼

作者对 Nvidia 的 NeMo 提出版权诉讼

源节点: 2511830

英伟达是最新一家面临指控的科技巨头,指控其在未经作者许可的情况下使用受版权保护的作品来训练人工智能模型。

提议的集体诉讼 诉讼 [PDF] 8 月 XNUMX 日星期五在旧金山向 GPU 最高领导提起诉讼,声称该公司使用受版权保护的材料在威震天库中训练大型语言模型,以用于其 NeMo 生成式人工智能框架.

该投诉由三位作者阿卜迪·纳泽米安 (Abdi Nazemian)、布莱恩·基恩 (Brian Keene) 和斯图尔特·奥南 (Stewart O'Nan) 提出,他们声称他们写的书是用于培训威震天法学硕士的材料。

从法庭文件来看,英伟达似乎并未被指控公然复制作者本身的作品,而是使用数据集来训练威震天模型,该模型已知包含许多未经许可的版权作品。

该诉讼特别针对 Nvidia 于 2022 年 1.3 月发布的型号,即 NeMo Megatron-GPT 5B、NeMo Megatron-GPT 20B、NeMo Megatron-GPT 5B 和 NeMo Megatron-T3 XNUMXB。

这些都托管在 AI 装备运营的网站上 拥抱脸,以及有关每个模型的信息,包括其训练数据集。在这种情况下,信息表明模型是在 EleutherAI 准备的“The Pile”数据集上进行训练的。

该堆被描述为“用于语言建模的 800GB 多样化文本数据集”,其组成部分之一是名为 Books3 的书籍集合,其中包含约 196,640 本书的内容,其中包括三位作者创作的书籍。

根据法庭文件,Books3 数据集在 2023 年 XNUMX 月之前在 Hugging Face 上单独提供,但后来被删除,因为“由于报告的版权侵权,该数据集已失效且无法再访问”。

作者希望此案以集体诉讼的形式进行,他们自己担任集体代表,并要求陪审团审判,并要求就涉嫌侵犯其版权的行为赔偿损失。

在发送的声明中 注册Nvidia 发言人表示:“我们尊重所有内容创作者的权利,并相信我们创建 NeMo 完全符合版权法。”

这并不是人工智能公司因涉嫌侵犯用于训练人工智能模型的数据的版权而被起诉的第一起案件。去年12月,《纽约时报》推出了 针对微软和 OpenAI 的案件 声称两人未经许可使用其文章来构建 ChatGPT 和类似模型。

OpenAI 一月份的断言可能让这个案例变得更加有趣: “不可能”构建顶级神经网络 无需使用人们的受版权保护的作品即可满足当今的需求。

与此同时,英伟达仍在为人工智能注入动力,宣布推出一项新的生成人工智能专业认证,以帮助开发人员建立该领域的技术可信度。

该产品将于本月晚些时候与这家总部位于圣克拉拉的巨头 GTC 活动同时推出, 专业认证计划 将提供两项助理级生成人工智能认证,重点关注大型语言模型和多模式工作流程技能的熟练程度。 ®

时间戳记:

更多来自 注册