Anthropic 面临作者的新一轮法律攻击：Claude AI 涉嫌接受被盗版权作品的训练

[ad_1]

关键要点

三位作家对 Anthropic 提起集体诉讼，指控其 “窃取数十万本受版权保护的书籍”。
他们对 Anthropic 使用被称为“The Pile”的人工智能训练数据集提出质疑。
该人工智能开发商还因使用受版权保护的歌词作为训练数据而被音乐行业起诉。

继 OpenAI 遭遇一系列类似诉讼之后，Anthropic 又因涉嫌使用盗版内容训练其 Claude AI 模型而被作者起诉。

在一个集体诉讼 8 月 19 日星期一提起的诉讼中，原告 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson（Bartz 等人）指控 Anthropic“窃取了数十万本受版权保护的书籍”，这些书籍被汇编在被称为“The Pile”的 AI 训练数据集中。

什么是桩？

为大型语言模型 (LLM) 训练而汇编的 825GB 英文文本语料库，是几起正在进行的 AI 版权案件的核心。

在 Brian Keene、Abdi Nazemian 和 Stewart O’Nan 提起的单独诉讼中，Nvidia 被指控使用 The Pile 来训练其 NeMo 模型。

与此同时，美国作家协会对微软和 OpenAI 提起诉讼，指控其使用名为 Books2 的类似数据集来训练 GPT 模型。

除了争议较小的数据源外，The Pile 的一个子集（称为 Books3）包含从 bibliotik BitTorrent 追踪器下载的 196,640 本书。这些正是作者所质疑的。

Bartz 等人在诉讼中声称：“很明显，Anthropic 下载并复制了《The Pile》和《Books3》的副本，他们知道这些数据集包含大量来自 Bibiliotik 等盗版网站的受版权保护的内容。”

人类学家承认使用盗版内容

在 2021 年研究论文

Anthropic 面临作者的新一轮法律攻击：Claude AI 涉嫌接受被盗版权作品的训练

什么是桩？

人类学家承认使用盗版内容

人类与音乐出版商

版权保护与人工智能

出版业相似之处

Leave a Reply Cancel Reply

什么是桩？

人类学家承认使用盗版内容

人类与音乐出版商

版权保护与人工智能

出版业相似之处

Related Posts

稳定驱动的汇款挑战西联盟的草皮

美国住房调节器说，您的加密产品组合可能很快可以帮助您获得抵押贷款

以色列男子被指控监视伊朗的官员和基地，在加密货币上支付了数千美元

Leave a Reply Cancel Reply