OpenAI等六大AI巨头遭作家起诉.docxVIP

  • 1
  • 0
  • 约3.13千字
  • 约 6页
  • 2026-02-06 发布于江苏
  • 举报

OpenAI等六大AI巨头遭作家起诉

一、事件起底:普利策得主牵头的集体诉讼

2025年12月下旬,美国加州北区地方法院迎来一起备受关注的版权诉讼案。两届普利策新闻奖得主、以揭露Theranos欺诈丑闻闻名的调查记者约翰·卡雷鲁,联合多位作家将OpenAI、谷歌、Meta、Anthropic、xAI及PerplexityAI六家AI巨头推上被告席,指控其通过盗版书籍训练大语言模型,构成“蓄意侵权”。这起诉讼之所以引发广泛关注,不仅因其涉及全球最顶尖的AI企业,更因其直击当前AI行业发展的核心矛盾——如何在技术创新与知识产权保护之间找到平衡。

从诉讼的基本脉络看,原告方的指控逻辑清晰且指向明确。诉状指出,六家公司通过“双重侵权链条”完成非法闭环:首先从LibGen、Z-Library等被视为“影子图书馆”的非法平台批量下载数百万册盗版书籍,涵盖小说、纪实文学等多种类型;继而将这些未经授权的作品作为训练数据输入大语言模型,用于优化ChatGPT、Claude、Gemini等AI产品;最终通过向企业和个人用户提供付费服务实现商业变现。原告强调,作家的智力成果是支撑“价值数十亿美元AI生态”的基石,而创作者却未获得任何补偿,这一行为本质是“用他人的心血喂养自己的摇钱树”。

值得注意的是,此次诉讼并非作家群体首次向AI企业发起版权维权,但却是首起将马斯克旗下xAI列为被告的案件。更关键的是,原告明确拒绝采用集体诉讼形式,理由是“集体诉讼对被告更有利”——此前Anthropic与作家达成的15亿美元和解案中,每部侵权作品的赔偿仅为《版权法》法定最高额(15万美元)的2%,这被原告视为“廉价买断创作者权益”的典型。这种选择背后,是作家群体对现有法律救济路径的失望,以及对“更公平赔偿”的强烈诉求。

二、行业镜像:AI训练的版权争议已进入“高发期”

此次诉讼的爆发,实则是AI行业版权纠纷长期积累的必然结果。自2022年底ChatGPT引爆全球AI热潮以来,大语言模型的训练数据来源合法性问题便持续引发争议。南都数字经济治理研究中心的报告显示,OpenAI已成为“被诉大户”,目前至少面临14起版权诉讼,其中最具代表性的当属《纽约时报》2023年底对微软和OpenAI的起诉——该报指控其未经许可使用数百万篇文章训练AI模型,并要求赔偿数十亿美元损失及销毁相关训练数据。

其他AI企业同样未能幸免。谷歌在2025年12月初收到迪士尼的停止侵权函,被指“未经授权复制海量版权作品用于AI开发”;Meta因模型训练数据问题多次收到好莱坞大厂的侵权警告;PerplexityAI早在2024年10月就收到《纽约时报》的“停止并终止”通知。而Anthropic的案例更具标志性——2025年6月,该公司因使用盗版书籍训练Claude模型,以15亿美元和解了一起集体诉讼,但这一金额在原告看来“远未覆盖实际损失”。

这些案例共同勾勒出当前AI训练数据领域的“灰色地带”:大语言模型需要海量、多元的文本数据来提升生成质量,而版权作品(尤其是书籍、新闻文章等)因其内容的深度和结构化特征,成为最优质的训练素材。然而,AI企业获取这些数据的方式却长期处于“模糊地带”——部分企业通过爬虫技术抓取公开网页内容,部分通过第三方数据公司购买,更有甚者直接利用非法平台的盗版资源。当“技术刚需”与“版权红线”发生碰撞,纠纷便不可避免。

三、法律困局:现有规则能否驾驭AI训练新场景?

此次诉讼的核心法律争议,在于如何界定AI训练中使用版权作品的性质。根据美国《版权法》,未经授权复制、发行版权作品属于侵权行为,而“合理使用”原则虽允许有限度的使用(如评论、教学等),但需满足“使用目的与性质”“版权作品的性质”“使用数量与实质性”“对市场的影响”四大要件。对于AI训练而言,企业通常辩称其对版权作品的使用是“转换性使用”(即用于生成新内容而非直接复制),符合“合理使用”范畴;但创作者认为,AI训练本质是对版权作品的“系统性复制”,且企业通过商业变现获得了巨额利益,远超“合理使用”的边界。

此次诉讼的特殊之处在于,原告明确指控被告“蓄意侵权”。若法院最终认定“蓄意”成立,根据《版权法》,每部侵权作品的最高赔偿额可达15万美元——这一金额是普通侵权赔偿的数倍,足以对企业形成威慑。但问题在于,如何证明“蓄意”?原告提供的关键证据是“双重侵权链条”的存在:企业不仅从非法平台获取盗版书籍,还将其有组织地用于商业训练,这一过程存在明确的“明知故犯”特征。例如,LibGen和Z-Library长期被多国法院认定为非法平台,企业若仍通过其获取数据,很难辩称“不知情”。

更深层的法律挑战在于,现有版权规则是否适应AI技术的特殊性。传统版权法以“作品”为中心,强调对具体表达的保护;而AI训练是对海量作品的“统计性学习

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档