OpenAI等六大AI巨头遭作家起诉.docxVIP

下载本文档

1
0
约3.13千字
约 6页
2026-02-06 发布于江苏
举报

OpenAI等六大AI巨头遭作家起诉.docx

OpenAI等六大AI巨头遭作家起诉

一、事件起底：普利策得主牵头的集体诉讼

2025年12月下旬，美国加州北区地方法院迎来一起备受关注的版权诉讼案。两届普利策新闻奖得主、以揭露Theranos欺诈丑闻闻名的调查记者约翰·卡雷鲁，联合多位作家将OpenAI、谷歌、Meta、Anthropic、xAI及PerplexityAI六家AI巨头推上被告席，指控其通过盗版书籍训练大语言模型，构成“蓄意侵权”。这起诉讼之所以引发广泛关注，不仅因其涉及全球最顶尖的AI企业，更因其直击当前AI行业发展的核心矛盾——如何在技术创新与知识产权保护之间找到平衡。

从诉讼的基本脉络看，原告方的指控逻辑清晰且指向明确。诉状指出，六家公司通过“双重侵权链条”完成非法闭环：首先从LibGen、Z-Library等被视为“影子图书馆”的非法平台批量下载数百万册盗版书籍，涵盖小说、纪实文学等多种类型；继而将这些未经授权的作品作为训练数据输入大语言模型，用于优化ChatGPT、Claude、Gemini等AI产品；最终通过向企业和个人用户提供付费服务实现商业变现。原告强调，作家的智力成果是支撑“价值数十亿美元AI生态”的基石，而创作者却未获得任何补偿，这一行为本质是“用他人的心血喂养自己的摇钱树”。

值得注意的是，此次诉讼并非作家群体首次向AI企业发起版权维权，但却是首起将马斯克旗下xAI列为被告的案件。更关键的是，原告明确拒绝采用集体诉讼形式，理由是“集体诉讼对被告更有利”——此前Anthropic与作家达成的15亿美元和解案中，每部侵权作品的赔偿仅为《版权法》法定最高额（15万美元）的2%，这被原告视为“廉价买断创作者权益”的典型。这种选择背后，是作家群体对现有法律救济路径的失望，以及对“更公平赔偿”的强烈诉求。

二、行业镜像：AI训练的版权争议已进入“高发期”

此次诉讼的爆发，实则是AI行业版权纠纷长期积累的必然结果。自2022年底ChatGPT引爆全球AI热潮以来，大语言模型的训练数据来源合法性问题便持续引发争议。南都数字经济治理研究中心的报告显示，OpenAI已成为“被诉大户”，目前至少面临14起版权诉讼，其中最具代表性的当属《纽约时报》2023年底对微软和OpenAI的起诉——该报指控其未经许可使用数百万篇文章训练AI模型，并要求赔偿数十亿美元损失及销毁相关训练数据。

其他AI企业同样未能幸免。谷歌在2025年12月初收到迪士尼的停止侵权函，被指“未经授权复制海量版权作品用于AI开发”；Meta因模型训练数据问题多次收到好莱坞大厂的侵权警告；PerplexityAI早在2024年10月就收到《纽约时报》的“停止并终止”通知。而Anthropic的案例更具标志性——2025年6月，该公司因使用盗版书籍训练Claude模型，以15亿美元和解了一起集体诉讼，但这一金额在原告看来“远未覆盖实际损失”。

这些案例共同勾勒出当前AI训练数据领域的“灰色地带”：大语言模型需要海量、多元的文本数据来提升生成质量，而版权作品（尤其是书籍、新闻文章等）因其内容的深度和结构化特征，成为最优质的训练素材。然而，AI企业获取这些数据的方式却长期处于“模糊地带”——部分企业通过爬虫技术抓取公开网页内容，部分通过第三方数据公司购买，更有甚者直接利用非法平台的盗版资源。当“技术刚需”与“版权红线”发生碰撞，纠纷便不可避免。

三、法律困局：现有规则能否驾驭AI训练新场景？

此次诉讼的核心法律争议，在于如何界定AI训练中使用版权作品的性质。根据美国《版权法》，未经授权复制、发行版权作品属于侵权行为，而“合理使用”原则虽允许有限度的使用（如评论、教学等），但需满足“使用目的与性质”“版权作品的性质”“使用数量与实质性”“对市场的影响”四大要件。对于AI训练而言，企业通常辩称其对版权作品的使用是“转换性使用”（即用于生成新内容而非直接复制），符合“合理使用”范畴；但创作者认为，AI训练本质是对版权作品的“系统性复制”，且企业通过商业变现获得了巨额利益，远超“合理使用”的边界。

此次诉讼的特殊之处在于，原告明确指控被告“蓄意侵权”。若法院最终认定“蓄意”成立，根据《版权法》，每部侵权作品的最高赔偿额可达15万美元——这一金额是普通侵权赔偿的数倍，足以对企业形成威慑。但问题在于，如何证明“蓄意”？原告提供的关键证据是“双重侵权链条”的存在：企业不仅从非法平台获取盗版书籍，还将其有组织地用于商业训练，这一过程存在明确的“明知故犯”特征。例如，LibGen和Z-Library长期被多国法院认定为非法平台，企业若仍通过其获取数据，很难辩称“不知情”。

更深层的法律挑战在于，现有版权规则是否适应AI技术的特殊性。传统版权法以“作品”为中心，强调对具体表达的保护；而AI训练是对海量作品的“统计性学习

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

OpenAI等六大AI巨头遭作家起诉.docxVIP