生成式人工智能数据训练行为的著作权困境与出路.pdfVIP

  • 0
  • 0
  • 约2.51万字
  • 约 9页
  • 2026-01-22 发布于福建
  • 举报

生成式人工智能数据训练行为的著作权困境与出路.pdf

生成式人工智能数据训练行为的

著作权困境与出路∗

刘一帆

··

摘要:生成式人工智能的发展使训练数据的使用问题成为著作权法亟须回应的核心议题。现行著作权制度

的合理使用与法定许可规范难以调和人工智能训练中“全量摄取、自动化处理、非选择性使用”等技术特征与

作者权利保护之间的张力。在理论层面,三步检验法、四要素检验法等传统理论在解释人工智能训练行为时均

显不足。在实践层面,广州、杭州等地法院的判决体现了“输入宽松、输出从严”的规制思路,但仍存在标准模

糊等问题。域外立法与司法实践虽提供了多元化思路,但缺乏操作细节且对权利人保护不足。面对制度规范

与技术实践之间的失配,应构建兼具法律规制确定性与技术治理可行性的双轨机制,为数据要素的合法流动和

AI产业的可持续发展提供制度支撑。

关键词:生成式人工智能训练数据著作权

的发展,尤其对于资源有限的初创企业与科研机

问题的提出

构而言,逐一获取授权并不现实;反之,若完全开

生成式人工智能(GenerativeAI,以下简称放数据的使用,又可能损害创作者的积极性,阻碍

“AI”)的飞速发展正在重塑著作权制度的适用边文化进步。

界。以大模型为代表的AI系统通过海量数据训当前,传统著作权理论难以有效回应AI训练

练生成文本、图像、音频等创作性内容,引发了一数据使用问题。合理使用原则面临列举式规定无

系列著作权法挑战。AI训练涉及对数以亿计的法涵盖AI训练场景、四要素检验法失灵、转换性

作品的复制、转换和分析,突破了传统“复制”和使用概念模糊等困境;法定许可制度因适用范围

“改编”等概念边界。而训练过程的不可见性使狭窄、补偿机制失效而难以适用;专门立法的缺失

著作权人难以察觉自己作品的被使用情况。即使导致合法性判断缺乏明确依据。这些理论工具在

AI生成内容与原作极为相似,原作者也可能陷入面对AI“全量摄取、自动化处理、非选择性使用”

举证难的困境。更复杂的是,AI针对“风格”训练等技术特征时,均显示出结构性不足的困境。近

涉及思想与表达的界限问题。若继续套用以作期,广州互联网法院审理的“奥特曼案”(以下简

者中心主义为基础的传统框架,可能阻碍AI技术称“广州奥特曼案”)与杭州互联网法院审理的

∗本文系国家社科基金青年项目“标准必要专利涉外争议应对的实体与程序衔接机制研究”(项目号:23CFX088)的阶段性成果。

①MarkLemley,“HowGenerativeAITurnsCopyrightLawUpsideDown”,ScienceandTechnologyLawReview,Vol.25,No.2,2024,

-

pp.2144.

②丁文杰:《通用人工智能视野下著作权法的逻辑回归———从“工具论”到“贡献论”》,《东方法学》2023年第5期。

③广州互联网法院民事判决书,(2024)粤0192民初113号。

182

生成式人工智能数据训练行为的著作权困境与出路

同类案件(以下简称“杭州奥特曼案”)为理解生成式AI训练数据是否侵犯著作权

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档