- 0
- 0
- 约2.83万字
- 约 18页
- 2026-01-21 发布于福建
- 举报
版权何须透明:人工智能版权信息
披露义务之否定
郑金涛
内容提要:“版权透明”是欧美人工智能训练数据透明度立法的核心议题,其要求人
工智能企业披露训练数据中的版权相关信息,旨在帮助创作者克服举证困难,有效维护自
身权益。然而,版权信息披露义务作为行政规制手段,其制度合理性存在明显不足。在收
益层面,版权信息披露义务难以有效保障创作者的权益,其带来的私人收益微乎其微;同
时,改良人工智能技术、促进训练数据交易、增强公众信任等社会价值亦难以实现。在成
本层面,版权信息披露义务加重了人工智能企业的合规负担,同时也阻碍了数据市场和人
工智能市场的充分竞争与创新发展,限制了公众对先进人工智能产品的广泛获取。通过严
格预防和有效问责人工智能输出侵权内容、明晰作品性数据集的保护规则和保障平台训练
数据条款的公开公正,足以维护创作者和版权企业的合法权益。
关 键 词:生成式人工智能版权透明训练数据版权信息披露义务
一、训练数据的“版权透明”问题
a
在全球各地的人工智能监管立法中,贯彻透明度原则已成基本共识,而且规制焦点
逐渐从“算法透明”拓展到“数据透明”,即要求人工智能企业披露训练数据的相关信息
甚至数据集本身。值得注意的是,“版权透明”正成为欧美地区数据透明度立法的核心
议题。2024年7月,欧盟批准的《人工智能法案》第53条d项要求通用人工智能模型提供者
“根据由人工智能办公室提供的模板,起草并公开一份关于通用人工智能模型训练内容的
作者简介:郑金涛,清华大学法学院博士研究生
基金项目:本文系国家社科基金委托项目“生成式人工智能语料库建设著作权法律问题研究”(24@ZH014)的阶段性
研究成果。
a本文所称的人工智能包括生成式人工智能和非生成式人工智能,但默认以前者作为讨论对象,因为举重足以明轻:
若具有较大版权侵权风险的生成式人工智能(以下简称GenAI)企业不应承担版权信息披露义务,那么后者更应如此。
.57.
IntellectualProperty
(Monthly)No.8,2025
充分详细的概要(sufficientlydetailedsummary)”。虽然披露范围不限于版权相关信息,但
该法案序言第107条指出第53条d项的主要意旨在于促进版权人行使和执行欧盟版权法赋予
的权利。2024年12月,英国政府发布版权与人工智能征询报告,其首要目标是提高训练数
据中作品使用的透明度,以增强创作者控制作品使用和获得公平报酬的能力,透明度措施
或要求人工智能企业公开特定作品及数据集的使用详情,以及网络爬虫的具体信息。b
美国人工智能监管中的版权透明度议题也在不断升温。2024年4月,美国众议员亚
·
当希夫提出《生成式人工智能版权披露法案》。该法案要求创建训练数据集或对数据集
进行重大修改的主体向版权局提交一份通知,其中应包含用于训练的所有版权作品的充分详
细的概要以及所有可公开获取数据集的URL,并规定由版权局负责建立记载通知中所有的在
·
线数据库以供公众使用。亚当希夫认为:“法案在支持创新的同时保障创作者的权利和贡
献,确保他们知道自己的作品被用于人工智能训练数据集。”c2025年2月,美国众议员鲍
尔-卡恩提出更为严厉的《人工智能版权透明度法案》,要求开发者在公开提供生成式人工
智能系统或模型前,必须详细记录和保存训练数据中所有版权材料及其版权人的信息,并在
收到版权人的书面请求后提供一份披露该版权人的相关作品被用作训练数据的全面清单。d
在域外立法思潮的影响下,国内有学者开始主张构建我国的人工智能版权信息披露制
度。e“版权透明”通过强制要求人工智能企业披露训练数据中的版权相关信息,以帮助创
作者了解其作品是否被纳入模型训练,为他们的权益保护和维权行动提供证据支持,从而有
效维护创作者的合法权益。有学者将版权信息披露义务的正当性建立在作者权利的基础上,
认为版权信息披露义务既是对作者精神权利的认可与尊重,也为著作财产权的实现提供了便
利条件。f然而,版权信息披露
原创力文档

文档评论(0)