人工智能训练中作品数据来源者利益共享机制研究.pdfVIP

  • 0
  • 0
  • 约2.42万字
  • 约 16页
  • 2026-01-23 发布于福建
  • 举报

人工智能训练中作品数据来源者利益共享机制研究.pdf

人工智能训练中作品数据来源者

利益共享机制研究

张嘉鑫

内容提要:作品数据凭借其高质量特性,在AI训练中得到了广泛应用,并催生了巨大

的经济价值。由于AI训练不应被纳入著作权人的专有权控制范围,著作权并非数据来源者

主张其财产利益的权源。但作为数据的初始生成者,数据来源者主动提供或参与贡献作品

数据原材料,理应获得相应的财产利益分配,确有必要引入利益共享机制,发挥其权衡、

矫正与激励功能。在性质上,利益共享机制赋予了针对作品数据的新型积极利用方式,并

基于不当得利制度构造相应的权利义务关系。依据场景对利益共享机制进行合理配置,数

据来源者在AI商用场景以及数据持有者与AI训练者合意有偿使用场景中均可主张利益共

享。为保障利益共享得以实现,应当通过设置披露义务消除实现利益共享的前端障碍,并

以集体治理模式帮助数据来源者获得财产利益。

关 键 词:AI训练作品数据著作权不当得利利益共享

引言

人工智能(ArtificialIntelligence,以下简称AI)数据训练系指AI训练者将收集到的数

据输入AI模型中进行训练的过程。a在这一过程中,数据具有重要且不可替代的作用。其

中,作品数据凭借其高质量的突出特征,更契合训练的具体要求,被广泛应用于AI模型训

练之中,并逐渐展现出其中所蕴含的经济价值。国外有研究指出,众多学术出版商正逐步

将研究论文的使用权授权给科技巨头,以服务于AI模型的训练并收获可观的报酬。例如,

作者简介:张嘉鑫,吉林大学法学院民商法学博士研究生

基金项目:本文系2023年度教育部“建构中国自主法学知识体系”重大专项“中国自主法学知识体系的概念体系研究”

(项目批准号:2023JZDZ014)的阶段性成果。

aAI训练者是指将收集到的数据输入系统中进行训练的主体。

.111.

IntellectualProperty

(Monthly)No.5,2025

英国知名的学术出版机构TaylorFrancis就授权访问数据库与微软公司达成了一项价值高

达1000万美元的协议;美国出版商Wiley也通过向某科技公司提供数据内容从而获得了高达

2300万美元的收益。b上述案例中,出版商获得了可观的收入,但是研究论文的作者并未获

得相应的报酬,这一现状引起了以下思考:作者能否因其作品被用于训练AI,而作为数据

来源者主张相应的经济利益?c

《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称

《数据二十条》)提出,要“探索个人、企业、公共数据分享价值收益的方式,建立健全

更加合理的市场评价机制,促进劳动者贡献和劳动报酬相匹配”,同时强调要“充分保护

数据来源者合法权益,推动基于知情同意或存在法定事由的数据流通使用模式,保障数据

来源者享有获取或复制转移由其促成产生数据的权益”。基于这一政策导向,在使用作品

数据训练AI时,作品数据来源者势必因为其对作品数据价值的贡献而享有财产利益的收

益。d如何实现这部分利益,是本文的研究重点。需探究作品数据来源者是否可基于著作权

向AI训练者等主体主张财产利益。e除此之外,还需进一步探讨作品数据来源者是否享有其

他权利以主张合法利益。文章将依据这一逻辑展开论述,全面探讨AI训练中作品数据来源

者财产利益的实现问题。

一、引入利益共享机制的必要性说明

(一)著作权并非作品数据来源者实现财产利益的行权基础

作品数据来源者作为创作作品的主体,依法享有著作权法赋予的权利,理应受到著作

权法保护。但是,AI训练中的作品使用行为是否应当被纳入著作权人专有权利范围仍待斟

酌,应当判断AI训练者作品使用行为的性质属于“表达性使用”还是“非表达性使用”。f

本文认为,AI训练者对作品的使用系“非表达性使用”,而非“表达性使用”,不应被纳

入著作权专有权的控制范围,理由如下。

首先,AI训练者对作品的使用行为不属于复制权的控制范围。有观点认为,在机器学习

bSeeElizabethGibney,HasYourPaperbeenUsedtoTrainanAIModel?A

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档