- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
传播与版权
CHUANBOYUBANQUAN2024年第15期 总第154期
生成式AI数据训练的合理使用规则研究
◎李婷
[摘要]当前,生成式AI数据训练过程中对作品的使用落入著作权法专有权利的控制范围,数据训练
过程中存在侵权风险却难以运用现有著作权例外制度为其开脱。为顺应人工智能产业发展的需要,相关部
门亟待为生成式AI数据训练创设侵权例外。现有路径中,法定许可和“选择退出”默示许可在适用上存在
弊端,市场失灵理论、转换性使用理论以及从技术层面分析表明,将生成式AI数据训练纳入合理使用是化
解数据训练侵权风险的最优选择。在制度设计上,相关部门要创设“人工智能数据训练”的合理使用例外,
对主体要件、目的要件、行为要件以及结果要件做出限定,并为人工智能研发者设置安全保护、训练数据
披露、定期审查的义务。
[关键词]生成式AI;数据训练;合理使用;利益平衡
2022年底,ChatGPT的横空出世引起了全世界的达型人工智能的典型代表是ChatGPT等生成式AI,非
关注。目前,生成式AI已被成功地应用在编曲、绘画、表达型人工智能的典型代表是人脸识别系统。我们在
新闻撰写等领域,并取得了显著的成就。数据是生成著作权法意义上使用作品,是将该作品当作作品去使
式AI发展的基石,数据之于生成式AI,犹如文字之于用,而人脸识别系统在使用作品时只提取人物照片中
一部鸿篇巨制。生成式AI基于大量数据训练生成文学的生理性特征,并非使用人物照片中的表达性要素,
作品,而高质量的数据往往是受著作权法保护的,无因此不是在著作权法意义上使用作品,基于此,非表
论生成式AI的模型技术含量有多高,现阶段技术条件达型人工智能不在文章讨论范围内。与人脸识别系统
下数据质量对AI性能具有决定性的影响。然而,传统不同,表达型人工智能在数据训练过程中会直接使用
著作权法“作者中心主义”的强保护形式以及“一对一”到作品的表达性内容,如ChatGPT会分析文本的字词
的交易和授权模式难以满足生成式AI应用海量数据进搭配、遣词造句,Midjourney会分析画作的线条色彩,
行训练的需求,生成式AI数据训练行为面临著作权侵这些都是作品中的表达性内容,而非仅仅是事实性信
权风险。著作权法是传播技术的产物,新的传播技术的息。表达型人工智能在数据训练过程中使用作品是在
出现,都会打破权利人和使用者之间的平衡,并最终产著作权法意义上使用作品,落入著作权专有权控制范
[1]
生新的法律标准。因此,明确生成式AI数据训练行围内,未经著作权人许可表达型人工智能使用其作品
为侵权与侵权例外的边界,化解产业发展与著作权保护进行数据训练将会面临侵权风险。
之间的矛盾,成为相关部门亟待解决的问题。(一)人工智能数据训练的侵权风险分析
传统人工智能大多通过程序代码赋予机器以人类
一、问题缘起:生成式AI数据训练的版权
的思维方式或思维结构来完成某种作品的创作,这种
困境[3]
创作的实现依赖于代码定义,创作的结果为人类思
美国学者Sobel将人工智能以是否有表达性内容维和意志的体现。而以ChatGPT为代表的生成式AI,
[2]在预训练(Pre-training)阶段是运用数据训练算法的
输出分为表达型人工智能和非表达型人工智能,表
[作者简介]李婷(20
文档评论(0)