网站大量收购独家精品文档,联系QQ:2885784924

生成式AI数据训练的合理使用规则研究.pdfVIP

生成式AI数据训练的合理使用规则研究.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

传播与版权

CHUANBOYUBANQUAN2024年第15期 总第154期

生成式AI数据训练的合理使用规则研究

◎李婷

[摘要]当前,生成式AI数据训练过程中对作品的使用落入著作权法专有权利的控制范围,数据训练

过程中存在侵权风险却难以运用现有著作权例外制度为其开脱。为顺应人工智能产业发展的需要,相关部

门亟待为生成式AI数据训练创设侵权例外。现有路径中,法定许可和“选择退出”默示许可在适用上存在

弊端,市场失灵理论、转换性使用理论以及从技术层面分析表明,将生成式AI数据训练纳入合理使用是化

解数据训练侵权风险的最优选择。在制度设计上,相关部门要创设“人工智能数据训练”的合理使用例外,

对主体要件、目的要件、行为要件以及结果要件做出限定,并为人工智能研发者设置安全保护、训练数据

披露、定期审查的义务。

[关键词]生成式AI;数据训练;合理使用;利益平衡

2022年底,ChatGPT的横空出世引起了全世界的达型人工智能的典型代表是ChatGPT等生成式AI,非

关注。目前,生成式AI已被成功地应用在编曲、绘画、表达型人工智能的典型代表是人脸识别系统。我们在

新闻撰写等领域,并取得了显著的成就。数据是生成著作权法意义上使用作品,是将该作品当作作品去使

式AI发展的基石,数据之于生成式AI,犹如文字之于用,而人脸识别系统在使用作品时只提取人物照片中

一部鸿篇巨制。生成式AI基于大量数据训练生成文学的生理性特征,并非使用人物照片中的表达性要素,

作品,而高质量的数据往往是受著作权法保护的,无因此不是在著作权法意义上使用作品,基于此,非表

论生成式AI的模型技术含量有多高,现阶段技术条件达型人工智能不在文章讨论范围内。与人脸识别系统

下数据质量对AI性能具有决定性的影响。然而,传统不同,表达型人工智能在数据训练过程中会直接使用

著作权法“作者中心主义”的强保护形式以及“一对一”到作品的表达性内容,如ChatGPT会分析文本的字词

的交易和授权模式难以满足生成式AI应用海量数据进搭配、遣词造句,Midjourney会分析画作的线条色彩,

行训练的需求,生成式AI数据训练行为面临著作权侵这些都是作品中的表达性内容,而非仅仅是事实性信

权风险。著作权法是传播技术的产物,新的传播技术的息。表达型人工智能在数据训练过程中使用作品是在

出现,都会打破权利人和使用者之间的平衡,并最终产著作权法意义上使用作品,落入著作权专有权控制范

[1]

生新的法律标准。因此,明确生成式AI数据训练行围内,未经著作权人许可表达型人工智能使用其作品

为侵权与侵权例外的边界,化解产业发展与著作权保护进行数据训练将会面临侵权风险。

之间的矛盾,成为相关部门亟待解决的问题。(一)人工智能数据训练的侵权风险分析

传统人工智能大多通过程序代码赋予机器以人类

一、问题缘起:生成式AI数据训练的版权

的思维方式或思维结构来完成某种作品的创作,这种

困境[3]

创作的实现依赖于代码定义,创作的结果为人类思

美国学者Sobel将人工智能以是否有表达性内容维和意志的体现。而以ChatGPT为代表的生成式AI,

[2]在预训练(Pre-training)阶段是运用数据训练算法的

输出分为表达型人工智能和非表达型人工智能,表

[作者简介]李婷(20

文档评论(0)

经典文库 + 关注
实名认证
服务提供商

专注于各类文档、文案、文稿的写作、修改、润色和各领域PPT文档的制作,收集有海量各类规范类文件。欢迎咨询!

1亿VIP精品文档

相关文档