生成式AI数据训练的合理使用规则研究.pdfVIP

下载本文档

0
0
约2.14万字
约 7页
2025-03-28 发布于江西
举报
版权申诉

生成式AI数据训练的合理使用规则研究.pdf

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

传播与版权

CHUANBOYUBANQUAN2024年第15期总第154期

生成式AI数据训练的合理使用规则研究

◎李婷

［摘要］当前，生成式AI数据训练过程中对作品的使用落入著作权法专有权利的控制范围，数据训练

过程中存在侵权风险却难以运用现有著作权例外制度为其开脱。为顺应人工智能产业发展的需要，相关部

门亟待为生成式AI数据训练创设侵权例外。现有路径中，法定许可和“选择退出”默示许可在适用上存在

弊端，市场失灵理论、转换性使用理论以及从技术层面分析表明，将生成式AI数据训练纳入合理使用是化

解数据训练侵权风险的最优选择。在制度设计上，相关部门要创设“人工智能数据训练”的合理使用例外，

对主体要件、目的要件、行为要件以及结果要件做出限定，并为人工智能研发者设置安全保护、训练数据

披露、定期审查的义务。

［关键词］生成式AI；数据训练；合理使用；利益平衡

2022年底，ChatGPT的横空出世引起了全世界的达型人工智能的典型代表是ChatGPT等生成式AI，非

关注。目前，生成式AI已被成功地应用在编曲、绘画、表达型人工智能的典型代表是人脸识别系统。我们在

新闻撰写等领域，并取得了显著的成就。数据是生成著作权法意义上使用作品，是将该作品当作作品去使

式AI发展的基石，数据之于生成式AI，犹如文字之于用，而人脸识别系统在使用作品时只提取人物照片中

一部鸿篇巨制。生成式AI基于大量数据训练生成文学的生理性特征，并非使用人物照片中的表达性要素，

作品，而高质量的数据往往是受著作权法保护的，无因此不是在著作权法意义上使用作品，基于此，非表

论生成式AI的模型技术含量有多高，现阶段技术条件达型人工智能不在文章讨论范围内。与人脸识别系统

下数据质量对AI性能具有决定性的影响。然而，传统不同，表达型人工智能在数据训练过程中会直接使用

著作权法“作者中心主义”的强保护形式以及“一对一”到作品的表达性内容，如ChatGPT会分析文本的字词

的交易和授权模式难以满足生成式AI应用海量数据进搭配、遣词造句，Midjourney会分析画作的线条色彩，

行训练的需求，生成式AI数据训练行为面临著作权侵这些都是作品中的表达性内容，而非仅仅是事实性信

权风险。著作权法是传播技术的产物，新的传播技术的息。表达型人工智能在数据训练过程中使用作品是在

出现，都会打破权利人和使用者之间的平衡，并最终产著作权法意义上使用作品，落入著作权专有权控制范

［1］

生新的法律标准。因此，明确生成式AI数据训练行围内，未经著作权人许可表达型人工智能使用其作品

为侵权与侵权例外的边界，化解产业发展与著作权保护进行数据训练将会面临侵权风险。

之间的矛盾，成为相关部门亟待解决的问题。（一）人工智能数据训练的侵权风险分析

传统人工智能大多通过程序代码赋予机器以人类

一、问题缘起：生成式AI数据训练的版权

的思维方式或思维结构来完成某种作品的创作，这种

困境［3］

创作的实现依赖于代码定义，创作的结果为人类思

美国学者Sobel将人工智能以是否有表达性内容维和意志的体现。而以ChatGPT为代表的生成式AI，

［2］在预训练（Pre-training）阶段是运用数据训练算法的

输出分为表达型人工智能和非表达型人工智能，表

［作者简介］李婷（20

您可能关注的文档

文档评论（0）

经典文库 + 关注: 实名认证

服务提供商

专注于各类文档、文案、文稿的写作、修改、润色和各领域PPT文档的制作，收集有海量各类规范类文件。欢迎咨询！

咨询作者（7人已咨询）已休息

1亿VIP精品文档

更多 >

生成式AI数据训练的合理使用规则研究.pdfVIP