生成式人工智能训练数据的著作权风险与应对研究(1).pdf

下载文档

1
0
约1.55万字
约 7页
2024-11-26 发布于福建
举报
版权申诉
保障服务

生成式人工智能训练数据的著作权风险与应对研究(1).pdf

此“司法”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第37卷第5期濮阳职业技术学院学报Vol.37No.5

2024年9月JournalofPuyangVocationalandTechnicalCollegeSep.2024

生成式人工智能训练数据的著作权风险与应对研究

任逸飞，王嘉敖

（河南财经政法大学法学院，河南郑州450046）

摘要：生成式人工智能在训练阶段对数据的大量使用对传统著作权法律体系产生了冲击，存在难以纳入合理使用制

度、不适用法定许可制度以及缺少相关配套措施等著作权侵权风险。鉴于此，提供两种风险应对方案：一是以人类中心主义

为立场，在法定许可框架内增设“选择退出”的默示许可制度，并构建著作权集体管理制度与市场化许可费率标准予以辅

助；二是以后人类主义为立场，对合理使用制度进行完善，细化三步检验法与转换性使用的判断标准。

关键词：生成式人工智能；著作权；合理使用；法定许可

中图分类号：D923.41；TP18文献标识码：A文章编号：1672-9161（2024）05-0040-06

一、问题的提出欧盟委员会出台的《人工智能法案》与美国发

以ChatGPT为代表的生成式人工智能的出现布的《人工智能权利法案蓝图》仅规定了原则性的

给人们带来大量发展机遇的同时，对传统视角下的内容，并没有真正触及训练数据所涉及的著作权问

著作权制度也产生了新的冲击。生成式人工智能是题；我国国家网信办发布的《生成式人工智能服务

一种通过学习大规模数据生成新的原创内容的新型管理暂行办法》（以下简称《办法》）第七条，对

人工智能，使用数据进行训练的“机器学习”技人工智能服务提供者的训练数据处理活动进行了原

术，被认为是人工智能领域的关键分支，数据采集则性的规定，要求提供者使用具有合法来源的数据

则是其中的基础性阶段。在数据采集阶段，生成式和基础模型、不得侵害他人依法享有的知识产权、

人工智能所采集、输入的数据越多，越有助于其语采取有效措施提高训练数据质量，但该《办法》尚

料库的完善与后续“机器学习”环节的开展。由于不足以防范训练数据处理活动所带来的著作权风

所采集与输入的训练数据存在机器的无监督学习与险。司法实践中，训练数据侵权案例已有发生。

研发者有目的地不披露商业秘密等原因，生成式人2023年9月，美国作家协会携17名作家在美国纽

工智能的训练数据存在公众无法洞悉的“隐层”，约南区法院对人工智能公司OpenAI发起集体诉

也被称为“黑箱”，不能确定这些训练数据是否均讼，指控后者未经许可使用了受版权保护的作品训

取得了著作权人的授权Ⅲ14。因此在采集与输人训练人工智能模型。如何处理著作权人与人工智能研

练数据的过程中，对训练数据中的作品的复制有可发者之间的紧张关系、解决生成式人工智能在使用

能涉及复制权的规制范围，若生成式人工智能的研训练数据时产生的知识产权问题，已然成为司法实

发者在未取得授权的前提下，擅自复制他人受著作践中的难题之一。而当前学界讨论多集中于生成式

权法保护的作品，则属于侵权行为。然而，如何处人工智能生成物的著作权问题，对输人阶段的训练

理文学艺术的创作与科学技术的进步发展之间的矛数据带来的知识产权问题缺少足够的重视，但训练

盾、如何解决作品保护与合理使用的冲突、如何保数据恰恰是其生成内容的前提与基础。

持著作权人合法权益与人工智能研发者利益的平随着生成式人工智能的迅速发展，其对训练数

衡，是当前面临的难题。据的大量使用可能会引发潜在的著作权风险。因

收稿日期：2023-03-12

作者简介：任逸飞（1998一），男，河南郑州人，硕士研究生，主要研究方向：知识产权法学；王嘉敖（1999一），男，河南

濮阳人，硕士研究生，主要研究方向：知识产权法学。

一40一

此，如何完善著作权法律体系以应对生成式人工智三步检验法的立法模式下对合理使用的情形进行了

能训练数据的法律风险是一个呕需解决的难题。基限缩，列举了十三种合理使用的情形，从而满足司

于此，本文首先对生成式人工智能训练数据所引发法实践的需要，但同时也导致其适用不够灵活，难

的著作权风险进行归纳，发现其与现有法律框架的以

您可能关注的文档

文档评论（0）

乡村振兴、双碳、储能、绿色金融 + 关注: 实名认证

服务提供商

新能源知识科普（本账号发布文档均来源于互联网公开资料，仅用于技术分享交流，相关版权为原作者所有。如果侵犯了您的相关权利，请提出指正，我们将立即删除相关资料）。

咨询作者（7人已咨询）已休息

1亿VIP精品文档

更多 >

生成式人工智能训练数据的著作权风险与应对研究(1).pdf