- 0
- 0
- 约2.58万字
- 约 11页
- 2026-01-21 发布于福建
- 举报
2025年3月重庆邮电大学学报(社会科学版)Mar.2025
第37卷第2期JournalofChongqingUniversityofPostsandTelecommunications(SocialScienceEdition)Vol.37No.2
DOI:10.3979/1673 ̄8268.20240727003
引用格式:周辉ꎬ金僖艾.生成式人工智能训练数据利用作品的法定许可[J].重庆邮电大学学报(社会科学版)ꎬ2025(2):
45 ̄54.
生成式人工智能训练数据利用作品的法定许可∗
12
周辉ꎬ金僖艾
(1.中国社会科学院法学研究所ꎬ北京100720ꎻ2.中国社会科学院大学法学院ꎬ北京102401)
摘要:DeepSeek等生成式人工智能的开发离不开高质量的训练数据ꎬ但利用作品进行训练引
发了一系列著作权争议ꎮ生成式人工智能高质量发展ꎬ迫切需要解决作品取得授权难、授权成
本高、利益难平衡、有竞争壁垒等现实问题ꎮ合理使用制度虽然具备解决作品数据授权难、利用
成本高的功能ꎬ但会牺牲著作权人利益和一定程度的社会公共利益ꎮ仅靠合理使用制度ꎬ不能
完全解决生成式人工智能发展的著作权新问题ꎮ建立生成式人工智能训练数据利用作品的法
定许可制度ꎬ既可以提供作品利用的合法性基础ꎬ提高授权效率ꎻ也可以预防因支配一定规模作
品著作权而排除、限制生成式人工智能竞争的新型垄断ꎻ更可以通过合理的许可定价ꎬ为著作权
人提供必要的对价补偿ꎬ实现生成式人工智能创新发展中各相关方利益的更好平衡ꎮ生成式人
工智能作品训练适用法定许可制度的实施ꎬ需要通过人工智能专门立法创设ꎬ在与合理使用互
补衔接的基础上ꎬ科学设定法定许可范围、条件和程序ꎬ并配套明确的法定许可定价标准和付酬
机制ꎮ
关键词:生成式人工智能ꎻ训练数据ꎻ合理使用ꎻ法定许可ꎻDeepSeek
中图分类号:DF523ꎻD913.4文献标识码:A文章编号:1673 ̄8268(2025)02 ̄0045 ̄10
从ChatGPT到DeepSeekꎬ随着ChatGPT火爆全球ꎬ生成式人工智能技术不断迭代创新ꎬ广泛应用于
文本生成、图像合成、音乐创作、程序代码、工业设计等领域ꎬ正在成为打造新质生产力的重要引擎ꎮ数据
是训练生成式人工智能底层模型的基础ꎬ训练数据集是生成式人工智能技术应用的基石ꎮ为实现高质量
[1]87
的输出ꎬ生成式人工智能的训练数据往往包含大量受著作权保护的作品和个人信息ꎮ在个人信息收
集场景中ꎬ人工智能产品或服务的研发者、提供者可能由于数据收集过程的高度自动化而不能及时与数
∗收稿日期:2024 ̄07 ̄27修订日期:2025 ̄02 ̄14
基金项目:国家社科基金项目:智能治理的法治规范与保障研究(20BFX044)
作者简介:周辉ꎬ副教授ꎬ硕士生导师ꎬ法学博士ꎬ网络与信息法研究室副主任ꎬ主要从事网络与信息法学研究ꎬE ̄
mail:13811511697@163.comꎮ
45
据主体进行交流ꎬ致使知情同意原则存在适用困境ꎻ也可能在获取文本语料场景中ꎬ因未征得权利人许可
[2]
复制、改编或者传播而涉嫌侵犯他人知识产权ꎮ传统著作权法的强保护和“一对一”的授权交易模式ꎬ
为生成式人工智能训练数据的合法使用带来了挑战ꎮ
2023年8月15日ꎬ我国«生成式人工智能服务管理暂行办法»正式施行ꎬ明确提出实施“包容审慎”
的监管方式ꎬ要求提供和使用生成式人工智能服务应尊重知识产权ꎬ依法开展预训练、优化训练等训练数
据处理活动ꎮ目前学界较多学者支持通过“合理使用”制度调整新兴技术和生成式人工智能产业产生的
著作权问题ꎬ但却忽视了我国现有合理使用制度与人
原创力文档

文档评论(0)