从“不正当竞争”角度思考AI模型训练中“爬虫行为”的违法边界——欧盟与中国之比较 -.docxVIP

  • 0
  • 0
  • 约1.19万字
  • 约 12页
  • 2026-03-16 发布于北京
  • 举报

从“不正当竞争”角度思考AI模型训练中“爬虫行为”的违法边界——欧盟与中国之比较 -.docx

-1

引言

当前,生成式人工智能(generativeartificialintelligence,以下简称“生成式AI”)的发展突飞猛进,而此过程需要海量数据的支持,尤其是在模型训练阶段。故而,实践中很多生成式AI模型的训练往往依赖于爬虫工具从互联网上大量爬取数据。1例如,OpenAl公司的ChatGPT模型曾通过互联网爬取第三方网站中的电子书籍、文章、数据库等570GB、超过3000亿个单词用于训练AI模型。2

然而,在AI模型训练中的爬虫行为如火如荼开展的同时,也需警惕爬虫行为所带来的以下几方面法律风险:

(1)知识产权侵权:当Al公司对第三方网站上受

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档