生成式人工智能服务安全基本要求实务解析.docx

生成式人工智能服务安全基本要求实务解析.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

生成式人工智能服务安全基本要求实务解析

自2022年初以来,我国陆续发布算法推荐、深度合成与生成式人工智能服务相关的规范文件,初步构建起对特定领域人工智能技术与服务的监管机制。具体至生成式人工智能服务领域,在《生成式人工智能服务管理暂行办法》(以下简称“《暂行办法》”)的监管框架下,形成了由算法备案制度和生成式人工智能(大语言模型)备案(下称“大模型备案”)构成的“双备案制”的实践机制。

算法备案制度最早在《互联网信息服务算法推荐管理规定》(以下简称“《算法推荐规定》”)中确立,企业可通过中央网信办的互联网信息服务算法备案系统提交算法备案申请,流程和备案内容细则均较为固定。而大模型备案自《暂行办法》施行之日起也仅有半年,还需要与服务提供者开展更多有效地沟通、互动来积攒监管经验以制定明确、具体的规则,从而指引企业履行大模型备案义务,尤其是备案所需的安全评估。

在此背景下,2023年10月11日,全国网络安全标准化技术委员会秘书处发布《生成式人工智能服务安全基本要求(征求意见稿)》(以下简称“《征求意见稿》”),就包含语料安全、模型安全在内的生成式人工智能服务安全的基本要求广泛征求社会公众意见。2024年3月1日,历时近半年,《生成式人工智能服务安全基本要求》(以下简称“《基本要求》”)正式发布。根据规范内容,我们理解,《基本要求》对《暂行办法》相关合规要求例如数据来源合法、内容安全等在执行规则方面的细化,并对生成式人工智能服务提供者在实践中开展安全评估提供有效的路径,不仅能推动企业提高其自身的生成式人工智能服务安全能力,还可为监管部门评价特定生成式人工智能服务的安全水平提供参考标准。

基于前述,本文尝试明晰《基本要求》的出台背景与实践定位,梳理《基本要求》所涉的各类安全要求,以便为相关企业遵循执行《基本要求》提供抓手。

一、规范背景与定位

1.系对《暂行办法》的细化支撑,对生成式人工智能服务其他适用法律法规的增强衔接

从规范效力来看,《基本要求》属于全国信息安全标准化技术委员会编制的技术文件,是一种旨在引导、指引生成式人工智能服务安全发展的指南类文件,而不具备强制性法律效力。但若逐一比对《暂行办法》除安全评估相关要求之外的通用规定(即第5-7章),可以看到《基本要求》并非是空中楼阁地架设额外合规义务,而是对《暂行办法》接近于一一对应的细化、解释,以及对于《暂行规定》上位法、其他监管生成式人工智能服务的法律法规的增强衔接性规定,故可以为服务提供者有的放矢落实《暂行办法》,在现行网络空间治理法律框架下合法合规提供生成式人工智能服务提供实践指引与监管侧重参照。

《基本要求》与《暂行办法》规定的具体对应关系,可参见下表:

《基本要求》规定

《暂行办法》规定

语料安全

语料来源安全

语料来源管理:不得使用含违法不良信息超过5%的语料语料搭配:从语言、模态、境内外来源方面提出多样性要求;

来源可追溯:针对开源、自采、商业语料及使用者输入信息等不同来源语料提出可追溯要求;

国家要求阻断的信息不应作为语料

第四条第(二)款

第七条第(一)

(四)(五)款第九条

语料内容安全

采取内容过滤措施过滤违法不良信息

采取知识产权保护措施:设置知识产权负责人并建立管理策略、识别语料知产侵权风险、建立投诉举报渠道等采取个人信息保护措施:取得合法性基础

第四条第(三)

(四)款

第七条第(二)

(三)(五)款第九条

语料标注

安全

标注人员规则

标注规则

标注内容准确性要求

隔离存储安全性标注数据

第八条

模型安全

应使用第三方已备案模型提供服务模型生成内容安全要求:将内容安全嵌入训练目的、采取模型输入信息检测和常态化检测机制

生成内容准确性

生成内容可靠性

第四条第(五)款第九条第十七条

安全措施

模型适用人群、场合、用途要求:针对向

关键信息基础设施、未成年人提供服务的

特殊要求

服务透明度要求使用者输入信息用于训练要求

内容标识义务训练、推理所采用的计算系统要求接受公众或使用者投诉举报向使用者提供服务模型更新、升级服务稳定、持续

基本涵盖《暂行规定》第三章“服务规范”要求的安全措施,故此处对具体条款不予——列举。

值得注意的是,除《暂行规定》及其上位法外,考虑到《基本要求》列明的参考文献还特别包括了《中华人民共和国密码法》《商用密码管理条例》以及《网络信息内容生态治理规定》等生成式人工智能服务通常受到规制的法律法规,故从《基本要求》的规定中同样可以看到对前述规范的增强衔接性规定。例如,安全措施要求之“训练、推理所采用的计算系统要求”明确提出“对系统所采用芯片宜支持基于硬件的安全启动、可信启动流程及安全性验证”,即建议企业采用可信计算芯片,并应当注意遵循密码法、商用密码相关规定。

2.大模型备案的配套指南

另一方面,根据《基本要求》总则,除说明其旨在支撑

文档评论(0)

150****5147 + 关注
实名认证
内容提供者

二级建造师持证人

分享知识,传播快乐!

领域认证该用户于2024年03月19日上传了二级建造师

1亿VIP精品文档

相关文档