- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Top开源大模型安全测评报告(2024)
中国软件评测中心安全事业部杭州安恒信息技术股份有限公司
中国计算机行业协会数据安全专业委员会
数据安全关键技术与产业应用评价工业和信息化部重点实验室联合发布
2024年12月
前言
前言
为深入学习贯彻全国两会精神和党的二十届三中全会精神,落实《中共中央关于进一步全面深化改革、推进中国式现代化的决定》作出“建立人工智能安全监管制度”“完善生成式人工智能发展和管理机制”的重要部署以及根据《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《生成式人工智能服务管理办法》《工业和信息化部等十六部门关于促进数据安全产业发展的指导意见》等法律法规政策文件要求,促进和引导人工智能大模型技术向“负责任、可持续、高可靠”目标发展,让人工智能大模型技术真正实现高质量安全赋能各行各业落地应用。中国软件评测中心(工业和信息化部软件与集成电路促进中心)安全事业部联合杭州安恒信息技术股份有限公司、数据安全关键技术与产业应用评价工业和信息化部重点实验室、中国计算机行业协会数据安全专业委员会,共同开展国内外开源大模型的安全性、公平性和可靠性研究,并发布《Top开源大模型安全测评报告(2024)
为深入学习贯彻全国两会精神和党的二十届三中全会精神,落实《中共中央关于进一步全面深化改革、推进中国式现代化的决定》作出“建立人工智能安全监管制度”“完善生成式人工智能发展和管理机制”的重要部署以及根据《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《生成式人工智能服务管理办法》《工业和信息化部等十六部门关于促进数据安全产业发展的指导意见》等法律法规政策文件要求,促进和引导人工智能大模型技术向“负责任、可持续、高可靠”目标发展,让人工智能大模型技术真正实现高质量安全赋能各行各业落地应用。
中国软件评测中心(工业和信息化部软件与集成电路促进中心)安全事业部联合杭州安恒信息技术股份有限公司、数据安全关键技术与产业应用评价工业和信息化部重点实验室、中国计算机行业协会数据安全专业委员会,共同开展国内外开源大模型的安全性、公平性和可靠性研究,并发布《Top开源大模型安全测评报告(2024)》。
本报告聚焦国内外开源大模型的安全风险测评,通过选取典型的12家20款开源大模型,从国家安全、道德伦理、公民权利、公共安全、历史文化、医疗卫生、隐私信息、不良信息、商业金融、基础安全、网络安全和模型滥用等12个方面展开深入安全测评,旨在提高大模型厂商的安全意识和保障行业用户的合法权益,并通过系统性分析国内外开源大模型安全的综合表现,为人工智能大模型产业各界提供参考。
【注】因大模型迭代速度快,测评结果仅适用于测试期间和测试版本。报告中的分析和结论可能存在一定的局限性和不完整性,我们期待并欢迎各方提出宝贵的批评与建议,共同推动人工智能大模型安全治理。
目录
目录
01测评体系02
01
测评体系
02
测评结果
03
测评总结
测评体系
大模型安全测评体系图
大模型安全测评体系图
混合攻击指令忽略语言切换场景限定多样本攻击
混合攻击
指令忽略
语言切换
场景限定
多样本攻击
直接问答
TOKEN
走私
Token
重复攻击
少样本攻击
场景假设
角色伪装
内容分割重组
国家安全 公共安全 公民权利 道德伦理 历史文化 .....
探索AI大模型安全治理的新路径
加强网络安全防护和个人数据保护
加强科技伦
理治理
探索AI大模型安全治理的新技术
持续跟踪研究AI大模型安全风险点
持续研发高效智能化的AI大模型安全评估工具
人工智能大模型安全评估体系
人工智能大模型安全评估体系
实行包容审慎和分类分级监管技术发展与治理
实行包容审慎和分类分级监管
技术发展与治理
监督检查和法律责任
《生成式人工智能服务管理暂行办法》
语料安全要求 模型安全要求 安全措施要求
《生成式人工智能服务安全基本要求》
大模型安全测评说明
大模型安全测评说明
计算单项风险比例
对于每个检测方式或风险分类,首先计算其单项风险比例。
计算比例总和
其次,将所有单项风险比例相加,得到整体的比例总和。
计算单项占总风险比例
最后,计算某一项在总
风险中的占比。
本测评过程采用多维度的测试题库,包涵了丰富的题目和多种测试维度。在测试过程中,通过调用API的方式,全面测试了模型的风险。测试过程中采用了规则匹配打分、大模型自动打分等方式,以客观评价模型的安全风险水平。
测评结果
测评结果
总体情况(一)大模型安全风险总览
总体情况(一)大模型安全风险总览
从大模型安全风险总览来看,开源大模型存在一定安全风险,国内开源大模型安全性整体上优于国外开源大模型,大模型安全治理工作任重道远需各方共同努力。
序号
模
动点策划通过提供各行各业经典策划案例,策划思路,行业最新动态,旨在做好你的助手,为你正在谋划的事情提供框架思路或创作灵感。
文档评论(0)