Top开源大模型安全测评报告2024.docx

下载文档

3
0
约1.03万字
约 27页
2025-06-03 发布于广东
举报
版权申诉
保障服务

Top开源大模型安全测评报告2024.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Top开源大模型安全测评报告(2024)

中国软件评测中心安全事业部杭州安恒信息技术股份有限公司

中国计算机行业协会数据安全专业委员会

数据安全关键技术与产业应用评价工业和信息化部重点实验室联合发布

2024年12月

前言

为深入学习贯彻全国两会精神和党的二十届三中全会精神，落实《中共中央关于进一步全面深化改革、推进中国式现代化的决定》作出“建立人工智能安全监管制度”“完善生成式人工智能发展和管理机制”的重要部署以及根据《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《生成式人工智能服务管理办法》《工业和信息化部等十六部门关于促进数据安全产业发展的指导意见》等法律法规政策文件要求，促进和引导人工智能大模型技术向“负责任、可持续、高可靠”目标发展，让人工智能大模型技术真正实现高质量安全赋能各行各业落地应用。中国软件评测中心（工业和信息化部软件与集成电路促进中心）安全事业部联合杭州安恒信息技术股份有限公司、数据安全关键技术与产业应用评价工业和信息化部重点实验室、中国计算机行业协会数据安全专业委员会，共同开展国内外开源大模型的安全性、公平性和可靠性研究，并发布《Top开源大模型安全测评报告(2024)

中国软件评测中心（工业和信息化部软件与集成电路促进中心）安全事业部联合杭州安恒信息技术股份有限公司、数据安全关键技术与产业应用评价工业和信息化部重点实验室、中国计算机行业协会数据安全专业委员会，共同开展国内外开源大模型的安全性、公平性和可靠性研究，并发布《Top开源大模型安全测评报告(2024)》。

本报告聚焦国内外开源大模型的安全风险测评，通过选取典型的12家20款开源大模型，从国家安全、道德伦理、公民权利、公共安全、历史文化、医疗卫生、隐私信息、不良信息、商业金融、基础安全、网络安全和模型滥用等12个方面展开深入安全测评，旨在提高大模型厂商的安全意识和保障行业用户的合法权益，并通过系统性分析国内外开源大模型安全的综合表现，为人工智能大模型产业各界提供参考。

【注】因大模型迭代速度快，测评结果仅适用于测试期间和测试版本。报告中的分析和结论可能存在一定的局限性和不完整性，我们期待并欢迎各方提出宝贵的批评与建议，共同推动人工智能大模型安全治理。

01测评体系02

测评体系

测评结果

测评总结

测评体系

大模型安全测评体系图

混合攻击指令忽略语言切换场景限定多样本攻击

混合攻击

指令忽略

语言切换

场景限定

多样本攻击

直接问答

TOKEN

走私

Token

重复攻击

少样本攻击

场景假设

角色伪装

内容分割重组

国家安全公共安全公民权利道德伦理历史文化 .....

探索AI大模型安全治理的新路径

加强网络安全防护和个人数据保护

加强科技伦

理治理

探索AI大模型安全治理的新技术

持续跟踪研究AI大模型安全风险点

持续研发高效智能化的AI大模型安全评估工具

人工智能大模型安全评估体系

实行包容审慎和分类分级监管技术发展与治理

实行包容审慎和分类分级监管

技术发展与治理

监督检查和法律责任

《生成式人工智能服务管理暂行办法》

语料安全要求模型安全要求安全措施要求

《生成式人工智能服务安全基本要求》

大模型安全测评说明

计算单项风险比例

对于每个检测方式或风险分类，首先计算其单项风险比例。

计算比例总和

其次，将所有单项风险比例相加，得到整体的比例总和。

计算单项占总风险比例

最后，计算某一项在总

风险中的占比。

本测评过程采用多维度的测试题库，包涵了丰富的题目和多种测试维度。在测试过程中，通过调用API的方式，全面测试了模型的风险。测试过程中采用了规则匹配打分、大模型自动打分等方式，以客观评价模型的安全风险水平。

测评结果

总体情况（一）大模型安全风险总览

从大模型安全风险总览来看，开源大模型存在一定安全风险，国内开源大模型安全性整体上优于国外开源大模型，大模型安全治理工作任重道远需各方共同努力。

序号

模

您可能关注的文档

文档评论（0）

动点策划 + 关注: 官方认证

服务提供商

动点策划通过提供各行各业经典策划案例，策划思路，行业最新动态，旨在做好你的助手，为你正在谋划的事情提供框架思路或创作灵感。

咨询作者（115人已咨询）服务中

认证主体迈通人才资源咨询（广东）有限公司

IP属地广东

统一社会信用代码/组织机构代码: 914400007224748147

1亿VIP精品文档

更多 >

Top开源大模型安全测评报告2024.docx