2024生成式大模型安全评估白皮书-中国科学院蚂蚁安全实验室.pdf

下载文档

2
0
约15.22万字
约 119页
2025-01-07 发布于广东
举报
版权申诉
保障服务

2024生成式大模型安全评估白皮书-中国科学院蚂蚁安全实验室.pdf

1、本文档共119页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

PromptGenerate

生成式大模型

安全评估白皮书

LargeLanguageModel

前言

自2022年11月以来，以ChatGPT为代表的生成式大模型持续引发全球广泛关注。作为新

一轮人工智能技术革命的代表性成果，生成式大模型的迅速发展，正在深刻重塑全球人工智

能技术格局，为我国数字经济高质量发展和智能化转型注入新的动能。然而，随着技术应用

的不断扩展，其潜在的安全风险逐渐凸显。诸如“大模型幻觉”、三星公司机密资料泄露等事

件，反映了生成式大模型在隐私保护、恶意滥用、技术漏洞及合规性等方面的复杂挑战。这

些问题的出现，不仅对技术的安全性提出了更高要求，也对产业的规范发展和社会治理能力

构成了严峻考验。

我国对此高度重视，出台了《生成式人工智能服务管理暂行办法》等一系列政策文件，

明确了生成式大模型技术在安全性、风险防控和合规性方面的基本原则和监管要求，为技术

的健康发展提供了系统指引和政策保障。这些举措充分体现了我国在全球人工智能技术治理

中秉持的前瞻性战略眼光和责任担当。

近期，OpenAI发布了更擅长处理复杂推理任务的o1和o3系列模型，标志着生成式大模

型在复杂应用场景中的潜力进一步提升。然而，技术的快速迭代也对构建科学化、系统化的

生成式大模型安全评估框架提出了迫切需求。构建这一框架，需要从技术性能、风险防控、

合规性等多个维度明确评估指标体系，系统性降低潜在风险，为行业提供权威的技术指导。

这不仅将促进生成式大模型技术向安全、可信、可持续的方向发展，也为全球人工智能技术

治理提供了可借鉴的“中国方案”。

为积极应对生成式大模型的安全挑战，智能算法安全重点实验室（中国科学院）、公安部

第三研究所和蚂蚁安全实验室联合编写了2024年度《生成式大模型安全评估白皮书》。白皮书

全面梳理了生成式大模型的发展现状与安全风险，从安全评估方法到实践案例，深入剖析了当

前技术面临的关键挑战及应对策略，致力于为学术研究、产业实践和政策制定提供重要参考。

希望通过这一系统性研究，助力生成式大模型安全性研究与应用推广，为构建安全、可信的人

工智能生态体系提供坚实支撑，推动技术向着服务人类社会福祉的方向健康发展。

一、生成式大模型发展现状01（2）传播虚假信息293.3事实性评估624.1.6大模型系统安全评估实践96

（3）违反法律法规303.3.1事实性评估指标62

1.1生成式大语言模型024.2文生图大模型安全性评估98

（4）缺乏安全预警机制31（1）基于规则的评估指标63

1.1.1OpenAIGPT系列024.2.1HolisticEvaluationof98

2.2.2隐私风险33

您可能关注的文档

文档评论（0）

沧海一粟2020 + 关注: 实名认证

内容提供者

文不能提笔控萝莉，武不能骑马战人妻，入佛门则六根不净，入商道则狼性不足，想想还是做文字民工！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

2024生成式大模型安全评估白皮书-中国科学院蚂蚁安全实验室.pdf