网站大量收购闲置独家精品文档,联系QQ:2885784924

2024生成式大模型安全评估白皮书-中国科学院蚂蚁安全实验室.pdf

2024生成式大模型安全评估白皮书-中国科学院蚂蚁安全实验室.pdf

  1. 1、本文档共119页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PromptGenerate

生成式大模型

安全评估白皮书

LargeLanguageModel

前言

自2022年11月以来,以ChatGPT为代表的生成式大模型持续引发全球广泛关注。作为新

一轮人工智能技术革命的代表性成果,生成式大模型的迅速发展,正在深刻重塑全球人工智

能技术格局,为我国数字经济高质量发展和智能化转型注入新的动能。然而,随着技术应用

的不断扩展,其潜在的安全风险逐渐凸显。诸如“大模型幻觉”、三星公司机密资料泄露等事

件,反映了生成式大模型在隐私保护、恶意滥用、技术漏洞及合规性等方面的复杂挑战。这

些问题的出现,不仅对技术的安全性提出了更高要求,也对产业的规范发展和社会治理能力

构成了严峻考验。

我国对此高度重视,出台了《生成式人工智能服务管理暂行办法》等一系列政策文件,

明确了生成式大模型技术在安全性、风险防控和合规性方面的基本原则和监管要求,为技术

的健康发展提供了系统指引和政策保障。这些举措充分体现了我国在全球人工智能技术治理

中秉持的前瞻性战略眼光和责任担当。

近期,OpenAI发布了更擅长处理复杂推理任务的o1和o3系列模型,标志着生成式大模

型在复杂应用场景中的潜力进一步提升。然而,技术的快速迭代也对构建科学化、系统化的

生成式大模型安全评估框架提出了迫切需求。构建这一框架,需要从技术性能、风险防控、

合规性等多个维度明确评估指标体系,系统性降低潜在风险,为行业提供权威的技术指导。

这不仅将促进生成式大模型技术向安全、可信、可持续的方向发展,也为全球人工智能技术

治理提供了可借鉴的“中国方案”。

为积极应对生成式大模型的安全挑战,智能算法安全重点实验室(中国科学院)、公安部

第三研究所和蚂蚁安全实验室联合编写了2024年度《生成式大模型安全评估白皮书》。白皮书

全面梳理了生成式大模型的发展现状与安全风险,从安全评估方法到实践案例,深入剖析了当

前技术面临的关键挑战及应对策略,致力于为学术研究、产业实践和政策制定提供重要参考。

希望通过这一系统性研究,助力生成式大模型安全性研究与应用推广,为构建安全、可信的人

工智能生态体系提供坚实支撑,推动技术向着服务人类社会福祉的方向健康发展。

目录

一、生成式大模型发展现状01(2)传播虚假信息293.3事实性评估624.1.6大模型系统安全评估实践96

(3)违反法律法规303.3.1事实性评估指标62

1.1生成式大语言模型024.2文生图大模型安全性评估98

(4)缺乏安全预警机制31(1)基于规则的评估指标63

1.1.1OpenAIGPT系列024.2.1HolisticEvaluationof98

2.2.2隐私风险33

文档评论(0)

沧海一粟2020 + 关注
实名认证
内容提供者

文不能提笔控萝莉,武不能骑马战人妻,入佛门则六根不净,入商道则狼性不足,想想还是做文字民工!

1亿VIP精品文档

相关文档