360《大模型安全白皮书》 (2) .docxVIP

下载本文档

3
0
约3.12万字
约 53页
2025-12-22 发布于浙江
举报
版权申诉

360《大模型安全白皮书》 (2) .docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

安全·向善·可信·可控

让AI世界更安全更美好

大模型安全·向善

安全白皮书可信·可控让AI世界更安全更美好

引言：外筑内固，构建大模型安全全链路防护体系

据IDC预测，到2030年，人工智能将为全球带来22.3万亿美元经济收入，大模型正驱动百行千业智能化变革，而开源大模型在性能提升、部署成本降低的推动下，加速向政务、金融、能源等重点行业落地，安全风险也随之渗透到全生命周期：从模型层的提示注入、越狱攻击，到数据层的敏感信息泄露，再到应用层的智能体越权，任何一处漏洞都可能威胁个人、企业国家的财产安全，甚至是生命安全。清晰的网络安全边界正不断消融、趋于模糊，并延伸至大模型的全链路安全，传统基于规则和特征匹配的防御体系已然失效。

我们正在从传统的“网络安全”时代，迈入以“大模型安全”为核心挑战的新阶段。当前威胁呈现指数级演化态势：一方面，攻击面急剧扩大，针对算力基础设施的劫持、供应链中的恶意模型文件、以及利用LangChain等框架漏洞的新型攻击，表明风险已深度嵌入技术底座。另一方面，攻击主体高度“平民化”，自然语言取代专业代码成为攻击武器，提示注入、越狱攻击让“全民黑客”从概念走向现实，极大降低了网络犯罪门槛。与此同时，模型固有的“幻觉”问题、智能体在工具调用中的越权风险、以及数据泄露与知识污染，共同构成了一个多维、动态、交织的复杂威胁矩阵。

面对这一全球性挑战，中国开创了“发展与安全并重”的敏捷治理之路，以《生成式人工智能服务管理暂行办法》为代表的“包容审慎、分类分级”原则，为技术创新与风险防控提供了动态平衡的框架。

在此背景下，360主张：必须采用以AI对抗AI、原生融合安全的新范式来应对大模型时代的安全挑战。我们提出“外筑‘以模治模’动态屏障，内固‘平台原生’安全底座的核心理念，将安全能力内嵌于大模型的构建、训练、部署与运营的全过程。通过构建一个纵深防御、动态演化的全景框架，从基础设施安全、内容与价值对齐、幻觉缓解到智能体行为管控，实现从“网络安全”到“大模型安全”的范式升维，为人工智能时代提供一个“安全、向善、可信、可控”

的底座。

核心观点

本白皮书系统性地论证了大模型安全正经历从传统网络边界防御到原生、全栈、智能动态防御的范式转移，并提出“外筑以模治模动态屏障，内固平台原生安全底座”的核心理念，覆盖“安全、向善、可信、可控”四大支柱的全景安全框架，构建智能时代的核心免疫系统。

1.风险之变：从边界防御到全栈免疫

大模型安全风险是系统性、全栈式的。它贯穿基础设施、模型层、数据层、智能体层及用户端五大层次，具体表现为算力劫持、供应链投毒、内容越狱、模型幻觉、知识污染、隐私泄露、行为失控以及工具滥用等诸多方面，共同构成了一个传统安全方案无法应对的复杂威胁立体空间。

2.攻击之变：从专业黑客到全民黑客

攻击技术持续向高端化演进，例如针对框架和基础设施的深度利用；与此同时，攻击主体则日趋平民化，“自然语言黑客”的出现极大降低了攻击门槛。这导致攻防不对称性加剧，必须发展出同等智能、动态感知的防御体系。

3.治理之智：中国特色的“发展与安全”平衡术

中国的治理模式采用“发展与安全并重”的动态平衡策略。通过“包容审慎、分类分级”的监管框架，既划定安全底线，又为技术快速迭代预留了弹性空间，为产业创新提供了关键的政策窗口期。

4.应对之道：以模治模+平台原生安全

360提出的“以模治模+平台原生安全”是应对新范式的技术必然。它通过专用安全大模型，例如风险检测、幻觉纠正与红蓝对抗模型，对抗通用大模型风险，它既具备“外挂式”插件的灵活快速，又兼具“原生式”的深度安全能力，实现了双向赋能的协同防御，构筑起从模型、数

据、内容到行为的全链路深度防护体系。

5.生存之道：开放共生，生态共治

大模型安全的复杂性、全局性，决定了仅靠单一力量的技术或资源难以实现全链路、全场景的大模型安全治理。必须通过标准共建、产学研协同——例如开源安全模型、共建联合平台，以及组建产业联盟等形式，汇聚各方力量，共同打造智能时代可信、向善的安全基底。这既是产业发展的必然要求，也是国家层面的战略需求。

01 02

大模型安全·向善

安全白皮书可信·可控让AI世界更安全更美好

法律声明

三六零数字安全科技集团有限公司（或称“360”）提醒您在阅读或使用本文档之前，仔细阅读、充分理解本法律声明的全部内容。您对本文档的任何阅读或使用行为，即视为您已认可并同意接

受本声明的全部约束。

6.反馈与联络

如您发现本文档存在任何错误、疑问或可能的侵权内容，请通过官方指定渠道与我们联系:

service-tech@360.cn

1.文档获取与使用

您应通过360官方指定网站或360授权的其他正

您可能关注的文档

文档评论（0）

wsb + 关注: 实名认证

文档贡献者

学生

咨询Ta 进入空间

1亿VIP精品文档

更多 >

360《大模型安全白皮书》 (2) .docxVIP