- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
安全·向善·可信·可控
让AI世界更安全更美好
大模型 安全·向善
安全白皮书 可信·可控 让AI世界更安全更美好
引言:外筑内固,构建大模型安全全链路防护体系
据IDC预测,到2030年,人工智能将为全球带来22.3万亿美元经济收入,大模型正驱动百行千业智能化变革,而开源大模型在性能提升、部署成本降低的推动下,加速向政务、金融、能源等重点行业落地,安全风险也随之渗透到全生命周期:从模型层的提示注入、越狱攻击,到数据层的敏感信息泄露,再到应用层的智能体越权,任何一处漏洞都可能威胁个人、企业国家的财产安全,甚至是生命安全。清晰的网络安全边界正不断消融、趋于模糊,并延伸至大模型的全链路安全,传统基于规则和特征匹配的防御体系已然失效。
我们正在从传统的“网络安全”时代,迈入以“大模型安全”为核心挑战的新阶段。当前威胁呈现指数级演化态势:一方面,攻击面急剧扩大,针对算力基础设施的劫持、供应链中的恶意模型文件、以及利用LangChain等框架漏洞的新型攻击,表明风险已深度嵌入技术底座。另一方面,攻击主体高度“平民化”,自然语言取代专业代码成为攻击武器,提示注入、越狱攻击让“全民黑客”从概念走向现实,极大降低了网络犯罪门槛。与此同时,模型固有的“幻觉”问题、智能体在工具调用中的越权风险、以及数据泄露与知识污染,共同构成了一个多维、动态、交织的复杂威胁矩阵。
面对这一全球性挑战,中国开创了“发展与安全并重”的敏捷治理之路,以《生成式人工智能服务管理暂行办法》为代表的“包容审慎、分类分级”原则,为技术创新与风险防控提供了动态平衡的框架。
在此背景下,360主张:必须采用以AI对抗AI、原生融合安全的新范式来应对大模型时代的安全挑战。我们提出“外筑‘以模治模’动态屏障,内固‘平台原生’安全底座的核心理念,将安全能力内嵌于大模型的构建、训练、部署与运营的全过程。通过构建一个纵深防御、动态演化的全景框架,从基础设施安全、内容与价值对齐、幻觉缓解到智能体行为管控,实现从“网络安全”到“大模型安全”的范式升维,为人工智能时代提供一个“安全、向善、可信、可控”
的底座。
核心观点
本白皮书系统性地论证了大模型安全正经历从传统网络边界防御到原生、全栈、智能动态防御的范式转移,并提出“外筑以模治模动态屏障,内固平台原生安全底座”的核心理念,覆盖“安全、向善、可信、可控”四大支柱的全景安全框架,构建智能时代的核心免疫系统。
1.风险之变:从边界防御到全栈免疫
大模型安全风险是系统性、全栈式的。它贯穿基础设施、模型层、数据层、智能体层及用户端五大层次,具体表现为算力劫持、供应链投毒、内容越狱、模型幻觉、知识污染、隐私泄露、行为失控以及工具滥用等诸多方面,共同构成了一个传统安全方案无法应对的复杂威胁立体空间。
2.攻击之变:从专业黑客到全民黑客
攻击技术持续向高端化演进,例如针对框架和基础设施的深度利用;与此同时,攻击主体则日趋平民化,“自然语言黑客”的出现极大降低了攻击门槛。这导致攻防不对称性加剧,必须发展出同等智能、动态感知的防御体系。
3.治理之智:中国特色的“发展与安全”平衡术
中国的治理模式采用“发展与安全并重”的动态平衡策略。通过“包容审慎、分类分级”的监管框架,既划定安全底线,又为技术快速迭代预留了弹性空间,为产业创新提供了关键的政策窗口期。
4.应对之道:以模治模+平台原生安全
360提出的“以模治模+平台原生安全”是应对新范式的技术必然。它通过专用安全大模型,例如风险检测、幻觉纠正与红蓝对抗模型,对抗通用大模型风险,它既具备“外挂式”插件的灵活快速,又兼具“原生式”的深度安全能力,实现了双向赋能的协同防御,构筑起从模型、数
据、内容到行为的全链路深度防护体系。
5.生存之道:开放共生,生态共治
大模型安全的复杂性、全局性,决定了仅靠单一力量的技术或资源难以实现全链路、全场景的大模型安全治理。必须通过标准共建、产学研协同——例如开源安全模型、共建联合平台,以及组建产业联盟等形式,汇聚各方力量,共同打造智能时代可信、向善的安全基底。这既是产业发展的必然要求,也是国家层面的战略需求。
01 02
大模型 安全·向善
安全白皮书 可信·可控 让AI世界更安全更美好
法律声明
三六零数字安全科技集团有限公司(或称“360”)提醒您在阅读或使用本文档之前,仔细阅读、充分理解本法律声明的全部内容。您对本文档的任何阅读或使用行为,即视为您已认可并同意接
受本声明的全部约束。
6.反馈与联络
如您发现本文档存在任何错误、疑问或可能的侵权内容,请通过官方指定渠道与我们联系:
service-tech@360.cn
1.文档获取与使用
您应通过360官方指定网站或360授权的其他正
您可能关注的文档
- 2024年全球DevSecOps开发安全和运维现状研究报告 趋势挑战机遇及应对策略 英文版 .docx
- 2025人工智能AI政府行动路线图研究报告 英文版 .docx
- 工控防火墙洞察报告2025 .docx
- 360《大模型安全白皮书》 .docx
- 2024年度OpenAtom openKylin社区技术全景案例集 .docx
- 零信任发展洞察报告2024年解读PPT .docx
- 2025央国企CIO选型指南——ERP产品 .docx
- Coverity快速入门手册-V1.31 .docx
- 2024-开源软件风险分析报告.pdf
- Writer :2024企业级全栈生成式AI技术框架与落地策略指南(英文版) .docx
最近下载
- 低压柜试题及答案.docx VIP
- (医学课件)PD1抑制剂.ppt VIP
- 联轴器和离合器机械设计.docx VIP
- DBJ41T166-2016 城镇道路建筑垃圾再生集料路面基层施工技术规范.pdf VIP
- UI设计创意表达与实践(肖文婷)配套课件教学课件1-3 初始UI设计师.ppt VIP
- JGJ/T235-2011建筑外墙防水工程技术规程 含条文.docx VIP
- 口腔预防医学 绪论课件.ppt VIP
- UI设计创意表达与实践(肖文婷)配套课件教学课件1-2 初始UI设计行业.ppt VIP
- 建筑制图与识图习题集 .pdf VIP
- 疯狂猜成语所有图片答案大全(史上最全)-猜成语图案答案.docx VIP
原创力文档


文档评论(0)