安全大模型发展路径洞察与实践-潘剑锋 .docxVIP

安全大模型发展路径洞察与实践-潘剑锋 .docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

安全大模型发展路径洞察与实践

主讲人:潘剑锋360集团首席科学家、数字安全集团CTO

2025年3月

CONTENTS/目录

大模型的 现阶段如何做好

“快慢思考” 安全大模型?

36安全大模型

落地实践

大模型的快慢思考”

大语言模型的“理解力”

当前大语言模型表现的“理解力” 1 “统计性”理解DeepSeek-R1在数学、代码、自然语言等任务上性能可

OpenAI-o1模型正式版。

?在AIME2024数学基准测试中,DeepSeekR1得分率79.8%,Op

o1得分率79.2%。

在依靠统计获得的文字符号之间的关联关系,是一种

语言层面的表象关联

?在MATH-500基准测试中,DeepSeekR1得分率97.3%,OpenAI

分率96.4%。 相通之处: 存在差异:随着语料的丰富,逐步 事实性知识、逼近“本质性”理解 反思型推理等

2 “本质性”理解

?人类在抽象知识层面依据内容与客观逻辑形成的关联

大模型的快慢思考”

参考诺贝尔经济学奖获得者、心理学家丹尼尔·卡尼曼(DanielKahneman)在其著作《思考,快与慢》中提出人类大脑处理信息的不同方式。

大模型的“快慢思考”

2024年3月,在360安全大模型3.0发布会上,圈内首次公开引入认知心

理学的快、慢思考,来说明大模型本身到底擅长做什么、不擅长做什么?

大模型“快思考”

?从大量标签(经验)数据中找出统计性规律,从而解决同类问题的过程,我们称之为“快思考”;(一般是快速的、不太耗费资源的、内隐的(无需反省),也是很难控制或修正的)

大模型“深度思考”

?在问题和答案之间加入大段推理过程,通过推理时计算不断提升生成答案的准确性,我们称之为“深度思考”(类似deepseek-r1,GPT-o1/o3)

“慢思考”本质性理解、深度反思、多步推理,消除

“快思考”的“幻觉”

“快思考”“深度思考”基于统计性理解,快速生成

“结果” +生成“过程”

大模型“慢思考”

?基于“本质性”理解的关联分析过程

?一般涉及复杂的计算过程,需要反思、多步骤推理

?整体是缓慢的、耗费资源的、不容易出错、存在控制?可能需要结合外部工具、知识调用等

大模型擅长做什么?

目前大模型的价值是很好的模拟了人脑的“快思考”

人脑 “快思考” 能力 “快思考”能力 大模型

人脑要达到一个比较好的“快思考”效果,需要细分 通过海量数据训练,做文字符号层面的统计处理,从数据中

场景,然后进行反复训练,才能达到快速、潜意识判断。 找出统计性规律,在概率的意义上掌握学习样本所反映的隐含知

识,并以此为基础来生成内容。

概率性关联关系 自回归序列生成

乒乓球训练 人脸判定情绪

推理大模型擅长做什么?

推理大模型(GP o1/o、DeepSee R等)通过“深度思考”能力,向“慢思考”更近一步

“知道” :概率性关联关系 大模型深度思考” 能力 “理解” :本质性关联关系

推理大模型的价值是模拟了“深度思考”,其使得模型的推理向“慢思考”更近了一步。大模型的“深度思考”试图突破在“快思考”阶段,模型训练数据的局限,寻找能力增长的“第二

曲线”。 ……

LongCoT序列

推理时计算

结果导向的强化学习方法

“快思考” 能力 “慢思考”能力

当前大模型距离“慢思考”还有多远?

依靠当前大模型结构尚未达到“本质性理解”大模型不擅长“慢思考”任务

人脑擅长“慢思考” 理想很丰满,现实很骨干 大模型不擅长“慢思考”

?“慢思考”的本质:是对事物本质性理解,需借助事实性知识,通过多步推理、反思,

知识的本质性理解 调动注意力分析 是“深思熟虑”的结晶

?大模型的“深度思考”不是真正的“慢思考”:其并没离开语言模型的框架,依然是自

回归单向序列生成?在简单任务上,大模型生成的基于表象的统计性理解已经逼近人类的“慢思考”;但在

复杂任务上,“快思考”“ 慢思考”就会产生明显差异注重规划和反思 思考速度慢

……

准确性高

不擅长长链路任务规划 不擅长逻辑推理

不擅长事实认知 不擅长实时反思……

现阶段如何做好安全大模型?

什么是真正的安全大模型?

“博学人+医学书” “主任医师”

通用大模型的安全领域应用

通用大模型:关键信息提取、归纳总结、知识问答……

安全知识问答、告警结构化解读、报告总结生成……

自然语言理解、知识库召回,

大模型对召回内容进行总结输出

安全大模型

干得了通用大模型干不了的安全任务,EDR行为端到端研判、网络流量端到端研判……

异常行为检测、安全告警降噪、威胁组织归因……

创新模型结构,优化推理程序,通

您可能关注的文档

文档评论(0)

wsb + 关注
实名认证
文档贡献者

学生

1亿VIP精品文档

相关文档