安全领域大模型构建范式与实践-吴石 .docxVIP

安全领域大模型构建范式与实践-吴石 .docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

安全领域大模型构建范式与实践

吴石腾讯安全科恩实验室

CONTENTS/目录

0102概述 安全领域大模型

构建范式

0304安全领域大模型 总结展望

落地实践

10概述

1

18年起探索“AI+安全”,目前重点关注“AI赋能安全”方向

科恩愿景:用AI赋能安全产品和业务,打造覆盖威胁感知、研判、防御的智能安全闭环

SecurityofAI(AI自身安全) AIforSecurity(AI赋能安全)

核心目标 确保AI系统自身安全性

技术路径 对抗样本防御模型鲁棒性增强

业务价值 防御AI系统被恶意利用

提升安全产品/业务智能化水平

AI能力与安全知识、数据融合

威胁检测准确率提升效率提升

2019

特斯拉Autopilot安全研究 产学研合作

对抗样本生成算法,精准误导图像识别,首个对抗商用自动驾驶系统图像识别功能的研究案例

论文成果

10余篇CCF-A顶级会议论文发布

2020 对车道级系统攻击的完善研究发布于USENIXSecurity

产品落地

4

AI大模型赋能网络安全新范式

AI大模型取得突破性进展,带来发展机遇 安全新范式:网络安全大模型和平台相继推出

腾讯元宝

通用大模型变革各行业

?AI大模型通过大算力、大规练数据突破自然语言处理的瓶颈

?摆脱繁杂的算法、算力、数据整

合工作,快速孵化行业大模型

掀起AIGC内容生成浪潮

?理解用户需求

?生产不同风格的文本、图

片、视频等内容

微软发布MicrosoftSecurityCopilot

应用

谷歌发布GoogleCloudSecurityAIWorkbench

优化人机交互方式 代码/流量分析

告警/攻击研判解读

安全知识问答 安全智能运营

?快速获取想要的信息或服务?减少用户输入负担

?根据反馈和偏好,动态调整输出

融合工作方式,提升效率

?辅助日常重复性工作和手动操作?涌现更多智能助手类生产力工具

?业务改造升级

实现

基座模型上增加安全领域数据进行训练,协同智能体框架、安全知识库、工具库

5

02安全领域大模型构建范式

安全语料构建与科学评测双轮驱动安全领域大模型发展

?通用大模型持续突破,是未来的构建范式,高质量领 ?大模型落地,评测是关键

域语料仍是解锁专业任务的关键钥匙 ?

?

客观量化模型能力

指导优化方向

构建范式一:构造高质量网络安全语料

数据采集、清洗、评估,形成独有的安全领域语料库

融入腾讯混元大模型训练,网络安全领域能力明显提升

构建范式二:首创大模型网络安全领域能力评测体系

设计评测体系,搭建评测平台,构建评测数据

输出头部大模型的评测结果

7

SecCorpus科恩安全语料建设——完整流程构建

数据清洗套件

多源数据采集

CommonCrawl

SecCorpus构建一套完整的数据采集、数据清洗、数据评估流程

数据清洗

去重

书籍 安全语料召回

百科数据 关键词过滤

安全站点 基于分类器过滤

Arxiv

语言清洗

脏数据过滤

自定义规则过滤

数据质量过滤

FastText文本质量判定模型

语言模型计算PPL

数据去重

MinHash

LSH

开源数据 数据质量评测

8

SecCorpus科恩安全语料建设——效果得到验证

SecCorpus实现数据到模型能力端到端监控

预训练安1 预训练安全小模型 全小模型

基于清洗的安全数据预训练160M-1.1B参数的小模型,160M模型在滚动测试集上的困惑度已达到1.8B通用模型水平

2 增量预训练 约20Btoken

对Qwen、Baichuan等开源模型进行增量预训练,评估显示安全领域性

能显著提升,已超过ChatGPT

高质量安全领域数据

3 混合数据预训练

构建的安全数据已融入腾讯混元大模型训练,网络安全领域能力明显 增量预训练

提升,科恩基于最新混元大模型搭建的威胁情报智能研判助手取得更

优效果

混合数据

预训练

9

SecBench网络安全大模型评测背景

行业现状 团队介绍

现阶段行业内针对大模型的评测主要为:

通用大模型评测 大模型内生安全评测 领域大模型评测 2023年发布SecBench网络安全大模型评测平台(secbench.org)

? 还没有针对大模型安全能力评测基准 2025年发布arxiv技术文章,开源部分评测数据? 其中涉及到垂直领域的大模型评测,评测内容多为知识问题

型选择题,较难客观评估大模型在垂直领域的能力。

10

SecBench网络安全大模型评测成果

搭建评测框架

支持不同模型、不同数据、不同评测指标的灵活接入和快速评测

积累数据

文档评论(0)

WZF2025 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档