安全领域大模型构建范式与实践-吴石 .docxVIP

下载本文档

0
0
约3.81千字
约 40页
2025-12-22 发布于浙江
举报
版权申诉

安全领域大模型构建范式与实践-吴石 .docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

安全领域大模型构建范式与实践

吴石腾讯安全科恩实验室

CONTENTS/目录

0102概述安全领域大模型

构建范式

0304安全领域大模型总结展望

落地实践

10概述

18年起探索“AI+安全”，目前重点关注“AI赋能安全”方向

科恩愿景：用AI赋能安全产品和业务，打造覆盖威胁感知、研判、防御的智能安全闭环

SecurityofAI（AI自身安全） AIforSecurity(AI赋能安全)

核心目标确保AI系统自身安全性

技术路径对抗样本防御模型鲁棒性增强

业务价值防御AI系统被恶意利用

提升安全产品/业务智能化水平

AI能力与安全知识、数据融合

威胁检测准确率提升效率提升

2019

特斯拉Autopilot安全研究产学研合作

对抗样本生成算法，精准误导图像识别，首个对抗商用自动驾驶系统图像识别功能的研究案例

论文成果

10余篇CCF-A顶级会议论文发布

2020 对车道级系统攻击的完善研究发布于USENIXSecurity

产品落地

AI大模型赋能网络安全新范式

AI大模型取得突破性进展，带来发展机遇安全新范式：网络安全大模型和平台相继推出

腾讯元宝

通用大模型变革各行业

?AI大模型通过大算力、大规练数据突破自然语言处理的瓶颈

?摆脱繁杂的算法、算力、数据整

合工作，快速孵化行业大模型

掀起AIGC内容生成浪潮

?理解用户需求

?生产不同风格的文本、图

片、视频等内容

微软发布MicrosoftSecurityCopilot

应用

谷歌发布GoogleCloudSecurityAIWorkbench

优化人机交互方式代码/流量分析

告警/攻击研判解读

安全知识问答安全智能运营

?快速获取想要的信息或服务?减少用户输入负担

?根据反馈和偏好，动态调整输出

融合工作方式，提升效率

?辅助日常重复性工作和手动操作?涌现更多智能助手类生产力工具

?业务改造升级

实现

基座模型上增加安全领域数据进行训练，协同智能体框架、安全知识库、工具库

02安全领域大模型构建范式

安全语料构建与科学评测双轮驱动安全领域大模型发展

?通用大模型持续突破，是未来的构建范式，高质量领 ?大模型落地，评测是关键

域语料仍是解锁专业任务的关键钥匙 ?

客观量化模型能力

指导优化方向

构建范式一：构造高质量网络安全语料

数据采集、清洗、评估，形成独有的安全领域语料库

融入腾讯混元大模型训练，网络安全领域能力明显提升

构建范式二：首创大模型网络安全领域能力评测体系

设计评测体系，搭建评测平台，构建评测数据

输出头部大模型的评测结果

SecCorpus科恩安全语料建设——完整流程构建

数据清洗套件

多源数据采集

CommonCrawl

SecCorpus构建一套完整的数据采集、数据清洗、数据评估流程

数据清洗

去重

书籍安全语料召回

百科数据关键词过滤

安全站点基于分类器过滤

Arxiv

语言清洗

脏数据过滤

自定义规则过滤

数据质量过滤

FastText文本质量判定模型

语言模型计算PPL

数据去重

MinHash

LSH

…

开源数据数据质量评测

SecCorpus科恩安全语料建设——效果得到验证

SecCorpus实现数据到模型能力端到端监控

预训练安1 预训练安全小模型全小模型

基于清洗的安全数据预训练160M-1.1B参数的小模型，160M模型在滚动测试集上的困惑度已达到1.8B通用模型水平

2 增量预训练约20Btoken

对Qwen、Baichuan等开源模型进行增量预训练，评估显示安全领域性

能显著提升，已超过ChatGPT

高质量安全领域数据

3 混合数据预训练

构建的安全数据已融入腾讯混元大模型训练，网络安全领域能力明显增量预训练

提升，科恩基于最新混元大模型搭建的威胁情报智能研判助手取得更

优效果

混合数据

预训练

SecBench网络安全大模型评测背景

行业现状团队介绍

现阶段行业内针对大模型的评测主要为：

通用大模型评测大模型内生安全评测领域大模型评测 2023年发布SecBench网络安全大模型评测平台（secbench.org）

? 还没有针对大模型安全能力评测基准 2025年发布arxiv技术文章，开源部分评测数据? 其中涉及到垂直领域的大模型评测，评测内容多为知识问题

型选择题，较难客观评估大模型在垂直领域的能力。

SecBench网络安全大模型评测成果

搭建评测框架

支持不同模型、不同数据、不同评测指标的灵活接入和快速评测

积累数据

您可能关注的文档

文档评论（0）

WZF2025 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

安全领域大模型构建范式与实践-吴石 .docxVIP