- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
安全领域大模型构建范式与实践
吴石腾讯安全科恩实验室
CONTENTS/目录
0102概述 安全领域大模型
构建范式
0304安全领域大模型 总结展望
落地实践
10概述
1
18年起探索“AI+安全”,目前重点关注“AI赋能安全”方向
科恩愿景:用AI赋能安全产品和业务,打造覆盖威胁感知、研判、防御的智能安全闭环
SecurityofAI(AI自身安全) AIforSecurity(AI赋能安全)
核心目标 确保AI系统自身安全性
技术路径 对抗样本防御模型鲁棒性增强
业务价值 防御AI系统被恶意利用
提升安全产品/业务智能化水平
AI能力与安全知识、数据融合
威胁检测准确率提升效率提升
2019
特斯拉Autopilot安全研究 产学研合作
对抗样本生成算法,精准误导图像识别,首个对抗商用自动驾驶系统图像识别功能的研究案例
论文成果
10余篇CCF-A顶级会议论文发布
2020 对车道级系统攻击的完善研究发布于USENIXSecurity
产品落地
4
AI大模型赋能网络安全新范式
AI大模型取得突破性进展,带来发展机遇 安全新范式:网络安全大模型和平台相继推出
腾讯元宝
通用大模型变革各行业
?AI大模型通过大算力、大规练数据突破自然语言处理的瓶颈
?摆脱繁杂的算法、算力、数据整
合工作,快速孵化行业大模型
掀起AIGC内容生成浪潮
?理解用户需求
?生产不同风格的文本、图
片、视频等内容
微软发布MicrosoftSecurityCopilot
应用
谷歌发布GoogleCloudSecurityAIWorkbench
优化人机交互方式 代码/流量分析
告警/攻击研判解读
安全知识问答 安全智能运营
?快速获取想要的信息或服务?减少用户输入负担
?根据反馈和偏好,动态调整输出
融合工作方式,提升效率
?辅助日常重复性工作和手动操作?涌现更多智能助手类生产力工具
?业务改造升级
实现
基座模型上增加安全领域数据进行训练,协同智能体框架、安全知识库、工具库
5
02安全领域大模型构建范式
安全语料构建与科学评测双轮驱动安全领域大模型发展
?通用大模型持续突破,是未来的构建范式,高质量领 ?大模型落地,评测是关键
域语料仍是解锁专业任务的关键钥匙 ?
?
客观量化模型能力
指导优化方向
构建范式一:构造高质量网络安全语料
数据采集、清洗、评估,形成独有的安全领域语料库
融入腾讯混元大模型训练,网络安全领域能力明显提升
构建范式二:首创大模型网络安全领域能力评测体系
设计评测体系,搭建评测平台,构建评测数据
输出头部大模型的评测结果
7
SecCorpus科恩安全语料建设——完整流程构建
数据清洗套件
多源数据采集
CommonCrawl
SecCorpus构建一套完整的数据采集、数据清洗、数据评估流程
数据清洗
去重
书籍 安全语料召回
百科数据 关键词过滤
安全站点 基于分类器过滤
Arxiv
语言清洗
脏数据过滤
自定义规则过滤
数据质量过滤
FastText文本质量判定模型
语言模型计算PPL
数据去重
MinHash
LSH
…
开源数据 数据质量评测
8
SecCorpus科恩安全语料建设——效果得到验证
SecCorpus实现数据到模型能力端到端监控
预训练安1 预训练安全小模型 全小模型
基于清洗的安全数据预训练160M-1.1B参数的小模型,160M模型在滚动测试集上的困惑度已达到1.8B通用模型水平
2 增量预训练 约20Btoken
对Qwen、Baichuan等开源模型进行增量预训练,评估显示安全领域性
能显著提升,已超过ChatGPT
高质量安全领域数据
3 混合数据预训练
构建的安全数据已融入腾讯混元大模型训练,网络安全领域能力明显 增量预训练
提升,科恩基于最新混元大模型搭建的威胁情报智能研判助手取得更
优效果
混合数据
预训练
9
SecBench网络安全大模型评测背景
行业现状 团队介绍
现阶段行业内针对大模型的评测主要为:
通用大模型评测 大模型内生安全评测 领域大模型评测 2023年发布SecBench网络安全大模型评测平台(secbench.org)
? 还没有针对大模型安全能力评测基准 2025年发布arxiv技术文章,开源部分评测数据? 其中涉及到垂直领域的大模型评测,评测内容多为知识问题
型选择题,较难客观评估大模型在垂直领域的能力。
10
SecBench网络安全大模型评测成果
搭建评测框架
支持不同模型、不同数据、不同评测指标的灵活接入和快速评测
积累数据
您可能关注的文档
最近下载
- 2023年全国人大机关直属事业单位招聘工作人员21人笔试参考题库(共500题)答案详解版.docx VIP
- 江苏省高二下期末考试语文试题(含答案解析).docx VIP
- T_CECS 1030-2022 建设项目全过程工程咨询标准.docx VIP
- okuma数控系统编程手册2.pdf VIP
- 2025激扬正气淬炼本色践行使命廉洁微党课ppt课件(优质ppt).pptx VIP
- 2025年(完整版)英语高考核心高频688词汇 .pdf VIP
- 2025年纺织行业绿色生产与碳中和路径研究报告.docx
- 合肥市招聘社区后备干部考试题库.pdf VIP
- 《精密机械设计基础(第二版)》裘祖荣习题参考答案.pdf VIP
- 大客户管理的方法和策略.pptx
原创力文档


文档评论(0)