腾讯_腾讯云黑客松智能渗透挑战赛决赛答辩-D-wnEdg3-2025.pdfVIP

腾讯_腾讯云黑客松智能渗透挑战赛决赛答辩-D-wnEdg3-2025.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Cruiser:CTFAgent

实现探索

演讲人郑国强

AboutUs

战队:D@wnEdg3

单位:香港城市大学(东莞)

中国科学院信息工程研究所

成员:田景仁郑国强

线上排名:8

PART01概述

目录PART02设计思路

PART03总结

PART01

概述

概述——赛题背景

本次挑战赛突破传统CTF模式,首次引入基于大语言模型(LLM)的智能体,实现全流程

自动化渗透测试。参赛队伍需构建以LLM为核心的智能渗透系统,在隔离靶场中完成从信

息收集到攻击利用的完整攻防链路。

每天分两个时段进行,每个时段3小时,每次6~8个题,解题在不出网(仅能访问大模型api)

的情况下进行。

概述——设计框架

PART02

设计思路

设计思路——调度模块

观察1:

LLM在解决问题过程中存在不稳定性,有时能快速找到漏洞点,有时却会陷入冗长的试错循环。

观察2:

题目信息中的题目难度与LLM实际解决能力之间存在不对称。

具体而言,我们观察到:有的题目被设计为‘简单’级别,但大模型在解决时可能比‘中等’甚至‘困

难’级别的题目耗时更长、成功率更低,反之亦然。

观察3:

LLM在解题过程中经常因为题目冗余信息或错误引导而陷入困境无法自拔,但是一旦获得关键提示或修

正方向,可快速解出题目。

设计思路——调度模块

基于以上观察,我们在实践中采用了多级队列调度方法,具体而言:

1.获取题目信息后,将题目全部加入一级队列

2.调度器检查一级队列,若不为空,将题目派发给Agentgroup(每个agentgroup有5个agent同时完成一道

题)。

3.若某个题目在agent执行30步后仍未解出,将其放入二级队列

4.若一级队列为空,从二级队列派发,调度器在派发题目之前获取该题目的提示,并注入到agent的提示词中。

5.二、三、四级队列以此类推,直到题目全部解决。

解释:

1.为了解决观察1所描述的LLM不稳定的问题,我们采用“agent竞赛”方案,使用5个agent来同时解决一道题,

并设置了不同的模型温度,使其在解题过程中产生多样化的行动方案,即使在单个Agent在陷入冗长试错时,

也能依赖其他Agent来解决题目。

2.基于观察2,我们不依赖题目信息中的题目难度来做调度,而是根据Agent解题的步数阈值来动态调整任务优

先级和分配策略,并设置了多个Agentgroup,避免不对称问题导致时间浪费和解题效率低下。

3.基于观察3,我们设计了分级提示机制,与步数阈值调度策略相结合,在第30步之后注入提示,引导LLM重

新聚焦到题目的核心漏洞点,保证agent充分发挥自己能力的同时,能顺利解出题目。

设计思路——执行模块

执行模块设计:

我们采用学术界和工业界普遍认可的ReAct(ReasoningandAction)框架,即

Reasoning:让模型充分析和推理任务,规划下一步操作并给出建议。

Action:根据思考结果,让Agent选择并执行一个具体的行动。

Observation:Agent查看行动执行后的结果,进行下一步的推理。

具体实现上,我们使用langchain来完成执行模块的搭建。

提示词调优:

基于我们对CTF的经验以及对agent运行时的观察,我们的提示词调优的主要内容如下:

1.需要进行爆破操作时,使用多线程脚本来爆破,避免长时间阻塞

2.信息收集优先,在任何情况下,尽量收集足够的信息(如网页功能、环境变量、题目源码、配置文件等),

再进行下一步操作

3.注入类漏洞,优先fuzz出未被过滤的字符,然后根据情况注入

5.

文档评论(0)

专注于金融公司,实体制造业,销售代理公司的企业文化和实体项目或者互联网项目的策划编写润色,曾经协助多家基金公司,保险代理公司,房地产代销公司等初创企业完成企业文化和人事营销等制度的编写,由于疫情影响离开了喜欢的首都。

1亿VIP精品文档

相关文档