腾讯-腾讯云黑客松智能渗透挑战赛决赛答辩-BinX
基于状态感知与因果推理的自主渗透测试智能体方班 - BinXAbout us方班 - BinX举事为先、开拓进取、待人以诚使命担当面对全球技术壁垒,BinX战队以“开源共享”的中国智慧,积极促进行业协同创新与生态共建,旨在加速我国“AI+安全”技术的自主创新与迭代,为构建安全可控的AI防护体系贡献力量。广州大学方班BinX战队,在方滨兴院士育人理念指引下,专注于智能攻防、自动化渗透与漏洞挖掘等前沿方向。团队在核心原理、体系化方法及工程实践上积淀深厚,持续走在国内前列。技术底蕴团队不仅是多项国家及省部级课题的核心参与力量,更长期肩负北京冬奥会、成都大运会、杭州亚运会、哈尔滨亚冬会、粤港澳十五运等重大活动的网络安全保障重任,通过高强度实战环境的持续检验,形成了全面、高效的体系化攻防能力。实战锤炼PART 01PART 02PART 03研究背景项目设计实战表现目 录CONTENTS研究背景PART 01从人工到无人攻防:自动化渗透测试的六阶段演进P0 - 人工渗透(No Automation)完全依赖人类专家P1 - 工具增强渗透(Assisted Pentest)工具可以执行某些固定步骤,但决策全由人类完成P2 - 自动化利用链片段(Partial Automation)可以自动化一些独立步骤,但无法跑完整攻击链P3 - 有条件自动化渗透(Conditional Attack)可以自动完成一条“有限利用链”,但需要人类在关键节点确认P4 - 高度自动化渗透(High Automation)系统能自己跑完整攻击链,人类主要负责结果校验P5 - 完全自动化攻防(Fully Autonomous Offensive Security)无需人类介入,全链路自主运行L0 - 无自动化人工驾驶,全程控制L1 - 驾驶辅助脱脚,部分操作L2 - 部分自动化脱手,负责观路况L3 - 有条件自动驾驶脱眼,负责紧急情况L4 - 高度自动驾驶脱脑,基本不介入L5 - 完全自动驾驶无人驾驶,全程无介入DRIVE PILOT基于大语言模型的渗透测试智能体的三大系统性挑战01环境复杂性导致感知状态失真STATUS DISTORTION长周期任务易上下文遗失复杂环境造成状态错判行动历史无法长期追踪模型不知道自己是谁、在哪里、做过什么记忆缺失02环境弱反馈导致探索效率极低LOW EFFICIENCY有效信号极度稀缺中间反馈高度模糊甚至误导巨大搜索空间“盲试”模型像在迷雾中摸索,没有线索指引,只能盲目尝试低 效 盲 目 探 索03结构认知局限导致决策不可靠UNRELIABLE DECISION-MAKING领域幻觉错误归因能力弱推理链脆弱、易中断策略固化与缺乏灵活性模型能说但不能推理、能生成但不能反思、能模仿但缺乏创造性策略认 知 决 策 障 碍项目设计PART 02整体架构核心架构 | P-E-R智能体协同框架Planner - 规划器任务分解、生成图操作指令维护全局任务图输出:子任务有向无环图(DAG)Executor - 执行器ReAct循环、工具调用科学实验范式、因果节点提取输出:任务日志即时错误修正Reflector - 反思器结果审计、情报凝练失败归因、维护因果图输出:凝练的情报报告执行日志用户目标输入动态的、自适应的智能体框架核心架构 | 图谱驱动的认知架构任务图构建了智能体的执行边界,因果图提供了智能体的决策依据二者结合,实现了从‘脚本执行’到‘自主推理’的跨越为解决传统智能体在复杂渗透任务中的“灾难性遗忘”与“推理幻觉”两大核心痛点,我们构建了由双图谱驱动的认知架构,赋予智能体人类专家级的全局规划与证据推理能力。显式建模攻击流程与业务逻辑依赖基于 DAG 的非线性拓扑动态图剪枝与路径再生并行化攻击路径调度任务依赖关系显式建模任务图结构化存储环境认知状态与证据推理异构节点语义建模基于逻辑边的证据推理闭环外部化的长期记忆置信度驱动的知识状态演进因果图 图谱驱动的认知架构 | 任务图的设计与实现为解决传统智能体在复杂渗透任务中的“灾难性遗忘”与“推理幻觉”两大核心痛点,我们构建了由双图谱驱动的认知架构,赋予智能体人类专家级的全局规划与证据推理能力。数据结构 基于 networkx.DiGraph 实现宏观任务编排。 采用 DAG (有向无环图) 拓扑,显式建模“分解” 与“依赖”关系,解决线性执行的逻辑死锁问题节点模型 标准化契约:每个子任务封装了“描述”、“完成标准”及“简报” 状态管理:维护 pending → in_progress → completed / failed / stalled 的生命周期 容错机制:引入 stalled_orphan (孤立停滞) 状态,当依赖任务失败时自动阻断下游,防止无效执行Pending ReadyIn_ProgressCompletedFailedStalled 任务图 | Plan-on-G
腾讯-腾讯云黑客松智能渗透挑战赛决赛答辩-BinX,点击即可下载。报告格式为PDF,大小4.1M,页数21页,欢迎下载。



