计算机:GPT-5.4:执行型AI加速落地,OpenClaw绝佳搭档
敬请参阅最后一页特别声明 1 1 行业观点: GPT-5.4 发布,迈向“可执行 AI”的重要升级 GPT-5.4 的发布标志着大模型能力从“对话生成”向“任务执行”的重要跃迁。本次升级在推理能力、编程能力以及智能体工作流方面进行了系统性强化,并首次在模型层面大规模整合 Computer Use、工具调用与联网搜索能力,使 AI 可以在真实软件环境中完成复杂任务。具体来看:1)原生 Computer Use能力使模型能够通过视觉理解屏幕并执行鼠标点击、键盘输入等操作,在 OSWorld 等桌面操作基准测试中成功率接近人类水平,意味着 AI 具备在真实系统中执行任务的能力;2)Tool Search 机制大幅优化工具调用流程,通过按需检索工具定义的方式减少上下文 Token 消耗,从而提升多工具 Agent 系统的效率并降低成本;3)联网搜索能力与推理能力进一步增强,使模型能够通过多轮搜索整合全网信息解决复杂问题;4)知识型工作能力显著提升,在电子表格、文档、演示文稿等专业办公任务中的表现接近甚至超过部分行业专业人士水平。整体来看,GPT-5.4 验证了 AI 发展的两大趋势:一是模型迭代节奏持续加快,二是 Computer Use 与工具调用能力正在打通 AI 从“对话”走向“执行”的关键环节,Agent 商业化落地路径日益清晰。 OpenClaw + GPT-5.4:Agent 时代的绝佳组合 随着 AI 行业进入 Agent 时代,市场关注点逐渐从单一模型能力转向“模型 + Agent 框架”的系统能力。在这一背景下,开源 Agent 框架 OpenClaw 与 GPT-5.4 的组合被开发者社区和媒体认为是当前极具潜力的技术路径之一。OpenClaw 作为一个完全开源且可本地运行的 AI Agent 框架,核心目标是让 AI能够直接操作电脑完成真实工作任务。GPT-5.4 在多个关键能力上的升级,使其与 OpenClaw 形成高度互补:1)原生 Computer Use 能力使模型可以直接操作桌面软件,减少传统 Agent 框架需要复杂适配和自动化脚本的技术成本;2)100 万 Token 的超长上下文为长期运行的 Agent 提供了更大的“工作记忆”,能够在复杂任务链和长时间任务执行过程中保持稳定的上下文理解;3)Tool Search 机制显著降低多工具调用带来的 Token 成本,使 OpenClaw 在接入大量 Skills与工具时仍能保持较高效率;4)模型推理与专业任务能力的提升,使 Agent能够胜任更复杂、更高价值的知识工作场景。整体来看,OpenClaw与 GPT-5.4 的结合有望推动 AI Agent 从实验性工具逐步走向真实生产力系统,加速 AI 在办公自动化、软件开发和复杂知识工作的落地应用。 投资建议: 国内算力:寒武纪、东阳光、海光信息、协创数据、豫能控股、华丰科技、亿田智能、星环科技、网宿科技、宏景科技、首都在线、神州数码、百度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 海外算力/存储:中际旭创、新易盛、兆易创新、大普微、天孚通信、源杰科技、胜宏科技、景旺电子、英维克等;Lumentum、闪迪、铠侠、美光、SK 海力士、中微公司、北方华创、拓荆科技、长川科技。 CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。 AI 应用:1)超级入口:腾讯控股、Minimax、智谱、阿里巴巴、科大讯飞。2)星环科技、德才股份、美年健康、中控技术、卓易信息、昆仑万维等 AI INFRA&高增长&高壁垒。其他:空天时代、具身智能等。 风险提示 行业竞争加剧的风险;技术迭代不及预期的风险;特定行业下游资本开支周期性波动的风险。 行业点评 敬请参阅最后一页特别声明 2 扫码获取更多服务 一、GPT-5.4 发布,迈向“可执行 AI”的重要升级 2026 年 3 月 5 日,OpenAI 发布 GPT-5.4,定位为面向复杂工作任务的旗舰模型。GPT-5.4将 OpenAI 近 期 在 推 理 、 编 程 及 智 能 体 工 作 流 领 域 的 顶 尖 性 能 集 于 一 身 。 整 合了 GPT-5.3-Codex 行业领先的编程能力,同时优化了模型在各类工具、软件环境以及专业任务(电子表格、ppt 和文档等)中的表现, 支持高达 100 万 Token 的上下文,能够准确高效地完成复杂的实际工作。 1.1 原生 Computer Use:AI 具备真实操作电脑能力 GPT-5.4 最重要的升级之一是原生“Computer Use”能力。模型可以通过视觉理解屏幕截图,识别界面中的按钮、文本框和菜单,并执行鼠标点击、键盘输入等操作,从而在真实操作系统环境中完成任务。 在 OSWorld 桌面操作基准测试中,GPT-5.4 的成功率达到约 75%,已经接近甚至超过人类平均水平。这意味着 Agent 在真实软件环境中的执行能力具备可用性。 图表1:OSWorld 桌面操作基准测试 来源:OpenAI,国金证券研究所 1.2 工具搜索:大规模工具调用能力 GPT-5.4 在 API 层面引入工具搜索机制。在此之前,当模型调用工具时,所有的工具定义都必须预先包含在提示词中。对于拥有大量工具的系统,这会导致每次请求都额外增加数千甚至数万个 Token,不仅推高了成本、减慢了响应速度,还让上下文中充斥着模型可能永远用不到的冗余信息。 通过工具搜索,GPT-5.4 不再需要预加载完整定义,而是接收一份精简的可选工具列表及工具搜索能力。当模型需要调用特定工具时,它会即时查找该工具的定义,并将其添加到当前的对话上下文。这种方法大幅减少了重度工具调用工作流程所需的 Token 数量,并有效保留了缓存,使请求变得更快、成本更低。这一能力对于构建复杂 AI Agent 系统具有关键意义,因为真实应用往往需要调用大量工具。 1.3 更强的联网搜索能力 GPT-5.4 在智能体联网搜索方面表现更佳。在实际应用中,这意味着 GPT-5.4 Thinking 能够更强有力地解答那些需要整合全网多方信息的复杂问题。它能以更强的持久性进行多轮搜索,行业点评 敬请参阅最后一页特别声明 3 扫码获取更多服务 从而锁定最相关的信源 — 尤其是在处理“大海捞针”式的问题时,它能高效提炼核心信息,并给出逻辑清晰、论证严密的回答。 图表2:BrowseComp 基准测试得分(衡量智能体通过持续浏览网页获取难寻信息的能力) 来源:OpenAI,国金证券研究所 1.4 知识型工作能力大幅提升 在 GDPval 测试中(涵盖 44 种职业的知识工作任务),GPT-5.4 在 83%的案例中或达到超越行业专业人士水准,比 GPT-5.2 的 71%有显着的跃升。 OpenAI 还重点提升了 GPT-5.4 创建和编辑表格、演示文稿及文档的能力。针对初级投行分析师水平的电子表格建模任务得分从 68.4%提升至
[国金证券]:计算机:GPT-5.4:执行型AI加速落地,OpenClaw绝佳搭档,点击即可下载。报告格式为PDF,大小1.51M,页数8页,欢迎下载。



