软件与服务行业有效算力框架下复盘AI演进:硬件结构性倾斜,云端生态格局重塑
本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。 证券研究报告·海外行业深度 有效算力框架下复盘 AI 演进:硬件结构性倾斜,云端生态格局重塑 核心观点 海外 AI 行业核心投资逻辑呈现两条主线:在硬件与基础 设施 端,大模型推理的“两相结构”与 Agent 编排工作流导致通用 GPU 的边际收益下降,算力军备竞赛正向能源与电网要素的竞争 演变,并驱动服务器架构向高数据复用率的 ASIC(如谷歌 TPU)、高性能指挥层 CPU(CPU:GPU 配比迈向 1:1)以及因扩容刚 需价格暴涨的 DDR5 DRAM 发生结构性倾斜;在模型与云生态 端 ,随着OpenAI GPT-5.5 的发布,其 Codex 生态的下载安装量正 缩小与Anthropic Claude Code 的差距 ,鉴于模型技术领先到市场份额变化存在 3-6 个月的滞后效应 ,Microsoft、Oracle 及 CoreWeave 等OpenAI 阵营的算力与云合作方正迎来确定性的叙事修正与 战略性份额扩张的投资机会。 投资要点 有效算力预测模型预示 AI 模型性能提升的瓶颈来自物理算力、算法、范式,底层提升瓶颈主要是能源。Leopold Aschenbrenner在 2024 年 6 月发布的《Situational Awareness》报告引入了前沿的 能 力 预 测 假 说 , 即 模 型 能 力 与 由“ 物 理 算 力 × 算 法 效 率×Unhobbling 杠杆”共同构成的“有效算力”呈现单调线性特 征。历史数据显示,前沿 AI 训练算力在过去 10—15 年间以年均 0.5 至0.7 个数量级(OOM)的速度扩张。报告推演,2023 至 2027 年间全球 AI 总有效算力将再次实现约 5 个 OOM 的跃升,推动 AI跨越 AGI 初级门槛(对标 PhD 级专家/自动化 AI 研究员)。但物理制约正在迫近,预计到 2028 年,单个前沿集群投资将 突破千亿美元级别,峰值电力需求达 10GW,AI 算力的军备竞赛 本质上正演变为能源供应与电网要素的竞争。 系统级工程优化与 ASIC 崛起。随着算力规模扩展,大模型竞争焦点已从“大参数+大训练 FLOPs”的单一叙事转移到系统级 硬件协同。在推理端,大模型工作负载呈现明显的“两相结构”:Prefill阶段偏向算力受限,而 Decode 阶段更偏向内存带宽受限 ,HBM的访存带宽成为主要瓶颈。这一特征推动 ASIC 的机会窗 口,如谷歌 TPUv6e 通过脉动阵列设计实现中间计算的“零访存” ,大幅降低了对昂贵 HBM 带宽的依赖,在 Token 成本与功耗上 建立起对通用 GPU 的非对称优势,Anthropic 已承诺自 2026 年起 部署超100 万片新型 TPU 芯片。此外,算法与底层的打通(如 DeepSeek的多 Token 预测 MTP 架构及定制显存内核融合)正成为 新的工程技术壁垒。 维持 强于大市 于伯韬 yubotao@csc.com.cn SAC 编号:S1440520110001 SFC 编号:BRR519 许悦 xuyue@csc.com.cn SAC 编号:S1440523030001 发布日期: 2026 年 05 月 25 日 市场表现 相关研究报告 -3%7%17%27%37%47%2025/5/192025/6/192025/7/192025/8/192025/9/192025/10/192025/11/192025/12/192026/1/192026/2/192026/3/19计算机标普500软件与服务 海外行业深度报告 软 件与服务 请务必阅读正文之后的免责条款和声明。 Agent 工程化落地与算力重心向 CPU转移。行业评价标准正在从“模型谁最聪明”演变为“Agent 系统在崩溃前能自主工作多久”,核心范式转向“Agent=Model+Harness(工具调度、安全护栏等运行环境的基础设施)”。在Agent 带来的“长会话+多轮工具回填”工作负载下,系统瓶颈正发生结构性转移:①CPU 角色剧变:CPU 在 编排工作流和工具处理中从配角变为指挥层,相关处理在个别工作负载下可占总延迟的 90.6%。②配比靠 拢: 算力基础设施的 CPU:GPU 比例正明确从传统的 1:8 向 1:1(Parity)演进,并导致服务器 DDR5DRAM 因扩 容刚 需而出现价格暴涨。③范式革新:“VibeCoding”带来的启发式学习(HL)大幅降低了代码规则修改与维护 成本,在小样本场景下的效率和最终性能已可比肩甚至超越昂贵的传统深度强化学习(PPO),成为低成本、 高可 控的Agent 迭代新策略。 当前市场对于①HBM 高景气度已经取得较高共识且反映到业绩层面,SK hynix 2026Q1 营业利润率 72%(超过 Nvidia 的 65%及台积电的 58%),其中 DRAM 平均售价(ASP)环比上涨 mid-60%,NAND ASP 上涨mid-70%,受强劲定价支撑。SK Group 会长崔泰源在 2026 年 3 月表示,全球芯片晶圆短缺可能持续到 2030 年,因为 HBM 需求持续超过供应并导致制造产能紧张。他补充说,扩大晶圆产能可能需要至少四到五年时间 ,预计缺口超过 20%。 ②CPU 也正处于快速定价阶段,Intel/AMD 个股年内涨幅超过 100%+,且管理层明确提 出 CPU长期受益于 AI 带动 TAM 大幅提升,Intel 电话会给出 CPU:GPU 从 1:8→1:4→向 parity 的明确口径(agentic orchestration 驱动)。③可能尚未充分发掘的方向: NVMe/eSSD、DPU、CXL/分层内存软件栈。在 KV分层/多 agent 并发下,会变成不可或缺的系统部件(Samsung offload、SNIA distributed KV 都在给它补叙事)。 前沿模型商业化路径的结构性分化。在全球模型竞争与份额变迁上,存在三个关键动态:①国内外性 能错位:国产模型虽然在公开基准测试上直追海外,但在引入防泄露的半私有/私有加权测试后,真实场景 表现 实际落后美国顶尖模型约 8 个月,目前的竞争优势仍主要维系在开源和极高性价比上。②前沿模型差异化 :在 前沿Agent 领域,GPT-5.5 在终端优先 Agent(Shell 执行与 DevOps 自动化)中具备明显的 Token 节省(少用 72%输出 Token)与速度优势;而 ClaudeOpus4.7 则在代码库优先 Agent(PR 审查、多语言重构)和工具编排协议(M CP)上保持领先。③云厂商投资启示:随着 GPT-5.5 的发布,OpenAI 旗下的 Codex 在下载及 VSCode 插件 安装 量上正快速反超或缩小与 ClaudeCode 的差距。由于模型领先转化为市场份额存在 3—6 个月的滞后
[中信建投]:软件与服务行业有效算力框架下复盘AI演进:硬件结构性倾斜,云端生态格局重塑,点击即可下载。报告格式为PDF,大小5.32M,页数28页,欢迎下载。



