半导体行业深度报告:Agentic AI时代的算力重构,CPU,从“旁观者”到“总指挥”的价值回归

证券研究报告·行业深度报告·半导体 东吴证券研究所 1 / 14 请务必阅读正文之后的免责声明部分 半导体行业深度报告 Agentic AI 时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归 2026 年 01 月 28 日 证券分析师 陈海进 执业证书:S0600525020001 chenhj@dwzq.com.cn 证券分析师 李雅文 执业证书:S0600526010002 liyw@dwzq.com.cn 行业走势 相关研究 《关注 AI 算力需求快速发展,看好国产设备商充分受益》 2025-07-19 《长鑫存储启动上市辅导,看好国内先进制程扩产利好国产设备商》 2025-07-08 增持(维持) [Table_Tag] [Table_Summary] 投资要点 ◼ 从对话模型到行动智能体:Agent 架构重塑 CPU 与 GPU 分工:市场认为 AI 算力=GPU,CPU 只是负责调度。但 AI 落地方向来到 Agent,由“纯对话”转向“执行任务”时,算力需求发生了结构性分化。1)执行控制流CPU化:Agent的行动阶段是大量if/else 判断与系统调用。Manus等主流 Agent 架构为每个 Agent/任务分配一个隔离的云端虚拟机,不同任务在逻辑上高度异构(如网页浏览、代码修改、环境部署等),任务之间可并行但控制流完全不同。分支类任务不适合由 GPU 执行,因控制流发散导致算力利用率急剧下降。而分支类任务却正是 CPU 微架构长期优化的主战场。2)记忆体系去 GPU 化:在 Agent 场景下,长上下文推理会产生巨大的 KV cache,其占用随对话轮次与上下文长度线性增长,快速耗尽 GPU HBM 容量。而 CPU 搭配大容量 DDR5 / LPDDR5(并通过 CXL 扩展)承载 KV Cache 与部分参数,正在成为兼顾吞吐、扩展性与成本效率的主流架构选择。 ◼ Agent 软件基础设施加速落地,CPU 多核化与需求放量进入确定性通道:从实验数据复盘来看,CPU 成为 Agentic AI 的真实瓶颈。研究显示,在完整的 Agent 执行链路中,工具处理相关环节(检索、Python/Bash执行、Web 请求等)在 CPU 上消耗的时间占端到端延迟的比例最高可达 90.6%。在高并发场景下(Batch Size 提升至 128),CPU 端到端延迟从 2.9 秒跃升至 6.3 秒以上。我们认为研究结果揭示了在大量 Agentic 场景中,系统吞吐受限的并非 GPU 计算能力,而是 CPU 的核心数并发调度问题。我们由此判断,进入 Agent 时代后,CPU 侧的工具执行与调度能力将从 GPU 的附属角色,演化为需要被单独规划与优化的核心资源池。 产业端推进方面,AWS 和 Google Cloud 等头部 CSP 正在加速建设面向Agent的沙盒环境软硬件基础设施,率先在软件层面强化 Agent Sandbox的隔离与编排能力,通过运行时与调度体系的完善,为后续 CPU 侧基础设施规模化部署奠定基础。与此同时,CPU 龙头也在 Agent 驱动下向超多核架构演进:AMD 推出的 Turin 最高可达 192 核;Intel 的 Sierra Forest 采用纯能效核设计,核心数可达 144 甚至 288 核。我们认为,随着 Agent 商业化推进,厂商必须持续压低每次任务执行成本。在这一目标下,超多核 CPU 以更高的并行度、更低的单位功耗,支撑大规模、长期运行的 Agent 执行环境。英伟达亦在新架构中提升 CPU 配比,CPU的重要性抬升,挂钩 Agentic 的叙事。我们认为 NVIDIA 主动提升 CPU权重,等同于在系统层面确认:在长上下文与高并发 Agent 场景中,大内存 CPU 是承载海量 KV Cache 的最优容器。 ◼ 投资建议:我们看好海光信息与澜起科技,前者受益于 Agentic AI 推动 CPU 从调度走向高并发执行的核心算力地位抬升,后者受益于长上下文与高并发场景下 CXL 驱动的“存力+算力”协同升级。建议关注龙芯中科,万通发展(数渡科技)。 ◼ 风险提示:Agent 落地节奏不及预期风险;新型硬件架构替代风险; CSP 资本开支波动风险。 -8%0%8%16%24%32%40%48%56%64%72%2025/2/52025/6/32025/9/292026/1/25半导体沪深300 请务必阅读正文之后的免责声明部分 行业深度报告 东吴证券研究所 2 / 14 内容目录 1. 从对话模型到行动智能体:Agent 架构重塑 CPU 与 GPU 分工 .................................................. 4 1.1. 主流 Agent 形态从模型推理走向“浏览器+代码执行” ........................................................... 4 1.2. 为何 CPU 在 Agent 时代具有不可替代性 ............................................................................... 4 1.2.1. Agent 执行阶段的离散控制流决定 CPU 优于 GPU ...................................................... 5 1.2.2. 长上下文推理亦推升 CPU 侧内存连接需求 ................................................................ 5 2. Agent 软件基础设施加速落地,CPU 多核化与需求放量进入确定性通道 .................................. 7 2.1. Agentic AI 的系统瓶颈已由 GPU 计算转向 CPU 并发调度 ................................................... 7 2.2. CPU 龙头迭代方向明确:Agent 驱动下的超多核架构演进 .................................................. 8 2.3. 自研 CPU 继续加码,挂钩 Agentic 的叙事 ............................................................................ 9 2.4. Engram 架构重构记忆路径,CPU 重要性进一步强化 ........................................................ 10 3. 相关公司 ...............................................................................................

立即下载
电子设备
2026-01-28
东吴证券
14页
2.14M
收藏
分享

[东吴证券]:半导体行业深度报告:Agentic AI时代的算力重构,CPU,从“旁观者”到“总指挥”的价值回归,点击即可下载。报告格式为PDF,大小2.14M,页数14页,欢迎下载。

本报告共14页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共14页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
具身智能公司产量或规划
电子设备
2026-01-28
来源:高端装备制造行业周报:特斯拉规划27年开启ToC销售,OpenAI加码机器人研发
查看原文
具身智能核心零部件公司边际突破汇总
电子设备
2026-01-28
来源:高端装备制造行业周报:特斯拉规划27年开启ToC销售,OpenAI加码机器人研发
查看原文
优必选全新一代工业人形机器人 Walker S2
电子设备
2026-01-28
来源:高端装备制造行业周报:特斯拉规划27年开启ToC销售,OpenAI加码机器人研发
查看原文
具微科技轮式四足机器人产品矩阵
电子设备
2026-01-28
来源:高端装备制造行业周报:特斯拉规划27年开启ToC销售,OpenAI加码机器人研发
查看原文
宇树科技获授的两项外观设计专利
电子设备
2026-01-28
来源:高端装备制造行业周报:特斯拉规划27年开启ToC销售,OpenAI加码机器人研发
查看原文
本周行业重大事件梳理
电子设备
2026-01-28
来源:高端装备制造行业周报:特斯拉规划27年开启ToC销售,OpenAI加码机器人研发
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起