计算机行业专题研究:计算需求演进,超节点成为AI基础设施共识
国海证券研究所请务必阅读正文后免责条款部分2025 年 09 月 23 日行业研究评级:推荐(维持)研究所:证券分析师:刘熹S0350523040001liux10@ghzq.com.cn联系人:唐锦珂S0350125070014tangjk@ghzq.com.cn[Table_Title]计算需求演进,超节点成为 AI 基础设施共识——计算机行业专题研究最近一年走势行业相对表现2025/09/23表现1M3M12M计算机-3.7%21.3%82.2%沪深 3003.2%17.2%40.7%相关报告《计算机事件点评:甲骨文 RPO 增至 4550 亿美元,AI 算力强力增长 (推荐)*计算机*刘熹》——2025-09-12《从 Blackwell 到 Rubin:计算、网络、存储持续升级——AI 算力“卖水人”专题系列(7)(推荐)*计算机*刘熹》——2025-09-17《从 Tokens 角度跟踪 AI 应用落地进展——计算机行业大模型及 AI 应用专题(推荐)*计算机*刘熹》——2025-09-15《液冷:AI 算力新一极——AI 算力“卖水人”专题系列(6)(推荐)*计算机*刘熹》——2025-08-17《计算机专题报告:OpenAI 发布 GPT-5,AI 应用业绩提速——模型及 AI 应用月报(202507)(推荐)*计算机*刘熹》——2025-08-09投资要点:本篇报告解决了以下核心问题:1、超节点的演进与特征;2、AI 算力需求空间与趋势;3、国产芯片加速推进超节点布局。计算需求演进,超节点成为 AI 基建共识计算基础设施需求转向搭建高带宽、低时延、持续数据供给的均衡系统。钦奇拉法则(Chinchilla Law)在规模定律(Scaling Law)基础上进一步要求参数与数据按比例协同扩展,即对高带宽、低时延的数据传输能力提出了刚性要求。而面对 AI 算力需求迅速增长,单芯片性能提升幅度却在逐年收窄。在此背景下,基础设施的挑战从过去的“纯算力”问题,升级为“算力×数据供给×系统编排”的综合性工程难题。超高带宽互联与内存统一编址是超节点的基础技术特征。(1)超大带宽和超低时延互联:超节点借助高效的互联协议打破传统架构限制,支持更大规模 AI 处理器的高效协同,实现更大范围、更高流量的数据传输,从而突破系统性能。(2)内存统一编址:超节点内所有互联设备的内存地址需全局唯一,基于全局内存可实现任意设备间的灵活访问。这使得大模型训练中频繁的参数同步操作,无需经过传统的“序列化-网络传输-反序列化”流程,直接通过内存语义通信完成,提升小包数据传输及离散随机访存通信效率。多级缓存池化、资源灵活配比以及高可靠性是未来产品能力持续优化的方向。(1)资源池化:将分散的计算、存储、网络资源抽象为统一逻辑资源池,以集中化管控的方式消除资源孤岛,实现动态弹性调度。(2)资源灵活配比:通过资源池化与软件定义架构的深度融合,将 CPU、NPU、内存、存储等物理资源解耦为可独立调度的资源池,根据任务特征自动调整各类型资源的配比比例。(3)高可靠性:稳定性是决定系统计算效率及成本的重要指标之一,最大程度保障训练任务不中断,训练数据和和结果不丢失。未来五年全球 AI 资本开支 3-4 万亿美元,AI 推理需求将远超训练英伟达预计未来五年全球 AI 资本支出将达 3-4 万亿美元。下游互联网、主权国家、原生 AI 厂商、AI 推理等环节需求持续增长。(1)CSP:谷歌将 2025 年 CapEx 预期从 750 亿美元上调至 850亿美元,主要用于 AI 基础设施建设;微软 Q2 的 CapEx 为 242 亿美元,预计 Q3 的 CapEx 将超 300 亿美元;Meta 调整 2025 年 CapEx 区间为660-720 亿 美 元 , 并 表 示 2026 年 CapEx 仍 将 显 著 增 长 ; 甲 骨 文证券研究报告请务必阅读正文后免责条款部分2FY2026Q1 的 Capex 为 85.02 亿美元,同比增长 269.17%,预计 2026财年 CapEx 将达约 350 亿美元;阿里巴巴-W 在 2025Q2 财报电话会上重申三年 3800 亿元人民币 AI 资本开支计划。(2)主权 AI、推理 AI 需求正在崛起。腾讯表示,大模型产业重心从训练到推理的转变,已成行业共识。甲骨文也强调,AI 推理市场将“远大于”AI 训练市场,为了在 AI 推理市场占据主导地位。另外,主权 AI 正在崛起,英伟达认为今年有望实现 200 亿美元的主权 AI 收入,鸿海预计未来五年主权 AI 领域投资有望超 1 万亿美元。国产芯片加速推进超节点布局华为以开创的超节点互联技术,引领 AI 基础设施新范式。2025 年 3月,华为正式推出满配 384 颗 Ascend 910C 芯片的 Atlas 900 超节点CloudMatrix384。2025 年 9 月 18 日,华为发布满配 8192 颗 Ascend950DT 芯片的 Atlas 950 超节点以及满配 15488 颗 Ascend 960 芯片的Atlas 960 超节点;并发布 Atlas 950 SuperCluster 50 万卡集群和 Atlas960 SuperCluster 百万卡集群;同时,开放面向超节点的互联协议——灵衢 2.0 技术规范;还推出全球首个通用计算超节点 TaiShan 950 超节点。中科曙光发布国内首个基于 AI 计算开放架构设计的曙光 AI 超集群系统。中科曙光 2025 年 9 月 5 日发布国内首个基于 AI 计算开放架构设计的产品——曙光 AI 超集群系统。除了紧耦合设计,该集群系统还支持多品牌 AI 加速卡以及兼容 CUDA 等主流软件生态,为用户提供更多开放性选择,大幅降低硬件成本和软件开发适配成本。浪潮信息发布面向万亿参数大模型的超节点 AI 服务器“元脑SD200”。根据元脑服务器公众号,8 月 7 日,浪潮信息发布面向万亿参数大模型的超节点 AI 服务器“元脑 SD200”。该产品基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现 64 路本土 GPU 芯片高速互连;通过创新远端 GPU 虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增 8 倍,单机可以提供最大 4TB 显存和 64TB 内存,为万亿参数、超长序列大模型提供充足键值缓存空间。沐曦股份发布多种超节点形态。目前,沐曦已联合上百家合作伙伴构建起覆盖芯片设计、制造封测、系统集成到数据中心的完整产业生态,推出 40 余款标准机架式服务器、近 10 款工作站/一体机,并创新多种超节点形态:包括光互连超节点(16-64x GPU)、耀龙 3D Mesh 超节点(32/64x GPU)、Shanghai Cube 国产高密度液冷整机柜(128x GPU)以及高密度液冷算力 POD。曦 智 科 技 发 布 国 内 首 个 光 互 连 光 交 换 GPU 超 节 点 光 跃LightSphere X。曦智科技今年 7 月发布了国内首个光互连光交换 GPU超节点光跃 LightSphere X,并联合壁仞科技、
[国海证券]:计算机行业专题研究:计算需求演进,超节点成为AI基础设施共识,点击即可下载。报告格式为PDF,大小2.12M,页数19页,欢迎下载。



