计算机行业GenAI系列深度之61:超节点,从单卡突破到集群重构
行业及产业 行业研究/行业深度 证券研究报告 计算机 2025 年 07 月 09 日 超节点:从单卡突破到集群重构 看好 ——GenAI 系列深度之 61 相关研究 《从 CloudMatrix 看超节点趋势!3D 打印产业强趋势!——计算机行业周报20250616-20250620》 2025/06/21 《字节 FORCE 大会亮点!华为 HDC 2025 关注点!——计算机行业周报20250609-20250613》 2025/06/14 证券分析师 黄忠煌 A0230519110001 huangzh@swsresearch.com 李国盛 A0230521080003 ligs@swsresearch.com 林起贤 A0230519060002 linqx@swsresearch.com 杨海晏 A0230518070003 yanghy@swsresearch.com 洪依真 A0230519060003 hongyz@swsresearch.com 刘洋 A0230513050006 liuyang2@swsresearch.com 研究支持 曹峥 A0230525040002 caozheng@swsresearch.com 崔航 A0230524080005 cuihang@swsresearch.com 刘菁菁 A0230522080003 liujj@swsresearch.com 联系人 曹峥 (8621)23297818× caozheng@swsresearch.com 本期投资提示: ⚫ 超节点:大模型参数爆炸式增长驱动下,算力需求从单点转向系统级整合。Scale-up 与 Scale-out 成为算力扩容的两大维度。全球 AI 芯片核心玩家英伟达 GB200 NVL72、华为 CloudMatrix 384 等产品的落地,标志着超节点在机柜级互联与跨机柜组网技术上取得突破,单机柜算力密度提升与多机柜全互联架构成为行业竞争焦点。 ⚫ 技术路径上,超节点呈现单柜高密度与多机柜互联的双向扩展,背后是通信协议与工程成本的平衡。 英伟达通过 NVLink 实现 72 GPU 单机柜全互联,带宽达 1800GB/s,聚焦低时延高频交互场景;华为则以两层 UB Switch 构建 384 NPU 跨机柜超节点,通过 Clos 网络拓扑实现无阻塞通信,节点间带宽衰减低于 3%。AMD 推出的 IF128 方案尝试融合以太网技术,打破 Scale-up 与 Scale-out 边界,而特斯拉 Dojo 因 2D Mesh 拓扑局限性进展不及预期,凸显专用生态的落地挑战。 ⚫ 国产超节点方案以华为 CloudMatrix 384 为代表,实现算力规模突破,打破单卡性能瓶颈。该方案通过 UB 网络将 384 个昇腾 NPU 连接起来,形成 1.7 倍于英伟达 NVL72 的算力规模,且内存容量达 3.6 倍。实测数据显示,其两层 UB Switch 架构对性能影响微乎其微,节点间延迟增加低于 1μs,在 MoE 模型推理中通过 Decode EP320 策略实现资源高效调度,验证了国产方案在大规模组网中的工程能力。 ⚫ 超节点产业化将重塑算力产业链分工,催生服务器整合、光通信增量及液冷渗透提升等投资机会。芯片厂商纵向整合趋势明显,英伟达、AMD 通过并购强化通信与软件能力,国内拟海光信息吸收合并中科曙光,强化软件、液冷等能力;代工环节,光通信领域,华为 CloudMatrix 推动光模块需求,光模块与 GPU 需求比可达 1:18;IDC 产业链中,单机柜功率超 120kW 推动液冷渗透率提升,模块化布局加速智算中心交付。 ⚫ 市场当前对超节点的认知存在两大预期差:一是低估国产方案在推理场景的性价比优势,华为 CM384 在 Deepseek R1 模型推理中,单卡 Prefill 吞吐达 5655 tokens/s,单位 TFLOPS 效率超英伟达 H100 方案 18%;二是忽视算力网络架构变革对产业链的重构。当前的双层 UB-Switch 方案以及可能在未来推出的 UB-Mesh 架构,对于电气电缆直接互连、光互联的依赖程度不同,可能影响两大连接技术的演进,功耗大幅提升下,对液冷、供电、机房基建也提出更高的要求。 ⚫ 把握技术路径演变下的产业链机会,聚焦硬件互联与场景适配双线布局。 建议关注:1)光通信:华工科技、光迅科技、中际旭创、新易盛等;2)网络设备与芯片:盛科通信、紫光股份、锐捷网络等;3)数据中心产业链: 润泽科技、奥飞数据、光环新网、英维克、科华数据、科泰电源等;4)铜连接:意华股份、瑞可达、鼎通科技、兆龙互连;5)AI 芯片与服务器供应商:海光信息、中科曙光、浪潮信息、紫光股份、神州数码、联想集团、华勤技术。 ⚫ 风险提示:技术路线不确定的风险;技术研发迭代进展不及预期;供应链稳定风险;竞争加剧风险。 请务必仔细阅读正文之后的各项信息披露与声明 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第2页 共34页 简单金融 成就梦想 投资案件 结论和投资分析意见 超节点:大模型参数爆炸式增长驱动下,算力需求从单点转向系统级整合。技术路径上,超节点呈现单柜高密度与多机柜互联的双向扩展,背后是通信协议与工程成本的平衡。国产超节点方案以华为 CloudMatrix 384 为代表,实现算力规模突破,打破单卡性能瓶颈。超节点产业化对算网产业各环节均有影响,催生服务器整合、光通信增量及液冷渗透提升等投资机会。 建议关注: 1)光通信:华工科技、光迅科技、中际旭创、新易盛等; 2)网络设备与芯片:盛科通信、紫光股份、锐捷网络等; 3)数据中心产业链: 润泽科技、奥飞数据、光环新网、英维克、科华数据、科泰电源等; 4)铜连接:意华股份、瑞可达、鼎通科技、兆龙互连; 5)AI 芯片与服务器供应商:海光信息、中科曙光、浪潮信息、紫光股份、神州数码、联想集团、华勤技术。 原因与逻辑 超节点产业化将重塑算力产业链分工,催生服务器整合、光通信增量及液冷渗透提升等投资机会。芯片厂商纵向整合趋势明显,英伟达、AMD 通过并购强化通信与软件能力,国内拟海光信息吸收合并中科曙光强化软件、液冷等能力;代工环节,光通信领域,华为 CloudMatrix 推动光模块需求,光模块与 GPU 需求比可达 1:18;IDC 产业链中,单机柜功率超 120kW 推动液冷渗透率提升,模块化布局加速智算中心交付。 有别于大众的认识 市场当前对超节点的认知存在两大预期差:一是低估国产方案在推理场景的性价比优势,华为 CM384 在 Deepseek R1 模型推理中,单卡 Prefill 吞吐达 5655 tokens/s,单位 TFLOPS 效率超英伟达 H100 方案 18%; 二是忽视算力网络架构变革对产业链的重构。当前的双层 UB-Switch 方案以及可能在未来推出的 UB-Mesh 架构,对于电气电缆直接互连、光互联的依赖程度不同,可能影响两大连接技术的演进,功耗大幅提
[申万宏源]:计算机行业GenAI系列深度之61:超节点,从单卡突破到集群重构,点击即可下载。报告格式为PDF,大小4.23M,页数34页,欢迎下载。
