超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级,超级网卡价值显著提升

敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 行业研究 东兴证券股份有限公司证券研究报告 超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级,超级网卡价值显著提升 2026 年 5 月 22 日 看好/维持 通信 行业报告 分析师 石伟晶 电话:021-25102907 邮箱:shi_wj@dxzq.net.cn 执业证书编号:S1480518080001 投资摘要: 2026 年英伟达最新发布的超节点 Vera-Rubin NVL72,是全球领先的 Scale up 网络算力平台。Rubin 平台由六款全新芯片组成,包括 Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网络交换机。据英伟达公布的数据,Rubin 平台的训练性能达到前代 Blackwell的 3.5 倍,运行 AI 软件的性能提升 5 倍。此外,与前一代相比,英伟达 Rubin 平台在训练 MoE 模型时所需的 GPU 数量减少至原来的四分之一,进一步推动人工智能的普及应用。 在 VR NVL72 中,AI 计算任务从外部网络进来,数据经过 ConnectX-9、BlueField-4、Vera CPU,再分配到 GPU 和机架内其他 71 颗 GPU 协同完成计算,最后计算结果通过网络传送出去。在计算托盘中,数据传输路径可以分为三段:Vera CPU 至 Rubin GPU 之间通过 NVLink C2C 高速链路互联;Vera CPU 至 CX-9 之间通过两条 PCIe Gen6 链路分别连接到两个 CX9 的 PCIe Switch 模块;以及 CX-9 至 OSFP 之间通过 800G 以太网/ InfiniBand 互联。 NVLink-C2C 技术重构异构计算的互联范式,在裸片/芯片间互联领域建立巨大的领先优势。在 VR200 NVL72 中,Rubin-Vera 之间依托 NVLink-C2C(Chip-to-Chip,芯片到芯片互联)实现双向带宽 1.8TB/s CPU-GPU 互联,延迟纳秒级,相比 GB200 NVL72 的 NVLink-C2C 的 900GB/s,提升一倍。而主流 PCle Gen5 架构双向带宽为 128GB/s 带宽,非一致性内存访问增加编程复杂性以及计算资源闲置等待。NVLink-C2C 的核心技术原理在于:通过 AMBACHI 协议实现硬件级缓存一致性,CPU 和 GPU 缓存自动同步;CPU 内存与 GPU 显存在软件视角呈现为单一内存池;对系统范围跨处理器的原子读写无需额外同步原语。 采用 PCIe Gen6 协议实现 Vera CPU 与超级网卡 CX-9 互联。PCIe Gen6 是第六代高速外设互联标准,CPU与网卡、存储等外设的通用接口。PCIe 6 接口支持 48 条 Lane,每条 Lane 单向速度 64 Gbps。因此,Vera与 CX-9 之间接口双向总带宽达到 768GB/s。PCIe Gen6 信号需要使用高端 PCB 与玻纤布传输。在 VR200 NVL72 计算托盘中,PCIe Gen6 信号从 Strata 模块传输到 Orchid 模块前端,PCB 距离长达约 500mm。为实现信号完整性,VR200 NVL72 除了升级双向 SerDes 技术外,还需要升级 PCB 材料。在材料层面,CCL(覆铜板)从 M7 升级到 M8/M9,主计算板和网络板的铜箔升级到 HVLP4,材料价值显著上升;为了降低介质损耗,玻璃纤维布或价值更高的石英材料被用于 Orchid 板和中置板。 采用以太网/ InfiniBand 协议实现超级网卡 CX-9 与 OSFP 光模块笼口互联。CX-9 一项重要升级在于,其在以太网模式下通过单个端口即可提供 1x800G 的传输能力,无需依赖多链路聚合实现总吞吐量。相比之下,CX-8 仅在 InfiniBand 架构下支持 800G 速率,但在以太网模式下通常以 2x400G 的配置呈现。在 VR NVL72 计算托盘中,8 个 800G 的 CX-9 网卡对应 OSFP 笼位的数量有两种方案:一种是每颗 GPU 配 1个 1.6T OSFP 笼口,则每个计算托盘共 4 个 1.6T OSFP 笼口;另一种则是每颗 GPU 配 2 个 800G OSFP笼口,则每个计算托盘共 8 个 800G OSFP 笼口。 P2 东兴证券深度报告 超节点行业:从计算托盘角度拆解英伟达 VR NVL72,通信速率三重升级,超级网卡价值显著提升 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 ConnectX‑8/9定位超级网卡(SuperNIC),性能远超传统网卡。2025年8月,英伟达正式发布专为Blackwell架构和加速超大规模 AI 工作负载而设计的 ConnectX-8 SuperNIC。ConnectX-8 SuperNIC 单端口 800Gb/s InfiniBand(XDR)或双端口 400Gb/s Ethernet(Spectrum-X),为上一代 ConnectX-7(200Gb/s)的 4倍,是当前业界最高带宽网卡。2026 年 1 月,英伟达推出高性能智能网络接口卡 ConnectX-9,核心变革在于实现单端口 800Gb/s 的以太网传输能力。 超级网卡内置 PCIe Gen6 交换模块,替代传统独立 PCIe 交换机。ConnectX-8 内置 48 通道 PCIe Gen6交换机,单芯片实现“网络接口 + GPU 间交换”二合一,有助于消除 IO 瓶颈,并加快 GPU、NIC 和存储之间的数据移动速度。基于 ConnectX-8 的优化设计可为集群内的所有 GPU 间通信提供高达每个 GPU 50 GB/s 的 IO 带宽,因为 NCCL 直接通过网络转发所有流量。 ConnectX 集成 Spectrum‑X 交换逻辑,构成端到端 800G AI 网络。SuperNIC 内部集成 Spectrum‑X 风格的交换与加速逻辑”并作为 Spectrum‑X 以太网平台的终端侧关键组件,与外部 Spectrum‑X 交换机(如 SN5600 列)端到端协同。交换机(Spectrum‑X Switch)与终端 SuperNIC(ConnectX‑8)协同优化,为 AI / 超算以太网带来的五大关键性能提升。负载均衡方面,实现 1.6X 更高有效带宽;尾延迟优化方面,实现 1.3X 更高集合通信带宽;噪声隔离方面,实现 2.2X 更高 All-reduce 带宽;弹性性能方面,实现 1.3X 更高 All-to-all 带宽;高频遥测方面,实现 1000X 更快遥测采集。 投资策略: 自 2025 年开始,超节点成为 AI 算力网络重要的技术创新方向。本篇报告从计算托盘角度拆解英伟达 VR NVL72,可以看到,英伟达 VR NVL72 以 1.8TB/s NVLink-C2C+PCIe Gen6+800G SuperNIC 构建三

立即下载
信息科技
2026-05-22
东兴证券
石伟晶
20页
1.92M
收藏
分享

[东兴证券]:超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级,超级网卡价值显著提升,点击即可下载。报告格式为PDF,大小1.92M,页数20页,欢迎下载。

本报告共20页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共20页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关报告
热门报告
加入社群
回顶部
报告群
公众号
小程序
在线客服
收起