超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升

敬请参阅报告结尾处的免责声明东方财智兴盛之源行业研究东兴证券股份有限公司证券研究报告超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升 2026 年 5 月 22 日看好/维持通信行业报告分析师石伟晶电话：021-25102907 邮箱：shi_wj@dxzq.net.cn 执业证书编号：S1480518080001 投资摘要： 2026 年英伟达最新发布的超节点 Vera-Rubin NVL72，是全球领先的 Scale up 网络算力平台。Rubin 平台由六款全新芯片组成，包括 Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网络交换机。据英伟达公布的数据，Rubin 平台的训练性能达到前代 Blackwell的 3.5 倍，运行 AI 软件的性能提升 5 倍。此外，与前一代相比，英伟达 Rubin 平台在训练 MoE 模型时所需的 GPU 数量减少至原来的四分之一，进一步推动人工智能的普及应用。在 VR NVL72 中，AI 计算任务从外部网络进来，数据经过 ConnectX-9、BlueField-4、Vera CPU，再分配到 GPU 和机架内其他 71 颗 GPU 协同完成计算，最后计算结果通过网络传送出去。在计算托盘中，数据传输路径可以分为三段：Vera CPU 至 Rubin GPU 之间通过 NVLink C2C 高速链路互联；Vera CPU 至 CX-9 之间通过两条 PCIe Gen6 链路分别连接到两个 CX9 的 PCIe Switch 模块；以及 CX-9 至 OSFP 之间通过 800G 以太网/ InfiniBand 互联。 NVLink-C2C 技术重构异构计算的互联范式，在裸片/芯片间互联领域建立巨大的领先优势。在 VR200 NVL72 中，Rubin-Vera 之间依托 NVLink-C2C（Chip-to-Chip，芯片到芯片互联）实现双向带宽 1.8TB/s CPU-GPU 互联，延迟纳秒级，相比 GB200 NVL72 的 NVLink-C2C 的 900GB/s，提升一倍。而主流 PCle Gen5 架构双向带宽为 128GB/s 带宽，非一致性内存访问增加编程复杂性以及计算资源闲置等待。NVLink-C2C 的核心技术原理在于：通过 AMBACHI 协议实现硬件级缓存一致性，CPU 和 GPU 缓存自动同步；CPU 内存与 GPU 显存在软件视角呈现为单一内存池；对系统范围跨处理器的原子读写无需额外同步原语。采用 PCIe Gen6 协议实现 Vera CPU 与超级网卡 CX-9 互联。PCIe Gen6 是第六代高速外设互联标准，CPU与网卡、存储等外设的通用接口。PCIe 6 接口支持 48 条 Lane，每条 Lane 单向速度 64 Gbps。因此，Vera与 CX-9 之间接口双向总带宽达到 768GB/s。PCIe Gen6 信号需要使用高端 PCB 与玻纤布传输。在 VR200 NVL72 计算托盘中，PCIe Gen6 信号从 Strata 模块传输到 Orchid 模块前端，PCB 距离长达约 500mm。为实现信号完整性，VR200 NVL72 除了升级双向 SerDes 技术外，还需要升级 PCB 材料。在材料层面，CCL（覆铜板）从 M7 升级到 M8/M9，主计算板和网络板的铜箔升级到 HVLP4，材料价值显著上升；为了降低介质损耗，玻璃纤维布或价值更高的石英材料被用于 Orchid 板和中置板。采用以太网/ InfiniBand 协议实现超级网卡 CX-9 与 OSFP 光模块笼口互联。CX-9 一项重要升级在于，其在以太网模式下通过单个端口即可提供 1x800G 的传输能力，无需依赖多链路聚合实现总吞吐量。相比之下，CX-8 仅在 InfiniBand 架构下支持 800G 速率，但在以太网模式下通常以 2x400G 的配置呈现。在 VR NVL72 计算托盘中，8 个 800G 的 CX-9 网卡对应 OSFP 笼位的数量有两种方案：一种是每颗 GPU 配 1个 1.6T OSFP 笼口，则每个计算托盘共 4 个 1.6T OSFP 笼口；另一种则是每颗 GPU 配 2 个 800G OSFP笼口，则每个计算托盘共 8 个 800G OSFP 笼口。 P2 东兴证券深度报告超节点行业：从计算托盘角度拆解英伟达 VR NVL72，通信速率三重升级，超级网卡价值显著提升敬请参阅报告结尾处的免责声明东方财智兴盛之源 ConnectX‑8/9定位超级网卡（SuperNIC），性能远超传统网卡。2025年8月，英伟达正式发布专为Blackwell架构和加速超大规模 AI 工作负载而设计的 ConnectX-8 SuperNIC。ConnectX-8 SuperNIC 单端口 800Gb/s InfiniBand（XDR）或双端口 400Gb/s Ethernet（Spectrum-X），为上一代 ConnectX-7（200Gb/s）的 4倍，是当前业界最高带宽网卡。2026 年 1 月，英伟达推出高性能智能网络接口卡 ConnectX-9，核心变革在于实现单端口 800Gb/s 的以太网传输能力。超级网卡内置 PCIe Gen6 交换模块，替代传统独立 PCIe 交换机。ConnectX-8 内置 48 通道 PCIe Gen6交换机，单芯片实现“网络接口 + GPU 间交换”二合一，有助于消除 IO 瓶颈，并加快 GPU、NIC 和存储之间的数据移动速度。基于 ConnectX-8 的优化设计可为集群内的所有 GPU 间通信提供高达每个 GPU 50 GB/s 的 IO 带宽，因为 NCCL 直接通过网络转发所有流量。 ConnectX 集成 Spectrum‑X 交换逻辑，构成端到端 800G AI 网络。SuperNIC 内部集成 Spectrum‑X 风格的交换与加速逻辑”并作为 Spectrum‑X 以太网平台的终端侧关键组件，与外部 Spectrum‑X 交换机（如 SN5600 列）端到端协同。交换机（Spectrum‑X Switch）与终端 SuperNIC（ConnectX‑8）协同优化，为 AI / 超算以太网带来的五大关键性能提升。负载均衡方面，实现 1.6X 更高有效带宽；尾延迟优化方面，实现 1.3X 更高集合通信带宽；噪声隔离方面，实现 2.2X 更高 All-reduce 带宽；弹性性能方面，实现 1.3X 更高 All-to-all 带宽；高频遥测方面，实现 1000X 更快遥测采集。投资策略：自 2025 年开始，超节点成为 AI 算力网络重要的技术创新方向。本篇报告从计算托盘角度拆解英伟达 VR NVL72，可以看到，英伟达 VR NVL72 以 1.8TB/s NVLink-C2C+PCIe Gen6+800G SuperNIC 构建三

立即下载

信息科技

2026-05-22

东兴证券

石伟晶

20页

1.92M

[东兴证券]:超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升，点击即可下载。报告格式为PDF，大小1.92M，页数20页，欢迎下载。

本报告共20页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共20页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升

关于我们

联系我们

超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升

关于我们

联系我们

小程序

公众号