通信行业专题研究:智算网络架构研究,光铜携手共进

智算网络架构研究——光铜携手共进评级:强于大市(维持)证券研究报告2025年08月11日行业:通信通信行业专题研究马成龙(分析师)S1160524120005刘正(联系人)请务必阅读报告正文后各项声明2请务必阅读报告正文后各项声明投资摘要 AI集群网络架构升级,后端组网拉动光模块需求。传统的云数据中心网络流量主要是从数据中心到最终客户,以南北向流量为主;AI集群东西向的通信流量占据主要部分,因此需增设后端网络实现各服务器间的互联,大幅拉动了光模块、交换机、网卡、光纤光缆的需求。当前主流的AI后端网络以IB和以太网方案为主,尽管IB性能更加突出,但综合考虑成本和生态,我们认为后续以太网方案将逐步占据主导地位。 英伟达GB300出货在即,1.6T光模块需求有望爆发。英伟达GB300有望于下半年出货,相比于GB200 NVL72 ,在交换设备层面GB300 NVL72在网卡端和交换机端都做了升级。GB200采用CX7网卡,使用 Q3200 Quantum-3 交换机托盘,其包含 2 个独立交换机,每个交换机有36个400Gb/s端口;GB300 采用CX8网卡,需配置Quantum-X800 QM3400交换机,其配有144个端口,每个端口均可提供800Gb/s的连接,需要72个1.6T双端口光模块。因此GB300 NVL72在网卡端光模块由400G升级为800G,交换机端光模块由800G升级至1.6T,带动光模块整体价值量提升。此外,随着互联速率的不断提升,交换机市场规模也有望不断扩大。 自研ASIC加速,有望带动光模块、AEC需求。谷歌、AWS、Meta、微软等均加大对自研ASIC的支持力度,从架构层面看谷歌TPU连接采用3Dtorus架构和OCS,以增强拓展性和互联效率,我们认为机柜内部连接采用DAC,机柜间连接TPU:光模块=1:1.5(4096个TPU网络),提高网络层数光模块配比将相应提升。AWS的Trn2在机柜内及网卡端均采用AEC连接,测算Trn2芯片和400G AEC的数量配比关系为1:1.5。 投资建议:推荐光器件光模块领先企业【中际旭创】【新易盛】【天孚通信】,建议关注【汇绿生态】;此外推荐高速铜缆环节领先企业【兆龙互连】,建议关注【沃尔核材】【瑞可达】。 风险提示:AI发展及投资不及预期;行业竞争加剧;全球地缘政治风险;新技术发展引起产业链变迁。请务必阅读报告正文后各项声明3目录/Contents01020304AI集群网络架构升级,IB、以太网方案逐鹿英伟达H100、NVL72集群网络架构详解北美头部CSP网络架构投资建议请务必阅读报告正文后各项声明401AI集群网络架构升级,IB、以太网方案逐鹿请务必阅读报告正文后各项声明传统网络架构难以承载智算业务 传统数据中心网络以南北向流量为主。传统的云数据中心网络一般是基于对外提供服务的流量模型而设计的,流量主要是从数据中心到最终客户,即以南北向流量为主,云内部东西向流量为辅。 传统架构无法承载智算业务。(1)网络有阻塞:传统架构因考虑到并非所有服务器都同时对外产生流量,为控制成本,Leaf交换机的带宽存在收敛比,一般上联带宽:下联带宽=1:3。(2)时延高:跨Leaf交换机的两台服务器互访需要经过Spine交换机,转发路径有3跳。(3)单服务器只有一张网卡,且网卡带宽不够大。5请务必阅读报告正文后各项声明5图2:传统网络架构不适用AI计算资料来源:InfoQ,东方财富证券研究所图1:传统网络架构以南北向流量为主资料来源:百度智能云《智算中心网络架构白皮书(2023)》,东方财富证券研究所请务必阅读报告正文后各项声明 AI集群与传统网络的南北向通信流量为主不同,其东西向的通信流量占据主要部分。 AI服务器组网增设后端网络。AI网络集群通信依靠两个互相独立的网络:前端网络负责数据摄取、查询和数据传输训练,后端网络则实现各服务器间的互联。后端网络的增设拉动了交换机、光模块、光纤光缆、网卡等设备的需求。6请务必阅读报告正文后各项声明图3:AI网络架构分为前端网络与后端网络资料来源:Meta,东方财富证券研究所AI网络架构增设后端网络,拉动交换机、光模块需求请务必阅读报告正文后各项声明 RDMA(Remote Direct Memory Access)技术全称远程直接内存访问,传统的TCP/IP网络通信是通过内核发送消息,存在很高的数据移动、复制开销。为了解决网络传输中服务器端数据处理的延迟,开发了RDMA技术,能直接让一台服务器访问另一台服务器的内存数据,无需通过操作系统内核。RDMA技术显著降低了网络通信的时延,并且提高了通信带宽,已在智算领域广泛应用。7请务必阅读报告正文后各项声明RDMA技术实现智算中心组网图4:RDMA和传统TCP/IP比较资料来源:华为官网,东方财富证券研究所图5:RDMA实现了服务器之间的互联资料来源:百度智能云《智算中心网络架构白皮书(2023)》,东方财富证券研究所请务必阅读报告正文后各项声明 IB和RoCEv2是RDMA的主流方案。实现RDMA的方式有InfiniBand(IB)、RoCEv1、RoCEv2、iWARP 四种。其中RoCEv1技术已被淘汰,iWARP基于TCP/IP架构,因此使用较少;当前RDMA技术主要采用的方案为IB和RoCEv2两种。相较于传统TCP/IP网络,IB和RoCEv2网络时延性能会有数十倍的改善,实验室的测试数据显示,绕过内核协议栈后,应用层的端到端时延可以从50us(TCP/IP),降低到5us(RoCE)或2us(IB)。8请务必阅读报告正文后各项声明图6:四大RDMA方案资料来源:百度智能云《智算中心网络架构白皮书(2023)》,东方财富证券研究所图7:IB、RoCEv2显著降低时延资料来源:百度智能云《智算中心网络架构白皮书(2023)》,东方财富证券研究所RDMA:IB与RoCEv2两大主流方案请务必阅读报告正文后各项声明9请务必阅读报告正文后各项声明图8:IB性能优于以太网资料来源:百度智能云《智算中心网络架构白皮书(2023)》,态路通信官网,东方财富证券研究所IB网络:性能较以太网更加占优 IB性能较以太网更加占优。IB是一种专用协议,最初设计用于服务器、存储和网络设备之间的连接,以满足数据中心的需求,主要目标是提供高性能、低延迟和高可靠性;以太网是一种通用协议,被广泛用于局域网(LAN)和广域网(WAN)通信,主要目标是实现简单性、灵活性和可扩展性。指标IB以太网带宽与速率市场主流的InfiniBand产品为HDR,可以为网络提供端到端高达200G的带宽,NDR将达到400G。InfiniBand 在高性能计算和大规模数据处理中具有明显优势。以太网的速率从10 Mbps 起步,已发布了100 Gbps、200 Gbps、400 Gbps、800 Gbps 甚至1.6 Tbps 的以太网接口延迟InfiniBand 可以提供更低的延迟,通常在微秒级别。以太网的延迟相对较高,通常在微秒到毫秒级别之间扩展能力单集群万卡GPU 规模,且保证整体性能不下降单集群支持千卡规模且整体网络性能也无太大的降低请务必阅读报告正文后各项声明10

立即下载
信息科技
2025-08-12
东方财富证券
36页
3.79M
收藏
分享

[东方财富证券]:通信行业专题研究:智算网络架构研究,光铜携手共进,点击即可下载。报告格式为PDF,大小3.79M,页数36页,欢迎下载。

本报告共36页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共36页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
表5:上周行业 PE(TTM)估值分位涨多跌少,电子行业领涨 5.1pct,汽车行业领跌 9.4pct
信息科技
2025-08-12
来源:情绪与估值7月第4期:融资买入额占比上行,电子引领成长估值上涨
查看原文
图16:上周消费板块 PE(TTM)处于历史分位 32.8%,较上上周上涨 1.2 个百分点
信息科技
2025-08-12
来源:情绪与估值7月第4期:融资买入额占比上行,电子引领成长估值上涨
查看原文
图14:上周金融板块 PE(TTM)处于历史分位 85.2%,较上上周下跌 0.9 个百分点
信息科技
2025-08-12
来源:情绪与估值7月第4期:融资买入额占比上行,电子引领成长估值上涨
查看原文
图12:上周主要风格 PE 分位跌多涨少,稳定风格跌幅最大
信息科技
2025-08-12
来源:情绪与估值7月第4期:融资买入额占比上行,电子引领成长估值上涨
查看原文
表4:上周各主要风格 PE(TTM)估值分位数跌多涨少,PB(LF)分位数涨多跌少
信息科技
2025-08-12
来源:情绪与估值7月第4期:融资买入额占比上行,电子引领成长估值上涨
查看原文
图10:上周创业板指 PE(TTM)处于历史分位 20.4%,较上上周上行 1.5 个百分点
信息科技
2025-08-12
来源:情绪与估值7月第4期:融资买入额占比上行,电子引领成长估值上涨
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起