通信行业周跟踪:再论昇腾cloudmatrix384创新性,算力板块迎来业绩情绪双击
请务必阅读最后股票评级说明和免责声明1通信周跟踪(20250623-20250629)领先大市-A(维持)——再论昇腾 cloudmatrix384 创新性,算力板块迎来业绩情绪双击2025 年 7 月 4 日行业研究/行业周报通信行业近一年市场表现资料来源:最闻相关报告:【山证通信】—— MWC 上海展示低轨卫星地面基建新机遇,AMD Helios机柜或使用更多光模块与铜缆-山西证券通信行业周跟踪:MWC 上海展示低轨卫星地面基建新机遇,AMD Helios 机柜或使用更多光模块与铜缆 2025.6.26【山证通信】AMD 展示 Helios 超节点机柜,东山精密拟收购索尔思-周跟踪(20250609-20250615) 2025.6.19分析师:高宇洋执业登记编码:S0760523050002邮箱:gaoyuyang@sxzq.com张天执业登记编码:S0760523120001邮箱:zhangtian@sxzq.com赵天宇执业登记编码:S0760524060001邮箱:zhaotianyu@sxzq.com投资要点行业动向:1)近期华为联合硅基流动发布 Cloudmatrix384(以下简称 CM384)技术论文,软硬协同实现推理效率大幅提升1.1 全对等互联 UB 总线架构充分利用内存池概念,将通信时延影响下降到最低。CM384 中 384 个 NPU 和 192 个 CPU 均通过 UB 交换机连接,节点间通信性能接近节点内通信性能,从而可令 384 卡拥有全局可寻址的计算和内存能力,从而促使统一的资源池化和高效的工作负载安排。UB 网络采用 clos 架构设计,16 个机架中的 L1/L2 层交换机形成二层无阻塞网络,确保任意两个 NPU/CPU 间通信带宽恒定。CM384 还引入了 AIV 直连机制,可以通过 UB 网络写入远程 NPU内存,跳过 SDMA 中转,使得 NPU 启动延迟大幅下降。1.2 CM384 集成三个独特但互补的网络平面,可以适配细粒度的工作任务调配。其中一个是 UB 平面,全拓扑架构连接 384 个 NPU 和 192 个 CPU,每台 NPU提供 392GB/s 的单向带宽,UB 能够实现高效细粒度并行策略例如 TP 和 EP,并且能快速点对点访问池化内存,对于高效缓存模型权重和键值权重至关重要。第二个是 RDMA 平面,采用融合 RDMA(RoCE)技术,每个 NPU 提供 400Gbps带宽,关键功能包括推理中 prefill 和 decoder NPU 间高速传输 KV cache、RDMA分布式训练推理。第三个是 VPC 平面,通过高速网卡将 CM384 连接到更广泛的数据中心网络,每个节点 400Gbps 单向带宽,VPC 负责处理管理和控制平面操作、访问持久化存储以及来自 CPU 驻留工作负载的外部服务通信。1.3 CANN 软件栈深度优化,华为云运行 deepseek 效率超 H800。华为云基础设施软件栈包括了 MatrixResource(资源分配管家)、MatrixLink(网络通信管家)、MatrixCompute(逻辑节点管家)、MatrixContainer(容器部署管家)以及 ModelArts(AI 全流程管家)。华为通过 CANN 软件栈充当中间软件层,实现高级 AI 框架与昇腾 NPU 低级硬件接口的高效集成,使昇腾开发者能够以最小的代码更改利用昇腾硬件,对标 CUDA+GPU 实现接近峰值的设备性能。根据论文实测数据在DeepSeekR1 Prefill 阶段,在同样的 batchsize 下,H800 的每卡每 TFLOPS tokens吞吐为 3.96,而 CM384 为 4.45;decode 阶段 H800 为 1.17,CM384 为 1.29。1.4 从未来昇腾演进方向看投资机会。论文认为,统一 VPC 和 RDMA 平面、更大规模的超节点、CPU 的物理分解和池化是昇腾集群未来进化的主要方向。我们认为,CM384 创新二层交换超节点架构带来了高速铜连接模组纯增量和光模块的大幅新增需求,下一代产品单卡带宽有望继续大幅增长,高速连接器差分对需求增加、光模块 400G 有望升级 800G。同时超节点规模的进一步扩大将会给 MPO行业研究/行业周报请务必阅读最后股票评级说明和免责声明2高密度布线和 OCS 交换机带来确定性机会,尤其是 OCS 交换机在处理千卡规模超节点时成为业内公认技术路线,谷歌的 TPU 部署已具备成功经验。同时,CPU的物理分解和池化可能将 NPU 机柜密度进一步提升有利于液冷和高功率电源的渗透。2)算力板块 Q2 业绩展望乐观,市场情绪缓和下市场迎来重要做多窗口在上周举办的 GTC 巴黎峰会上,英伟达宣布,法国、意大利、英国等区域技术与云供应商 Domyn、Mistral AI、Nebius、Nscale 将为主权 AI 部署超过3000EFLOPS 的 Blackwell 系统。在德国,英伟达正为欧洲制造商如西门子打造全球首个工业 AI 云,将由 DGX B200 系统和搭载 1 万个 GPU 的 RTX PRO 服务器提供支持,这些工业 AI 云将运行工业设计仿真、工业自动运维、数字孪生、自动驾驶和机器人训练等。随着特朗普政府废除“AI 出口分级政策”,主权 AI 以及各行业垂类应用成为接棒北美投资的重要市场。我们建议关注 ORACLE、xAI、mistral 等算力产业链;同时我们认为,AI 下沉市场部署刚刚开始,建议重视边缘计算和端侧设备机会,比如基于 CX8 PCIE交换机的推理服务器、DGX Spark AI 盒子等在产业链的映射标的。3)东山精密公告拟收购索尔思光电,光模块主力上市公司再添新成员。根据芯智讯援引《经济日报》报道,鸿海最新一代 GB300 服务器已在测试中,下半年有望出货,由于与 GB200 架构相似,鸿海预期 GB300 量产爬坡更为顺利,今年云端网络业绩将逐季成长。而另一家系统厂商广达 GB200 机柜第二季度已放量出货,GB300 正在测试与客户验证阶段,预计 9 月出货,CSP 大厂对 GB300需求火热,下半年 AI 服务器出货量大预期大幅增长。英伟达系统厂商出货反馈显示,算力链相关的光模块、铜连接、PCB 等有望实现逐季环比业绩增长,而各类大模型应用 API 调用量屡创新高也打消了投资人对 2026 年市场需求的顾虑。我们认为,光模块和铜连接作为 AI 芯片的超线性增长配套成长属性依旧强劲,建议同时把握业绩释放和新技术事件催化(如 CPO OCS)双重投资机会。建议关注:昇腾产业链:华丰科技、华工科技、光迅科技、光库科技、英维克、兴森科技、生益电子、南亚新材;光模块:中际旭创、新易盛、天孚通信、联特科技、腾景科技、东山精密;铜连接:沃尔核材、鼎通科技、奕东电子、鑫科材料、新亚电子、兆龙互连。市场整体:本周(2025.6.23-2025.6.27)市场整体上涨,创业板指数涨 5.69%,申万通信指数涨 5.53%,深圳成指涨 3.73%,科创板指数涨 3.17%,沪深 300 涨 1.95%,上证综指涨 1.91%。细分板块中,周涨幅最
[山西证券]:通信行业周跟踪:再论昇腾cloudmatrix384创新性,算力板块迎来业绩情绪双击,点击即可下载。报告格式为PDF,大小1.41M,页数14页,欢迎下载。
