通信行业深度报告:光通信:AI算力中心的神经网络

光通信:AI算力中心的神经网络证券分析师:唐仁杰 S0370524080002证券研究报告通信/行业深度报告2025年6月24日行业评级:增持(首次)摘要•单一芯片算力无法满足AI训练需求:模型所需算力与单芯片算力之间的巨大差距。例如GPT-3每次训练迭代需约4.5 EFLOPS计算,但单卡GPU仅提供数十TFLOPS级算力,差距高达百万倍。为突破计算墙,使用数十甚至上百GPU进行并行计算(分布式训练)。AI算力集群受制于“通信墙”:通过分布式训练部分解决了算力墙和存储墙后,通信墙随之凸显。大模型并行需要大量节点间通信(如AllReduce梯度同步、AlltoAll等),通信性能直接决定训练效率•算力基础建设方面,截至2024年,中国算力总规模为280EFLOPS,2020年至2024年期间年复合增长率为20%。根据弗若斯特沙利文预测,中国算力规模将从2024年的280EFLOPS增长至2029年的648.3EFLOPS,2024-2029年期间仍维持18.3%的年复合增长率。需求方面,AI创新浪潮下,云端智能平台及数字基础设施解决方案市场规模持续增长:预计2029年,中国云端智能平台、数字基础设施规模将分别增长至1.8万亿、1.3万亿元。•从国内算力基础设施市场规模来看,网络资源市场规模占比仅次于算力资源。中国算力基础设施规模从2020年的3,397亿元增长至2024年的6,144亿元。2024年,国内计算资源市场规模为3858亿元,为基础设施占比最大项。网络资源市场规模为1516亿元,仅次于计算资源,约占基础设施市场规模比例为24%。•铜互连技术成熟、成本较低,用于服务器机箱内部、机架内等短距离高带宽连接场景。在人工智能数据中心(AIDC)中,GPU、CPU 等加速器之间以及服务器与Top-of-Rack交换机之间的短距离互连传统上大量采用铜质连接,其优势在于无需复杂的光电转换、初始投入成本低且安装维护相对简单。然而,随着芯片通信速率逼近极限,铜介质信号传输面临固有瓶颈,高频下电阻与介电损耗导致信号完整性下降和严重的传输损耗,这不仅限制了带宽和距离,还将相当一部分信号功率转化为热量。光互连是利用光纤等介质传输光信号的互连方式,通过光收发模块将电信号转换为光信号进行高速远距离传送。光互连克服了铜互连在频宽和距离上的物理限制,光信号在光纤中传输损耗极低、抗电磁干扰,能够在更高频率下保持信号完整,适合远距离、大带宽数据通信•AI 集群大小已经突破了单个数据中心的物理占用空间所能实现的极限,推动了对多站点AI集群(Scale-out)的需求。Scale up 和Scale out通过增加更多的算力资源来实现更大的承载能力。区别在于Scale up从软件角度来看是一台计算,互连必须非常可靠,且尽可能减小延迟。但当数据速率增加至200Gbps时,达到铜缆物理极限。而Scale out通过多层交换机组成,其任务被拆分成多个计算资源,因此横向扩展实际上是一个大规模网络,且距离较远。所以,随着高速率、低延迟且距离增大的需求逐渐增大,无论是Scale-up还是Scale-out,光互连的必要性大幅提升。•数据中心正经历高速化、智能化、低功耗与低成本的核心变革,驱动光通信及硅光技术成为不可逆的大趋势。800G规模化商用部署已启动,交换机芯片吞吐量将从2023年的51.2Tb/s跃升至2025年的102.4Tb/s,并加速向800G/1.6T升级;与此同时,光互连功耗贡献首次超越交换机芯片(400G模块初期功耗10-12W,目标8-10W),迫使行业采用低功耗调制器与光引擎-交换机芯片共封装方案•光模块市场近年来稳步增长,主要得益于对高速数据传输以及人工智能、云计算及5G等数据密集型应用的需求。2020年至2024年期间,全球光模块销售收入从112亿美元增至178亿美元,复合年增长率为12.2%。数据中心和云计算快速发展的带动下,高速光模块尤其是800G及以上的光模块发展迅猛。800G光模块作为最先进的量产技术,2020年至2024年的复合年增长率高达188.1%,预计2024年至2029年将保持19.1%的稳步增长。与此同时,代表下一代预研技术的1.6T光模块在更高带宽需求、更低功耗要求及人工智能驱动数据处理的需求推动下将迎来爆发式增长,预计2024年至2029年的复合年增长率将达到180.0%•相关公司:我们认为,随着AI算力中心集群扩张,无论是Scale up还是Scale out方案均对高速率、低功耗连接有更高要求,高速率、短、中长距离光连接及硅光、CPO封装需求随着数据中心基础设施建设加速放量,有望带来更大市场。关注高速光模块及适配CPO方案的激光器、调制器及无源器件核心器件设计、生产厂商:华工科技(000988.SZ)、联特科技(301205.SZ)、源杰科技(688498.SH)、光库科技(300620.SZ)、新易盛(300502.SZ)•风险提示:高速光模块技术发展路线较多,各细分市场如调制器材料、光源技术路线不确定性较大; AI算力中心建设周期较长,存在明显周期性; AI技术路线变化导致算力中心Capex不及预期;海外需求影响较大,且部分组件依赖海外巨头,地缘冲突导致企业盈利受损;各公司前期研发成本较高,技术门槛较高导致利润不及预期目录一、AI算力中心的挑战-“通信墙”二、AI催化下,中国算力基础设施维持高增长风险提示:高速光模块技术发展路线较多,各细分市场如调制器材料、光源技术路线不确定性较大;AI算力中心建设周期较长,存在明显周期性;AI技术路线变化导致算力中心Capex不及预期;海外需求影响较大,且部分组件依赖海外巨头,贸易冲突影响企业利润;各公司前期研发成本较高,技术门槛较高导致利润不及预期;政治、政策不确定性因素及其他宏观因素五、铜互连 vs 光互连六、高速光模块加速渗透,价值量持续提升三、AI基础设施构成:网络资源重要性仅次于算力资源四、AIDC的“神经网络”互连结构七、直接调制光模块vs相干光模块八、发射端核心器件:激光器、调制器九、光通信中的无源器件:连接器、分路器、波分复用器十、接收端核心器件:光探测器十一、光电互连的结合体:CPO和OIO十二:相关公司AI算力中心的挑战-“通信墙”•单一芯片算力无法满足AI训练需求:模型所需算力与单芯片算力之间的巨大差距。例如GPT-3每次训练迭代需约4.5 EFLOPS计算,但单卡GPU仅提供数十TFLOPS级算力,差距高达百万倍。为突破计算墙,使用数十甚至上百GPU进行并行计算(分布式训练)。AI算力集群受制于“通信墙”:通过分布式训练部分解决了算力墙和存储墙后,通信墙随之凸显。大模型并行需要大量节点间通信(如AllReduce梯度同步、AlltoAll等),通信性能直接决定训练效率•存储墙是芯片级带宽瓶颈,而通信墙则是AIDC整体带宽瓶颈:存储墙则源于内存容量与带宽不足,通过HBM、先进封装实现芯片级带宽扩张。而当通过分布式训练时,通信墙随之凸显。大模型并行需要大量节点间通信(如AllReduce梯度同步、AlltoAll等),通信性能直接决定效率。算力规模 > 通信能力随着大模型训练从几百张 GPU 扩展到数万张甚至跨园区集群

立即下载
信息科技
2025-06-27
金元证券
唐仁杰
44页
6.4M
收藏
分享

[金元证券]:通信行业深度报告:光通信:AI算力中心的神经网络,点击即可下载。报告格式为PDF,大小6.4M,页数44页,欢迎下载。

本报告共44页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共44页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
重点公司
信息科技
2025-06-27
来源:电子行业2025年中期投资策略:AI助力周期复苏,自主可控持续受益
查看原文
半导体封装键合方式演进历程
信息科技
2025-06-27
来源:电子行业2025年中期投资策略:AI助力周期复苏,自主可控持续受益
查看原文
半导体混合键合示意图
信息科技
2025-06-27
来源:电子行业2025年中期投资策略:AI助力周期复苏,自主可控持续受益
查看原文
台积电 CoWoS 封装示意图 图表81:HBM 侧面结构示意图
信息科技
2025-06-27
来源:电子行业2025年中期投资策略:AI助力周期复苏,自主可控持续受益
查看原文
AMD Zen1 处理器示意图 图表79:Chiplet 对 AMD Zen1 处理器的提升
信息科技
2025-06-27
来源:电子行业2025年中期投资策略:AI助力周期复苏,自主可控持续受益
查看原文
2018 年安靠制造和研发设施区域及占比 图表77:2023 年安靠制造和研发设施区域及占比
信息科技
2025-06-27
来源:电子行业2025年中期投资策略:AI助力周期复苏,自主可控持续受益
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起