计算机行业国产ASIC系列研究之5:摩尔线程,生态、架构、集群
行业及产业 行业研究/行业深度 证券研究报告 计算机 2025 年 10 月 10 日 摩尔线程:生态、架构、集群 看好 ——国产 ASIC 系列研究之 5 相关研究 《国产 ASIC:PD 分离和超节点——ASIC系列研究之四》 2025/09/26 《国产算力趋势走强,沐曦领衔通用GPU——国产 ASIC 系列研究之 3》 2025/09/24 证券分析师 黄忠煌 A0230519110001 huangzh@swsresearch.com 杨海晏 A0230518070003 yanghy@swsresearch.com 研究支持 曹峥 A0230525040002 caozheng@swsresearch.com 杨紫璇 A0230524070005 yangzx@swsresearch.com 王开元 A0230125030001 wangky@swsresearch.com 联系人 曹峥 (8621)23297818× caozheng@swsresearch.com 本期投资提示: ⚫ 国内 AI 算力行业正经历供给和需求的双重剧变。需求侧:Token 消耗快速提升推动 AI Capex 增长,深层次体现出国内 AI 大模型渗透率和用户粘性的提升。供给侧:国产 AI芯片产品、技术、供给在 2025 均有较大进展;最先进产品在推理端的性能已接近英伟达 H100 水平,持续追赶。 ⚫ 摩尔线程:生态、架构、集群亮点纷呈。摩尔线程成立于 2020 年,专注自主研发全功能 GPU 芯片及相关产品。创始人团队均来自英伟达,创始人张建中曾任英伟达全球副总裁、大中华区总经理,行业经验丰富。 ⚫ 定位全功能 GPU,24 年起智算产品开始商业化。摩尔线程单一 GPU 芯片中集成了 AI 计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码等多种能力,满足多样化需求。在工作效率、生态完整多样性以及兼容性等方面更具有优势,更好适应未来新兴及前沿计算加速应用场景的需求。产品线覆盖 AI 智算、图形加速及智能 SoC,可应用于端侧设备、PC、服务器及数据中心等场景。24 年后 AI 智算卡驱动收入高速增长。 ⚫ 智算领域,公司在芯片、集群层级均具备先进性:1)芯片级:公司自主研发软硬融合的全功能 GPU 计算加速统一系统架构 MUSA,硬件上采用 Chiplet、高速 I/O 接口和优化通信协议等提升性能;软件上兼容 CUDAC++核心语义和 Triton 语言,与国际主流 GPU生态的兼容。2)集群级:打造软硬一体、系统级算力解决案 KUAE,包含基础设施、集群管理、大模型三个层级,攻克千卡至万卡级 GPU 集群的高效互联难题,确保算力协同与通信性能契合大规模智算中心需求;千卡集群效率超过同等规模国外同代产品。 ⚫ 后续国产 AI 芯片生态如何演变?1)软件生态:从框架适配到开源生态社区的产业链协同,算力与大模型深度融合;2)互联生态:国内华为、海光两大生态体系雏形初定。 ⚫ 软件生态:①华为昇腾:使能 CANN 全面开源开放,采用木兰宽松许可证 v2,支持商用和二次分发。新增 200+深度优化算子,80+融合算子,100+通信、矩阵运算 API,显著降低开发门槛。②寒武纪:拥有完整的软件堆栈,SDK 中包含各类库,自有智能编程语言 BANG 底层算子处于国产算力第一梯队。③海光信息:兼容“类 CUDA”环境,已与国内外主流大模型全面适配,兼顾推理与训练需求,全面支持 300+ AI 应用场景。 ⚫ 模型生态:耦合已超越简单的硬件适配,进入算子与模型架构共同演进的阶段,深度耦合在产业合作中已涌现出清晰的落地路径与生态雏形。国产大模型公司与国产 AI 芯片企业紧密合作。如 DeepSeek 模型更新,华为、寒武纪等实现 Day0 适配,通义千问同样在探索与国产算力的深度融合。 ⚫ 互联生态:①海光:开放 CPU 互联总线协议(HSL),合作伙伴可通过 HSL 实现更高效系统互联。②华为: 开放灵衢统一总线(Unified Bus),支持超节点内不同类型、不同距离的组件统一互联。 ⚫ 风险提示:技术路线不确定的风险;技术研发迭代进展不及预期;供应链稳定风险。 请务必仔细阅读正文之后的各项信息披露与声明 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第2页 共25页 简单金融 成就梦想 投资案件 结论和投资分析意见 国产 AI 芯片已经到达全面放量应用的临界点,第一梯队包括华为、寒武纪、海光信息,进展较快的包括沐曦股份、摩尔线程、阿里平头哥、百度昆仑芯、壁仞科技等。最先进产品在推理端性能已接近英伟达 H100,持续追赶。 其中,摩尔线程在生态、架构、集群亮点纷呈,其产品定位全功能 GPU,更适应未来新兴及前沿计算加速应用场景的需求,未来有望成为领先的国产 AI 芯片厂商。 原因与逻辑 需求端:国内 Tokens 消耗量快速增长,推动云、互联网等参与方大幅增加 AI 相关 Capex 投入,底层逻辑为国内 AI 大模型渗透率和用户粘性的提升。供给端:国产AI 芯片产品、技术、供给在 2025 均有较大进展,最先进产品在推理端性能已接近英伟达 H100,且性能持续追赶。 摩尔线程创始团队成员均具有英伟达背景,创始人张建中曾任英伟达全球副总裁、大中华区总经理,行业经验丰富。摩尔线程在芯片架构设计、软件生态兼容CUDA、集群通信互联能力等 AI 芯片应用的关键问题上均有布局,切实解决 AI 芯片在应用场景的瓶颈,实现产品力提升。随着 IPO 落地,预计产品将加速迭代,继续提升摩尔线程在国产 AI 芯片厂商中的地位。 国产 AI 芯片生态正在加速丰富和深化。从过去的适配 PyTorch/TensorFlow 等框架到现在的工具链全栈开源,国产 AI 芯片的开发者生态与工具链成熟度显著提升。此外,国产芯片与大模型的协同超越简单的硬件适配,进入算子与模型架构共同演进的阶段,未来将形成国产算力-国产大模型生态闭环。在互联生态领域,华为、海光开源自研的互联协议,打造标准化的互联范式。 有别于大众的认识 市场认为,国产 AI 芯片尚处于小批量、可用阶段。我们认为,随着越来越多头部互联网厂商大规模测试国产 AI 芯片并得到可靠的验证结果,叠加国产 AI 芯片出货量,印证国产 AI 芯片在推理端的性能已达到“好用”水平。 市场认为,国产 AI 芯片的软件生态仍为掣肘。我们认为,国产 AI 芯片软件生态主要为自研和类 CUDA 两条路线,经过近两年迭代与生态开发,下游用户易用性已有极大提升;此外,AI 芯片厂商与大模型厂商、客户紧密合作,显著提升生态耦合度。 市场认为,国产算力在互联领域仍与 NVLink 有较大差距。我们认为,随着华为384 超节点展现 UB 网络互联能力,以及随后华为、海光分别开放互联总线协议灵渠、HSL,通用的国产 AI 芯片互联生态正在逐步成熟,未来在互联规模和效率上都会有显著提升。 行业深度 请务必仔细阅读正文之后的各项信息披露与声明
[申万宏源]:计算机行业国产ASIC系列研究之5:摩尔线程,生态、架构、集群,点击即可下载。报告格式为PDF,大小2.54M,页数25页,欢迎下载。
