电子行业AI系列之国产算力:2026关注1-N放量

分析师:王芳 S0740521120002,杨旭 S0740521120001,李雪峰 S0740522080004证券研究报告日期:2026年02月06日【中泰电子】AI系列之国产算力:2026关注1-N放量1目 录一、算力芯片:GPU vs ASIC二、国产趋势一:算力自主可控是确定方向三、国产趋势二:大厂自研芯片是必经之路四、国产趋势三:芯片逐渐由单卡走向系统集成五、投资建议&风险提示2来源:中国日报网,智研咨询,沐曦招股书,CSDN,中泰证券研3nGPU芯片与ASIC芯片是算力解决方案的两大支柱:AI芯片在人工智能的算法和应用上做针对性设计,可高效处理人工智能应用的计算任务(其他非计算任务仍由CPU负责)。当前主流的AI芯片分为三类——GPU、FPGA、ASIC,GPU、FPGA均是前期较为成熟的芯片架构,属于通用型芯片,其中GPU并行计算能力强,在AI训练和推理场景应用最多,ASIC属于为AI特定场景定制的芯片,具有较佳的性能和能效比,和GPU构成目前AI芯片的两大核心。ØGPU适用于AI计算,相比于传统GPU主要执行图形之外的通用计算任务,利用GPU的并行计算优势,加速科学计算、大数据分析、深度学习等领域,尤其在大规模并行计算时,比传统CPU更为高效。ØASIC芯片适用于推理:ASIC芯片设计目的是高效处理特定算法,通过针对特定任务进行硬件优化,其能够最大限度利用硬件资源实现高性能计算,同时保持极低功耗,因此ASIC芯片在AI推理等任务中表现出色。图表:CPU、GPU、FPGA和ASIC简要介绍1. GPU与ASIC是算力两大支柱 CPUGPUFPGAASIC名称中央处理器图形处理器现场可编程门阵列专用集成电路定制化程度通用半通用半定制化全定制化特点通用性最强,擅长逻辑控制、串行的运算,但并行算力弱,较少用于AI提供了多核并行计算的基础结构,可支撑大量数据的并行计算,计算能力强,但功耗高可编程性、灵活性高,但开发复杂度高且运算能力有限定制化设计、能效比高,但由于缺乏通用性、开发成本高且周期长,适合大规模、固定场景的应用代表公司Intel英伟达、AMDAltera(Intel收购)、Xilinx(AMD收购)博通、寒武纪来源:沐曦招股书,半导体产业纵横,亿欧网,GPU那些事儿,中泰证券研4nGPU专为通用并行计算任务设计,具有高度并行性、高内存带宽与多级缓存的特征:1)高度并行性:拥有大量并行计算单元,多条流水线可在单一控制部件的集中控制下运行;2)高内存带宽:通常集成高速的GDDR或HBM显存颗粒,提供高访存带宽以处理数据密集型运算;3)多级缓存:包括全局内存、共享内存、寄存器等,大幅提高数据访问效率、降低延迟。nGPU广泛应用于AI计算、深度学习训练等领域:GPU主要进行非图形相关程序的运算,如科学模拟、数据分析、机器学习、高性能计算,广泛应用于科学计算、深度学习训练等场景。n相较于NPU、TPU等AI芯片,GPGPU通用性更强、生态壁垒和开发难度更低:GPGPU采用SIMT架构可实现 “开箱即用”, NPU/TPU仍沿用传统SIMD架构,需手动编排流水线,时延隐藏效率远不及SIMT,导致编写高性能内核难度大、效率低,既难以实现易用性,生态完善程度也落后于GPGPU。1.1 GPU:专为AI计算优化设计图表:GPGPU、NPU和TPU的对比 GPU(CUDA Core)NPU(MAC阵列)TPU(脉动阵列)并行机制SIMT(单指令多线程,即单一指令流驱动多线程并行执行,每个线程处理独立数据集),通过通用调度机制与友好的编程接口,实现 “开箱即用” 的高性能。沿用传统 SIMD(单指令多数据)架构,仅能处理不同指令对相同地址的访问阻塞,缺乏SIMT架构中针对线程的延迟隐藏机制,开发者优化时需编写 “高性能内核”,加剧了使用门槛。典型配置20000+核心1024x1024 MAC128x128运算单元通用计算能力完备受限几乎无生态成熟度20年积累5年发展仅限谷歌云生态壁垒/移植成本壁垒低(标准API):国产GPU如果直接兼容CUDA生态,算子与推理引擎框架无需重写,仅需重新编译即可复用,大幅降低了迁移成本壁垒高(需重写算子):开发者往往需要持续高强度加班以适配算子、优化性能、搭建深度学习引擎框架极高(封闭生态)开发难度低:可自主开发算子、进行性能优化,且门槛相对较低除少数大厂外,多数开发者只能依赖厂商提供的SDK与解决方案,难以自主开展深度优化来源:英伟达官网,腾讯网,蜂耘网公众号,芯智讯,CSDN,Morgan Stanley,中泰证券研5n英伟达作为GPU的代表企业,其架构经历了Volta(12nm)→Ampere(7nm)→Hopper(4nm)→Blackwell(4nm)迭代,新一代Rubin(3nm)架构将于26年下半年推出,随AI持续迭代的过程也伴随形态、价值量快速提升。1.1.1 英伟达是GPU领先企业,其架构持续迭代升级图表:英伟达GPU产品架构及参数迭代梳理架构类型发布时间形态制程(nm)算力(稠密/稀疏*,TFLOPS)显存互联带宽(GB/s)TDP(最大功耗,W)ASP(美元)单服务器GPU数量FP4FP6INT8FP8FP16/BF16TF32容量(GB)HBM配置带宽(GB/s)VoltaV1002017年SXM12///125/16/32HBM2900NVLink2.0 3003001w/AmpereA1002020年SXM7624/1248*312/624*156/312*80HBM2e2039NVLink3.0 6004001.5w8HopperH1002022年SXM43958*3958*1979*989*80HBM33350NVLink4.0 9007002.4w8H2002023年SXM43958*3958*1979*989*141HBM3e4800NVLink4.0 9007002.4w8Blackwell+ Blackwell UltraB1002024年SXM(双die) 4NP7P/14P*3.5P/7P*3.5P/7P*3.5P/7P*1800/3500*900/1800*192HBM3e8000NVLink5.0 18007003w8B200SXM(双die) 4NP9P/18P*4.5P/9P*4.5P/9P*4.5P/9P*2250/4500*1120/2250*192HBM3e8000NVLink5.0 18001000/8GB2002xB200(4 die) 4NP20P/40P*10P/20P*10P/20P*10P/20P*5P/10P*2500/5000*384HBM3e16000NVLink5.0 1800*2最高达2700/36/72B3002025年SXM(双die) 4NP15P/17.5P*//4.5P/9P*2.25/4.5P*1120/2250*288HBM3e8000NVLink5.0 18001400/36/72GB3002xB300 4NP30P/38.9P*/ / 10P/20P*5P/10P*2500/5000*576HBM3e16000NVLink5.0 1800*21400/ 36/7

立即下载
信息科技
2026-02-07
中泰证券
72页
10.06M
收藏
分享

[中泰证券]:电子行业AI系列之国产算力:2026关注1-N放量,点击即可下载。报告格式为PDF,大小10.06M,页数72页,欢迎下载。

本报告共72页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共72页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
康宁光通信业务收入拆分
信息科技
2026-02-07
来源:通信行业周观点:北美云商Capex信心强劲,康宁光互连长单驱动扩产
查看原文
康宁光通信业务收入及增速 图 17:康宁光通信业务净利率
信息科技
2026-02-07
来源:通信行业周观点:北美云商Capex信心强劲,康宁光互连长单驱动扩产
查看原文
康宁季度营业收入及增速 图 15:康宁季度 GAAP 净利润及增速
信息科技
2026-02-07
来源:通信行业周观点:北美云商Capex信心强劲,康宁光互连长单驱动扩产
查看原文
Meta 季度广告收入及增速
信息科技
2026-02-07
来源:通信行业周观点:北美云商Capex信心强劲,康宁光互连长单驱动扩产
查看原文
Meta 季度资本开支(PPE 口径)及增速 图 12:Meta 年度资本开支及指引(取中值)
信息科技
2026-02-07
来源:通信行业周观点:北美云商Capex信心强劲,康宁光互连长单驱动扩产
查看原文
Meta 季度营业收入及增速 图 10:Meta 季度 GAAP 净利润及增速
信息科技
2026-02-07
来源:通信行业周观点:北美云商Capex信心强劲,康宁光互连长单驱动扩产
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起