电子行业国产ASIC系列研究之3:国产算力趋势走强,沐曦领衔通用GPU
证 券 研 究 报 告国产算力趋势走强,沐曦领衔通用GPU——国产ASIC系列研究之3证券分析师:杨海晏 A0230518070003 黄忠煌 A0230519110001杨紫璇 A0230524070005 袁航 A0230521100002研究支持:曹峥 A0230525040002 陈俊兆 A0230124100001 联系人:杨紫璇 A0230524070005 2025.09.24www.swsresearch.com证券研究报告2投资要点◼ GPU即图形处理器,通常可划分为图形GPU和GPGPU(通用GPU)。根据深芯盟数据,2024年中国加速芯片的市场规模增长迅速,超270万张。本土品牌厂商AI芯片出货量超82万张。根据弗若斯特沙利文数据测算,2024年中国AI芯片市场中GPU的市场规模约1,000亿元,以ASIC/DSA为代表的其他AI芯片的市场规模约425亿元。 ◼ 行业催化不断,持续超市场预期!1)逐步建立国产算力-国产AI模型生态闭环。2025年8月,Deepseek V3.1引入UE8M0 FP8 Scale数据精度,针对即将发布的下代国产芯片,本次更新表明Deepseek后续迭代将逐渐向国产算力倾斜。2)国内互联网大厂2025年资本支出进入上升期。阿里巴巴未来三年计划投入超3800亿元用于AI算力中心、数据中心及AGI(通用人工智能)研发,这一投资计划的总额超过了过去十年的总和;2025年,预计字节资本开支有望达1600亿元,其中约900亿用于AI算力采购。腾讯控股1H25资本开支为466亿元,占收入比例为13%。◼ 沐曦股份:自研架构+兼容CUDA,国内高性能通用GPU领军企业。•团队:拥有AMD顶尖技术背景+丰富实战经验。以陈维良、彭莉、杨建为核心的创始团队,于2020年9月创立沐曦有限。•产品力:沐曦股份在架构、计算能力、存储能力、集群能力和软件生态方面国内领先,累计出货2.5万颗GPU。•收入来源:2024年以及1Q25,公司实现销售收入的GPU产品主要包括训推一体系列和智算推理系列,具体型号包括曦云C500和曦云C550,智算推理系列GPU板卡具体型号包括曦思N100、曦思N260。2023年、2024年和2025年1-3月,公司训推一体芯片曦云C500系列收入分别为1,547万元、7.2亿元和3.1亿元,占主营业务收入的比例分别为30.09%、97.28%和97.87%。◼ 投资分析意见:国产算力趋势走强,沐曦领衔通用GPU。1)GPU相关标的:寒武纪、海光信息、澜起科技、摩尔线程(申报阶段)、沐曦股份(申报阶段)等。2)先进工艺相关标的:中芯国际、华虹公司、长电科技等。◼ 风险提示:市场竞争风险;供应链安全风险。主要内容1. GPU行业:逐步建立国产算力-国产AI模型生态闭环2. 沐曦股份:自研架构+兼容CUDA,国内高性能通用GPU领军企业3. 重点标的4. 风险提示3www.swsresearch.com证券研究报告4GPU行业:2024年中国AI芯片出货量超270万张◼ 根据弗若斯特沙利文数据,2024年GPU架构在中国AI芯片市场中占69.9%的市场份额,其他AI芯片(主要包括ASIC及FPGA)占30.1%。据此测算,2024年中国AI芯片市场中GPU的市场规模约1,000亿元,以ASIC/DSA为代表的其他AI芯片的市场规模约425亿元。 •国内海光信息、沐曦股份、天数智芯、壁仞科技、摩尔线程等是通用型计算架构(GPU)芯片设计企业•以华为海思、寒武纪、昆仑芯、平头哥、燧原科技等为代表的专用型计算架构(ASIC/DSA)芯片设计企业资料来源:沐曦股份招股书,深芯盟,申万宏源研究2024年中国AI芯片(加速芯片)出货量(%)英伟达70%华为昇腾23%昆仑芯3%天数智芯1%寒武纪1%沐曦1%燧原科技1%英伟达华为昇腾昆仑芯天数智芯寒武纪沐曦燧原科技◼ GPU即图形处理器,通常可划分为图形GPU和GPGPU(通用GPU):•通用GPU:主要应用于人工智能计算、通用计算及科学计算,其中在人工智能计算场景还可进一步细分为训练GPU和推理GPU。•图形GPU:主要应用于游戏、专业制图、影视动画、数字孪生等领域。◼ GPU研发难度大,主要体现在硬件层面和通用计算软件生态层面,IP、软件栈方面研发门槛高,先发优势明显。•GPU计算生态由上层算法库,中层接口、驱动、编译器和底层硬件架构三大部分基本构成。◼ 根据Verified Market Research的数据,2024年全球GPU市场规模为774亿美元,2030年有望达到4725亿美元,2024-2030年的复合增长率达35.19%。◼ 根据深芯盟数据,2024年中国加速芯片的市场规模增长迅速,超270万张。本土品牌厂商AI芯片出货量超82万张。•其中Nvidia以190万张占据70%的市场份额,排名第二的是华为昇腾加速芯片,以64万张占比约23%,昆仑芯、天数智芯、寒武纪分列三四五名。www.swsresearch.com证券研究报告5行业催化一:逐步建立国产算力-国产AI模型生态闭环◼ 2025年8月,Deepseek V3.1引入UE8M0 FP8 Scale数据精度,针对即将发布的下代国产芯片。本次更新表明Deepseek后续迭代将逐渐向国产算力倾斜,建立国产算力-国产AI模型生态闭环。•采用FP8精度可以显著降低对HBM内存容量和内存带宽的要求,且提升训推的效率。◼ FP指用二进制表示的浮点数,其中FP4、FP6、FP8、FP16、FP32、FP64分别表示宽度为4位、8位、16位、32位、64位的二进制浮点数,可以进行对应位数的浮点计算。◼ 国产芯片中,目前高性能卡对FP8精度支持有限,但均在迭代中。•沐曦股份:国内首批将FP8、FP4等低精度数值格式和相关指令集引入后续迭代产品架构的企业,能够有效支持以DeepSeek、阶跃星辰、月之暗面等为代表的头部大模型厂商的最新训练与推理需求。•摩尔线程:单一芯片支持FP64 Vector、FP32 Vector、TF32 Tensor、FP16/BF16 Tensor、FP8 Tensor、INT8 Tensor等不同计算精度,以满足GPU加速不同场景的计算需求。资料来源:沐曦股份招股书,申万宏源研究www.swsresearch.com证券研究报告6行业催化二:国内互联网大厂2025年资本支出进入上升期◼ 需求侧:政策明确指引,运营商+政府智算中心+互联网三大需求旺盛•1)电信运营商:根据沐曦股份招股说明书,三大运营商2025年资本开支计划规模合计达2,898亿元,其中投资重心将继续向算力网络建设倾斜•2)政府智算中心:根据中国通信工业协会数据中心委员会发布的《中国智算中心产业发展白皮书》,预计2024年中国智算中心市场投资规模达1,014亿元,并有望在2028年达到2,886亿元。◼ 需求侧:国内算力到模型应用逐步闭环后,以BAT为代表的头部厂商投入进入上升期。•阿里巴巴:未来三年计划投入超3800亿元用于AI算力中心、数据中心及AGI(通用人工智能)研发,这一投资计划的总额超过了过去十年的总和。1H25资本开支为633亿元。•字
[申万宏源]:电子行业国产ASIC系列研究之3:国产算力趋势走强,沐曦领衔通用GPU,点击即可下载。报告格式为PDF,大小2.98M,页数29页,欢迎下载。
