电子行业AI系列专题报告(一),算力:算力基建景气度高,国产AI芯片发展势头良好

AI系列专题报告(一)算力:算力基建景气度高,国产AI芯片发展势头良好证券研究报告分析师:陈福栋 S1060523070003(证券投资咨询)分析师:闫磊S1060519100002(证券投资咨询)平安证券研究所 电子信息团队2025年6月12日请务必阅读正文后免责条款电子行业 强于大市(维持)核心摘要AIGC蓬勃发展,对底层智能算力产生强劲需求。行业前期,训练是算力需求的主力,大量大模型训练需要海量算力支撑。2024年末,DeepSeek重磅发布,其轻量化、低成本、高性能特征大幅拉低了AI应用门槛,有望成为各类推理场景爆发的契机,推理算力市场需求潜力巨大。在此背景下,全球科技巨头资本支出维持在高位,国内智算中心建设如火如荼。根据中国信通院&浪潮信息报告数据,截至2023年底,全球智能算力规模为335EFLOPS,同比增长136%,智能算力需求旺盛,增速远超算力整体规模增速。AI算力芯片:ASIC蒸蒸日上,关注AI芯片国产化。根据中投产业研究院数据,2022年,全球AI芯片市场规模约422亿美元,预计2025年将达到920亿美元,三年CAGR达27.7%。AI算力芯片主要有通用GPU和ASIC两大类,通用GPU是目前的主流,算力强大、生态丰富,英伟达是领导者,AMD紧随其后,加速追赶,国内海光信息、沐熙等也采用该路线;ASIC是专用定制芯片,面对专项任务,计算能力和效率较通用GPU更强,博通和MARVELL是领先者,拥有大量特定任务负载的大型云服务厂商多与其合作开发,典型案例是谷歌TPU系列产品(与博通合作研发),国内华为昇腾、燧原等采用AISC路线。2025年5月19日,英伟达发布NVLink Fusion,允许第三方ASIC芯片接入英伟达计算体系,AI算力基础设施异构融合计算壁垒得到一定缓解,客观上有望推动ASIC芯片的发展。国内来看,AI芯片是美国对华科技制裁的重灾区,其先进的AI芯片产品无法出口至国内,倒逼国内AI算力芯片实现从设计到制造的全产业链国产替代,海光DCU、华为昇腾、寒武纪等已取得一定突破,燧原、沐熙、天数、壁仞等公司也在快速发展,AI算力芯片自主可控已取得长足进步。AI服务器:市场景气度高,国产AI芯片占比提升。根据IDC&浪潮信息报告数据,2024-2028年,我国AI服务器CAGR将达到约30.6%,景气度持续高企,同时,在美国对华半导体出口管制进一步升级、我国AI服务器厂商积极拥抱国产AI芯片等多重因素影响下,国内AI服务器市场中,国产AI芯片占比将持续提高。此外,随着DeepSeek火爆出圈,仅数月时间,国内市场已有100多家厂商推出AI(DeepSeek)一体机,供应端呈现“百机大战”格局,需求端已在政务、金融、医疗、教育、物流等行业多点开花,DeepSeek大模型一体机未来有望持续向好。投资建议:DeepSeek火爆出圈,轻量化、低成本、高性能,推理场景逐渐打开,推理端算力需求将逐步超过训练端。当前,AI算力是美国对华科技制裁的重灾区,先进的AI算力芯片无法出口至国内,反向倒逼国内AI算力从设计到制造到整机的全面国产替代,国内通用GPU、ASIC芯片蓬勃发展,同时服务器和一体机厂商也逐渐向国产AI芯片倾斜,全产业链合力,国内AI算力自主可控已取得不菲成果。推荐海光信息、浪潮信息、龙芯中科、芯原股份、紫光股份、深信服、神州数码,建议关注寒武纪、华勤技术、软通动力。风险提示:(1)大模型应用落地不及预期的风险。(2)国产AI芯片开发不及预期的风险。(3)美国对华科技制裁的风险。2目录C O N T E N T S二、AI算力芯片:ASIC蒸蒸日上,关注AI芯片国产化一、AIGC蓬勃发展,对底层智能算力产生强劲需求三、AI服务器:市场景气度高,国产AI芯片服务器占比提高四、投资建议及风险提示1.1 大模型发展助推智能算力需求加速释放 大模型和生成式AI快速发展,拉动智能算力需求加速释放。2015-2016年,大模型时代开启,整体训练计算量较之前时期大2-3个数量级。2022年底,ChatGPT横空出世,随后,拥有千亿甚至万亿级参数的各类通用大模型相继发布,其训练迭代极大拉动了对智能算力的需求。根据Jaime Sevilla等人的研究,2016-2022年,大模型训练所需的算力从4e+21增长到8e+23 FLOPS,意味着大模型训练算力每10个月即翻一倍。数据来源:Jaime Sevilla等《Compute Trends Across Three Eras of Machine Learning》,平安证券研究所里程碑级机器学习系统的算力变化趋势训练算力需求(FLOPS)训练算力需求(FLOPS)41.2 训练端算力需求阶段性旺盛,未来推理端需求可能远超训练端 AIGC通常需要训练和推理两个环节,训练是通过数据开发出AI大模型,因此参数量的升级对算力需求影响较大,推理是利用训练好的模型进行计算,推理部署的算力主要在于应用场景的日数据吞吐量。 随着大模型逐渐成熟,推理成本逐渐下降,未来推理端算力需求可能远超训练端。大模型训练很大程度上是阶段性需求,训练数据通常是相对固定的,比如几万亿或几十万亿量级,在发展早期是主要的算力需求端。根据IDC&浪潮信息报告数据,2023年,由于各类大模型层出不穷,当年中国AI服务器工作负载中,训练端算力占比为58.7%。随着大模型逐渐成熟以及推理成本逐渐下降,大模型应用场景将逐渐打开,对推理算力的需求将持续扩大,预计到2027年,推理端算力需求占比将大幅增长到72.6%。长期看,推理算力的需求潜力远超训练端。数据来源:甲子光年公众号,IDC、浪潮信息《2023-2024中国人工智能计算力发展评估报告》,平安证券研究所训练+推理算力需求0%20%40%60%80%100%202220232024202520262027训练推理中国人工智能服务器工作负载预测,2022-202751.3 DeepSeek高性能、低成本大模型有望成为推理场景爆发的契机 2024年12月26日,DeepSeek-V3发布,671B参数,性能与GPT-4o不分伯仲。DeepSeek-V3采用MLA和MoE架构,支持使用FP8混合精度训练,引入了一种无辅助损失的负载平衡策略,并设置了多Token预测训练目标,注重轻量化的同时,性能上与GPT-4o不分伯仲。 2025年1月20日,DeepSeek-R1发布,性能对齐OpenAI-o1正式版。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言处理等任务上性能对标OpenAI-O1。数据来源:DeepSeek公众号,平安证券研究所DeepSeek-V3与其他大模型测评成绩对比DeepSeek-R1与其他大模型测评成绩对比61.3 DeepSeek高性能、低成本大模型有望成为推理场景爆发的契机 DeepSeek设计轻量化,训练成本大幅降低。DeepSeek-V3使用2048块H800 GPU集群训练,训练时长278.8万小时,假设H800 GPU每小时租金2美元,总训练成本仅557.6万美元。 受益于低成本训练

立即下载
信息科技
2025-06-17
平安证券
41页
3.72M
收藏
分享

[平安证券]:电子行业AI系列专题报告(一),算力:算力基建景气度高,国产AI芯片发展势头良好,点击即可下载。报告格式为PDF,大小3.72M,页数41页,欢迎下载。

本报告共41页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共41页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
可比公司对比(截至 2025 年 6 月 6 日)
信息科技
2025-06-17
来源:泰凌微(688591)无线物联网SoC领航者,端侧AI布局赋能连接%2b计算双维成长
查看原文
公司分业务拆分及预测(亿元)
信息科技
2025-06-17
来源:泰凌微(688591)无线物联网SoC领航者,端侧AI布局赋能连接%2b计算双维成长
查看原文
公司端侧 AI 产品
信息科技
2025-06-17
来源:泰凌微(688591)无线物联网SoC领航者,端侧AI布局赋能连接%2b计算双维成长
查看原文
公司 Bluetooth LE 和 IEEE 802.15.4 技术标准细分芯片领域排名
信息科技
2025-06-17
来源:泰凌微(688591)无线物联网SoC领航者,端侧AI布局赋能连接%2b计算双维成长
查看原文
公司 IEEE 802.15.4 技术标准所支持的细分芯片(Zigbee&Thread)领域排名
信息科技
2025-06-17
来源:泰凌微(688591)无线物联网SoC领航者,端侧AI布局赋能连接%2b计算双维成长
查看原文
低功耗蓝牙市场竞争格局
信息科技
2025-06-17
来源:泰凌微(688591)无线物联网SoC领航者,端侧AI布局赋能连接%2b计算双维成长
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起