计算机行业策略报告-国产AI:崛起与重估-华西证券

计算机策略报告华西计算机团队刘泽晶SAC NO: S1120520020002赵宇阳SAC NO: S1120523070006孟令儒奇 SAC NO: S11205240600012025年03月08日国产AI:崛起与重估请仔细阅读在本报告尾部的重要法律声明证券研究报告核心观点 DeepSeek激活国产AI产业链一、Deepseek拉通模型开源之路二、低成本高效果、刺激下游应用需求爆发 中国科技股估值进入重估时刻一、打破国外闭源模型垄断,AI格局有望重新洗牌二、国内巨头竞赛AI Capex,景气度拉爆 AI+应用全面普及一、AI Agent有望全面崛起二、AI终端25年将迎来井喷式增长 受益标的: AI Agent应用:金山办公、用友网络、金桥信息、润达医疗、合合信息、开普云、新致软件、润和软件、微盟集团、彩讯股份、汉得信息、拓尔思、同花顺、鼎捷数智、亚信安全、万兴科技、宇信科技、京北方、高伟达等; AI终端:乐鑫科技、恒玄科技、润欣科技、中科蓝讯、翱捷科技、云天励飞 国产算力:中芯国际、海光信息、寒武纪、中科曙光、长光华芯,弘信电子、神州数码 算力云&一体机:首都在线、优刻得、深信服、云从科技、深桑达、云赛智联、太极股份、亚信科技、网宿科技 机器人产业链:祥鑫科技、秦安股份、奥比中光、麦迪科技、能科科技、虹软科技、上海机电风险提示:市场竞争加剧;产品研发不及预期目录01Deepseek激活国产AI全产业链02中国科技股估值进入重估时刻03AI+应用全面崛起04投资建议与风险提示01 Deepseek激活国产AI全产业链1.1各大平台接入满血DeepSeek•各大平台接入DeepSeek-R1:随着DeepSeek R1 模型的强大推理能力和开源特性,众多国内外平台纷纷接入DeepSeek R1 671B 满血版。不仅仅各个大厂都宣布接入了DeepSeek满血版本,社交国民软件微信也在搜一搜里植入了DeepSeek大模型。DeepSeek生态加速进行时!DeepSeek接入应用资料来源:萝卜AI笔记公众号,华西证券研究所41.2从规模效应到性价比,DeepSeek打开天花板•DeepSeek-R1:首个开源、媲美OpenAI o1的推理大模型。DeepSeek-R1展现出了与OpenAI o1相当甚至在某些方面更优的性能。在MATH基准测试上,R1达到了77.5%的准确率,与o1的77.3%相近;在更具挑战性的AIME 2024上,R1的准确率达到71.3%,超过了o1的71.0%。在代码领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。•从规模效应到性价比,DeepSeek打开天花板:R1模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的o1模型正式版,该模型同时延续了该公司高性价比的优势。据中国青年报,深度求索公司R1模型训练成本仅为560万美元,远远低于美国开放人工智能研究中心、谷歌、“元”公司等美国科技巨头在人工智能技术上投入的数亿美元乃至数十亿美元。根据新智元援引外媒报道,他们在短短两个月时间,在2048个H800 GPU集群上,训出6710亿参数的MoE语言模型,比顶尖AI效率高出10倍。主流大模型能力比拼AI集群卡耗电量示意图资料来源:CSDN,海外独角兽公众号,华西证券研究所5•DeepSeek-R1官方回应成本:如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为$562,027,成本利润率 545%。但实际上没有这么多收入,因为 V3 的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。另外,每个 H800 节点实现了 73.7k/14.8k 个每秒输入 / 输出 token;(理论)成本利润率高达545%。•DeepSeek 采用了跨节点专家并行(EP,Expert Parallelism)策略:EP的系统复杂性体现在:EP 引入了跨节点通信。为了优化吞吐量,必须设计适当的计算工作流,shi 通信与计算重叠。EP 涉及多个节点,因此本质上需要数据并行(DP),并且需要在不同的 DP 实例之间进行负载平衡。•DeepSeek-V3/R1 推理服务均在 H800 GPU 上运行:具体而言,矩阵乘法和分发传输采用与训练一致的 FP8 格式,而核心 MLA 计算和组合传输使用 BF16 格式,确保最佳服务性能。 V3 和 R1 推理业务的合并峰值节点占用达到 278,平均占用 226.75 个节点(每个节点包含 8 个 H800 GPU)。假设租赁一个 H800 GPU 的成本为每小时 2 美元,每日总成本为 87,072 美元(约合人民币 63.4 万)。DeepSeek在线推理系统H800推理服务节点数量资料来源:机器之心,华西证券研究所61.3 国产算力异军突起,充分受益国产模型deepseek崛起•据华为云2月1日消息,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeek R1/V3推理服务。据华为云消息,该服务具备以下特点:1)得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。2)提供稳定的、生产级服务能力,让模型能够在大规模生产环境中稳定运行,并满足业务商用部署需求。华为云昇腾云服务可以提供澎湃、弹性、充足的算力。•国产算力厂商纷纷拥抱DeepSeek:根据光合组织消息,近日,海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU(深度计算单元)的国产化适配,并正式上线。根据彭博消息,据苏州发布,苏州数智科技集团近日在苏州市公共算力服务平台上架了基于英伟达算力部署的DeepSeek-R1模型和基于华为昇腾算力部署的DeepSeek-V3模型。同时,提供基于DeepSeek模型的一体机,针对有本地化部署需求的用户提供开箱即用的软硬件一体服务。无锡太湖亿芯智算中心正式投入运营,目前已上线基于燧原科技算力的DeepSeek全系列开源模型推理服务。2月9日,由无锡数据集团建设运营的无锡“算力超市”(无锡算力公共服务平台)也正式上线DeepSeek大模型,实现了本地化部署和调用。硅基流动和华为云首发并上线基于华为云昇腾云服务的DeepSeek R1/V3推理服务海光信息完成DeepSeek的适配资料来源:腾讯网,智东西,华西证券研究所7•我们判断昇腾910C在国产化推理时代更具性价比:根据快科技,华为昇腾910C在AI推理中的表现出乎意料地好,已经达到NVIDIA H100芯片的60%左右。更进一步地, 通过手写CUNN内核和优化,昇腾910C的性能还可以进一步提升。据称, DeepSeek从第一天起就支持华为昇腾芯片 ,并且自主维护PyTorch仓库,只需一行代码就能将CUDA转换为CUNN,性能优化的潜力也相当巨大,通过定制优化可达到更高性能。•华为已经发布Atlas全新集

立即下载
电子设备
2025-03-17
47页
2.8M
收藏
分享

计算机行业策略报告-国产AI:崛起与重估-华西证券,点击即可下载。报告格式为PDF,大小2.8M,页数47页,欢迎下载。

本报告共47页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共47页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
日发精机发展历程
电子设备
2025-03-17
来源:2025年机器人行业系列报告之四-丝杠产业链:不仅受益自主可控,更受益人形机器人市场爆发
查看原文
PCBN 刀具
电子设备
2025-03-17
来源:2025年机器人行业系列报告之四-丝杠产业链:不仅受益自主可控,更受益人形机器人市场爆发
查看原文
国机精工发展历程
电子设备
2025-03-17
来源:2025年机器人行业系列报告之四-丝杠产业链:不仅受益自主可控,更受益人形机器人市场爆发
查看原文
华辰装备与贝斯特签约达成战略合作伙伴
电子设备
2025-03-17
来源:2025年机器人行业系列报告之四-丝杠产业链:不仅受益自主可控,更受益人形机器人市场爆发
查看原文
2023 年华辰装备收入构成 图表121: 2023 年华辰装备毛利构成
电子设备
2025-03-17
来源:2025年机器人行业系列报告之四-丝杠产业链:不仅受益自主可控,更受益人形机器人市场爆发
查看原文
秦川机床募投项目中重线性执行器项目投资概算
电子设备
2025-03-17
来源:2025年机器人行业系列报告之四-丝杠产业链:不仅受益自主可控,更受益人形机器人市场爆发
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起