电子行业动态点评：DeepSeek是否会改变AI投资范式？

免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。 1 证券研究报告电子 DeepSeek 是否会改变 AI 投资范式? 华泰研究电子增持 (维持) 研究员黄乐平，PhD SAC No. S0570521050001 SFC No. AUZ066 huangleping@htsc.com +(852) 3658 6000 研究员陈旭东 SAC No. S0570521070004 SFC No. BPH392 chenxudong@htsc.com +(86) 21 2897 2228 联系人于可熠 SAC No. S0570122120079 SFC No. BVF938 yukeyi@htsc.com +(86) 21 2897 2228 行业走势图资料来源：Wind，华泰研究 2025 年 1 月 27 日│中国内地动态点评事件：DeepSeek 发布 R1，引发资本市场对算力增长展望的担忧 1/20，DeepSeek 发布 R1 模型及相关应用，以较低的训练成本达到与现有前沿模型相当的效果，引发市场对算力投资的担忧。我们认为：1）DeepSeek主要创新是通过在预训练阶段加入强化学习，DeepSeek V3 训练成本相当于 Llama3 系列的 7%，对当前世代 AI 大模型的降本做出了重要贡献，有望降低现有模型的训练和推理成本；2）目前北美四大 AI 公司主要通过扩大GPU 集群规模的方式探索下一代大模型，DeepSeek 的方式是否在下一代模型研发中有效还有待观察。3）DeepSeek 这次的成功显示，在 Scaling Law放缓的大背景下，中美在大模型技术上的差距有望缩小。思考#1：DeepSeek R1 对当前世代大模型降本做出重要贡献据 DeepSeek V3 技术报告，V3 模型的训练总计只需要 278.8 万 GPU 小时，相当于在 2048 卡的 H800GPU 集群上训练约 2 个月，合计成本约 557.6 百万美金，相较而言，Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU 小时，DeepSeek 训练成本约相当于 Llama 3 系列模型的 7%。我们认为：1）DeepSeek R1 通过在预训练阶段使用强化学习，在仅有极少标注数据的情况下，提升了模型推理能力，能够大幅降低训练成本，实现和现有大模型(如 o1)相当的效果。如果 Meta 等采用 DeepSeek 的路径，或降低现有模型的训练成本。思考#2：DeepSeek 的方法在探索下一代大模型上是否有效尚不可知根据 Factset 一致预期，2024 年，微软、谷歌、亚马逊、Meta、苹果等北美五大科技公司合计资本开支 2253 亿美元，2025 年有望继续增长 19.6%。其中很大部分投入是用在包括 GPT-5、Llama4 等在内下一代模型的算力投资。目前北美四大 AI 公司主要通过扩大 GPU 集群规模的方式探索下一代大模型。如 1/21 宣布的 The Stargate Project 所显示，下一代大模型所需的算力可能达到百万卡集群的规模。DeepSeek 的方式是否在下一代模型研发中有效还有待观察。思考#3：Scaling Law 放缓大背景下，中美技术差距有望缩小 2022 年 11 月，OpenAI 发布 GPT3.5 以来，中美在大模型技术上的差距出现扩大趋势。进入 2024 年下半年，随着互联网文本数据的耗尽，预训练阶段的 Scaling law 面临挑战，最先进大模型的发展出现放缓趋势。过去两年，中国涌现了包括智谱、月之暗面、Minimax 等初创企业。这次 DeepSeek R1受到广泛关注，显示随着最先进模型发展放缓，大模型的竞争从探索转向工程创新，中美技术差距有望缩小。风险提示：中美贸易摩擦升级风险，宏观下行风险，创新品渗透不及预期风险。本研报中涉及到未上市公司或未覆盖个股内容，均系对其客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖。 (11)6233956Jan-24May-24Sep-24Jan-25(%)电子沪深300 免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。 2 电子图表1： DeepSeek 和其他模型性能比较资料来源：DeepSeek，华泰研究图表2：国内外主流 AI 大模型对比地区公司模型参数量模态（输入；输出）开源/闭源发布时间美国 OpenAI GPT-o1 300B 文本，图像；文本，图像闭源 2024 年 12 月美国 OpenAI GPT-4o 未公开文本，图像，音频，视频（帧）；文本，图像，音频闭源 2024 年 5 月美国 OpenAI GPT-4 turbo 未公开文本，图像；文本，图像闭源 2023 年 11 月美国 OpenAI Sora 未公开文本，图像；图像，视频闭源 2024 年 2 月美国谷歌 Gemini 1.5 未公开文本，图像，音频，视频（帧）；文本，图像闭源 2024 年 2 月美国谷歌 Gemini 未公开文本，图像，视频；文本，图像闭源 2023 年 12 月美国 Anthropic Claude 3 未公开文本，图像；文本闭源 2024 年 3 月中国百度 ERNIE 4.0 未公开文本，图像；文本，图像，视频闭源 2023 年 10 月中国商汤日日新 5.0 600B（MoE）文本，图像；文本，图像，视频闭源 2024 年 4 月中国智谱 AI GLM-4 未公开文本，图像；文本，图像闭源 2024 年 1 月美国 Meta Llama 3 70B 文本；文本开源 2024 年 4 月美国微软 Phi-3 3.8B 文本；文本开源 2024 年 4 月中国阿里巴巴 Qwen 1.5 72B 文本；文本开源 2024 年 2 月中国零一万物 Yi-VL 34B 文本；文本开源 2024 年 1 月美国 xAI Grok-1 314B（MoE）文本；文本开源 2023 年 11 月中国深度求索 DeepSeek-R1 671B 文本；文本开源 2025 年 1 月资料来源：Stanford ecosystem graphs，公司官网，华泰研究免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。 3 电子图表3： MAAMG 季度资本开支注：预测数据来自 Factset 一致预期资料来源：Factset，华泰研究图表4：科技巨头目前主要模型的布局注：MMLU（Multilingual Massively Multilingual Understanding，大规模多任务语言理解）是一个包含 57 个多选问答任务的英文评测数据集，涵盖了初等数学、美国历史、计算机科学、法律等领域

立即下载

信息科技

2025-01-31

华泰证券

6页

1.03M

[华泰证券]:电子行业动态点评：DeepSeek是否会改变AI投资范式？，点击即可下载。报告格式为PDF，大小1.03M，页数6页，欢迎下载。

本报告共6页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共6页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

电子行业动态点评：DeepSeek是否会改变AI投资范式？

关于我们

联系我们

电子行业动态点评：DeepSeek是否会改变AI投资范式？

关于我们

联系我们

小程序

公众号