电子行业动态点评:DeepSeek是否会改变AI投资范式?

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 电子 DeepSeek 是否会改变 AI 投资范式? 华泰研究 电子 增持 (维持) 研究员 黄乐平,PhD SAC No. S0570521050001 SFC No. AUZ066 huangleping@htsc.com +(852) 3658 6000 研究员 陈旭东 SAC No. S0570521070004 SFC No. BPH392 chenxudong@htsc.com +(86) 21 2897 2228 联系人 于可熠 SAC No. S0570122120079 SFC No. BVF938 yukeyi@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2025 年 1 月 27 日│中国内地 动态点评 事件:DeepSeek 发布 R1,引发资本市场对算力增长展望的担忧 1/20,DeepSeek 发布 R1 模型及相关应用,以较低的训练成本达到与现有前沿模型相当的效果,引发市场对算力投资的担忧。我们认为:1)DeepSeek主要创新是通过在预训练阶段加入强化学习,DeepSeek V3 训练成本相当于 Llama3 系列的 7%,对当前世代 AI 大模型的降本做出了重要贡献,有望降低现有模型的训练和推理成本;2)目前北美四大 AI 公司主要通过扩大GPU 集群规模的方式探索下一代大模型,DeepSeek 的方式是否在下一代模型研发中有效还有待观察。3)DeepSeek 这次的成功显示,在 Scaling Law放缓的大背景下,中美在大模型技术上的差距有望缩小。 思考#1:DeepSeek R1 对当前世代大模型降本做出重要贡献 据 DeepSeek V3 技术报告,V3 模型的训练总计只需要 278.8 万 GPU 小时,相当于在 2048 卡的 H800GPU 集群上训练约 2 个月,合计成本约 557.6 百万美金,相较而言,Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU 小时,DeepSeek 训练成本约相当于 Llama 3 系列模型的 7%。我们认为:1)DeepSeek R1 通过在预训练阶段使用强化学习,在仅有极少标注数据的情况下,提升了模型推理能力,能够大幅降低训练成本,实现和现有大模型(如 o1)相当的效果。如果 Meta 等采用 DeepSeek 的路径,或降低现有模型的训练成本。 思考#2:DeepSeek 的方法在探索下一代大模型上是否有效尚不可知 根据 Factset 一致预期,2024 年,微软、谷歌、亚马逊、Meta、苹果等北美五大科技公司合计资本开支 2253 亿美元,2025 年有望继续增长 19.6%。其中很大部分投入是用在包括 GPT-5、Llama4 等在内下一代模型的算力投资。目前北美四大 AI 公司主要通过扩大 GPU 集群规模的方式探索下一代大模型。如 1/21 宣布的 The Stargate Project 所显示,下一代大模型所需的算力可能达到百万卡集群的规模。DeepSeek 的方式是否在下一代模型研发中有效还有待观察。 思考#3:Scaling Law 放缓大背景下,中美技术差距有望缩小 2022 年 11 月,OpenAI 发布 GPT3.5 以来,中美在大模型技术上的差距出现扩大趋势。进入 2024 年下半年,随着互联网文本数据的耗尽,预训练阶段的 Scaling law 面临挑战,最先进大模型的发展出现放缓趋势。过去两年,中国涌现了包括智谱、月之暗面、Minimax 等初创企业。这次 DeepSeek R1受到广泛关注,显示随着最先进模型发展放缓,大模型的竞争从探索转向工程创新,中美技术差距有望缩小。 风险提示:中美贸易摩擦升级风险,宏观下行风险,创新品渗透不及预期风险。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。 (11)6233956Jan-24May-24Sep-24Jan-25(%)电子沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 电子 图表1: DeepSeek 和其他模型性能比较 资料来源:DeepSeek,华泰研究 图表2: 国内外主流 AI 大模型对比 地区 公司 模型 参数量 模态(输入;输出) 开源/闭源 发布时间 美国 OpenAI GPT-o1 300B 文本,图像;文本,图像 闭源 2024 年 12 月 美国 OpenAI GPT-4o 未公开 文本,图像,音频,视频(帧);文本,图像,音频 闭源 2024 年 5 月 美国 OpenAI GPT-4 turbo 未公开 文本,图像;文本,图像 闭源 2023 年 11 月 美国 OpenAI Sora 未公开 文本,图像;图像,视频 闭源 2024 年 2 月 美国 谷歌 Gemini 1.5 未公开 文本,图像,音频,视频(帧);文本,图像 闭源 2024 年 2 月 美国 谷歌 Gemini 未公开 文本,图像,视频;文本,图像 闭源 2023 年 12 月 美国 Anthropic Claude 3 未公开 文本,图像;文本 闭源 2024 年 3 月 中国 百度 ERNIE 4.0 未公开 文本,图像;文本,图像,视频 闭源 2023 年 10 月 中国 商汤 日日新 5.0 600B(MoE) 文本,图像;文本,图像,视频 闭源 2024 年 4 月 中国 智谱 AI GLM-4 未公开 文本,图像;文本,图像 闭源 2024 年 1 月 美国 Meta Llama 3 70B 文本;文本 开源 2024 年 4 月 美国 微软 Phi-3 3.8B 文本;文本 开源 2024 年 4 月 中国 阿里巴巴 Qwen 1.5 72B 文本;文本 开源 2024 年 2 月 中国 零一万物 Yi-VL 34B 文本;文本 开源 2024 年 1 月 美国 xAI Grok-1 314B(MoE) 文本;文本 开源 2023 年 11 月 中国 深度求索 DeepSeek-R1 671B 文本;文本 开源 2025 年 1 月 资料来源:Stanford ecosystem graphs,公司官网,华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 3 电子 图表3: MAAMG 季度资本开支 注:预测数据来自 Factset 一致预期 资料来源:Factset,华泰研究 图表4: 科技巨头目前主要模型的布局 注:MMLU(Multilingual Massively Multilingual Understanding,大规模多任务语言理解)是一个包含 57 个多选问答任务的英文评测数据集,涵盖了初等数学、美国历史、计算机科学、法律等领域

立即下载
信息科技
2025-01-31
华泰证券
6页
1.03M
收藏
分享

[华泰证券]:电子行业动态点评:DeepSeek是否会改变AI投资范式?,点击即可下载。报告格式为PDF,大小1.03M,页数6页,欢迎下载。

本报告共6页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共6页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
重点推荐公司一览表
信息科技
2025-01-31
来源:通信行业周报(第四周):Stargate启动,关注算力链投资机遇
查看原文
云计算相关基础设施设备板块总市值与市盈率变化 图表9: 物联网&车联网板块总市值与市盈率变化
信息科技
2025-01-31
来源:通信行业周报(第四周):Stargate启动,关注算力链投资机遇
查看原文
无线上游板块总市值与市盈率变化 图表7: 光模块&光器件板块总市值与市盈率变化
信息科技
2025-01-31
来源:通信行业周报(第四周):Stargate启动,关注算力链投资机遇
查看原文
运营商板块总市值与市盈率变化 图表5: 移动通信设备板块总市值与市盈率变化
信息科技
2025-01-31
来源:通信行业周报(第四周):Stargate启动,关注算力链投资机遇
查看原文
23 年初至今行业走势 图表3: 上周内通信(申万)指数走势
信息科技
2025-01-31
来源:通信行业周报(第四周):Stargate启动,关注算力链投资机遇
查看原文
上周行情回顾
信息科技
2025-01-31
来源:通信行业周报(第四周):Stargate启动,关注算力链投资机遇
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起