计算机行业Grok-3:RL成为共识,持续看好预训练算力需求

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 科技 Grok-3:RL 成为共识,持续看好预训练算力需求 华泰研究 计算机 增持 (维持) 计算机应用 增持 (维持) 研究员 谢春生 SAC No. S0570519080006 SFC No. BQZ938 xiechunsheng@htsc.com +(86) 21 2987 2036 行业走势图 资料来源:Wind,华泰研究 2025 年 2 月 19 日│中国内地 动态点评 2025 年 2 月 18 日,xAI 发布了基于全球最大算力集群(约 20 万块 GPU)训练的新一代大模型:1)预训练模型:Grok-3 与 Grok-3 mini,在 Math、Science 、 Coding 测 评 集 上 超 过 了 Gemini-2 Pro 、 GPT-4o 以 及DeepSeek-V3;2)推理模型:Grok-3 的 Reasoning 版本在性能上超越了OpenAI o3 mini (high)。Grok-3 系列将首先面向 X 平台的 Premium Plus 订阅用户开放,包括聊天功能、DeepSearch 与高级推理模式。我们认为,一方面 Grok-3 训练集群已达到 20 万卡级别,证明预训练在算力提升下仍能突破;另一方面,xAI 将采用“延迟开源”策略,即在 Grok-3 打磨完善后,开源 Grok-2,实现了商业化和开源的平衡,开源社区有望被持续赋能。 继续看好大模型预训练算力需求 xAI 指出,Big intelligence requires big compute,Grok-3 相比 Grok-2 提升了 10x 的训练算力。2024 年 9 月 3 日,马斯克宣布 xAI 的 10 万卡 H100 集群上线,本次发布会再次表示 xAI 的训练集群 GPU 数已扩大到了 20 万。我们认为,虽然目前在预训练数据上存在瓶颈,但是合成数据、RL 数据、工程能力优化,甚至 Transformer 架构迭代,或能逐步打破瓶颈,Grok-3 已经证明预训练依然有突破空间,持续看好全球头部大模型预训练算力需求。 在预训练基座模型上进行大规模 RL 将是 25 年主线 OpenAI 于 2024 年 9 月推出 o1 系列模型,并且首次公开提出将 RL 运用在大模型的后训练中,实现大模型以思维链(CoT)方式推理。DeepSeek-R1独立摸索出了在预训练模型 V3 基础上,直接使用 GRPO 算法来进行大规模的强化学习并获得成功。Google Gemini 2.0 也发布了 Flash Thinking 的推理模型,Anthropic 也宣布即将发布能手动控制成本的推理模型。RL 已经成为全球模型厂商共识的技术迭代路径。本次 Grok-3 发布,同样更新了Reasoning 模型,运用 RL+CoT 的方式实现 Test-Time Compute,并且基于更好的 Grok-3 基座模型,超过了 o3-mini 的推理性能。我们认为,RL 将成为 2025 年模型迭代的主线,迭代方法或是继续加大 RL 的步数(steps)或改进 RL 框架,以更好的训练模型 CoT 作答能力。 DeepSearch 成为 Agent 集中落地的方向,更多 Agents 有望问世 整合信息进行输出的 Agent 正成为集中落地方向。OpenAI 于 2 月 3 日发布Deep Research 功能,这是一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体。同样,xAI 本次发布会发布基于 Grok-3 的第一代 Agent 产品 DeepSearch,能深入思考用户意图,浏览多个网站内容,在输出最终答案前会验证不同来源,确保答案正确。它不仅能帮助工程师、研究人员和科学家进行编码,还能帮助所有人回答日常问题,帮助用户理解世界。同时马斯克表示,当下一个版本模型完全发布时将开源上一个版本。我们认为,全球大模型厂商的开源化趋势将进一步带动应用层的蓬勃发展,基于更强大模型的 Agents 有望快速问世。 语音交互即将上线,RL+多模态能力值得期待 多模态方面,Grok 语音助手也将尽快推出,这将是一个能理解用户话语并直接生成音频的单一模型,也将融入 RL 的能力。目前,xAI 团队正在开发对话记忆功能,未来用户可以选择拥有一个或多个 Grok,实现个性化交互。我们认为,结合 RL 能力后模型的多模态能力也有望得到加强,建议持续关注多模态产品进展情况。 风险提示:AI 技术迭代不及预期;AI 商业化不及预期;本报告基于客观信息整理,不构成投资建议。 (20)0204060Feb-24Jun-24Oct-24Feb-25(%)计算机计算机应用沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 科技 图表1: xAI 重要时间节点 资料来源:xAI 官网、华泰研究 图表2: GPT 系列与 Grok 系列模型得分迭代情况对比 资料来源:Grok-3 发布会直播、华泰研究 图表3: GPT 系列与 Grok 系列模型训练算力迭代情况对比 资料来源:Grok-3 发布会直播、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 3 科技 图表4: xAI 打造了全球规模最大的训练算力集群(20 万块 GPU) 资料来源:Grok-3 发布会直播、华泰研究 图表5: Grok-3 在 Arena 榜单中排名第一 资料来源:Arena、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 4 科技 图表6: Grok-3 系列模型基准测评结果(在 Math、Science、Coding 测评集上超过了 Gemini-2 Pro、GPT-4o以及 DeepSeek-V3) 资料来源:Grok-3 发布会直播、华泰研究 图表7: Grok-3 系列模型 Reasoning 测评结果 注:浅色代表更多推理时间带来的提升 资料来源:Grok-3 发布会直播、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 5 科技 图表8: Grok-3 在 AIME 2025 上的推理表现 注:浅色代表更多推理时间带来的提升 资料来源:Grok-3 发布会直播、华泰研究 图表9: Grok-3 模型界面支持深度思考、DeepSearch、大脑模式等功能 资料来源:Grok-3 发布会直播、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 6 科技 图表10: 发布会展示 Grok-3 模型创建游戏的用例(1) 资料来源:Grok-3 发布会直播、华泰研究 图表11: 发布会展示

立即下载
电子设备
2025-02-19
华泰证券
10页
1.99M
收藏
分享

[华泰证券]:计算机行业Grok-3:RL成为共识,持续看好预训练算力需求,点击即可下载。报告格式为PDF,大小1.99M,页数10页,欢迎下载。

本报告共10页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共10页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
重点公司盈利预测、估值与评级
电子设备
2025-02-19
来源:计算机行业深度报告:DeepSeek系列报告之AI+医疗
查看原文
久远银海盈利预测与财务指标
电子设备
2025-02-19
来源:计算机行业深度报告:DeepSeek系列报告之AI+医疗
查看原文
银海“见智“人工智能解决方案
电子设备
2025-02-19
来源:计算机行业深度报告:DeepSeek系列报告之AI+医疗
查看原文
银海“见智“人工智能行业应用平台
电子设备
2025-02-19
来源:计算机行业深度报告:DeepSeek系列报告之AI+医疗
查看原文
医保便民服务 图44:智慧医院
电子设备
2025-02-19
来源:计算机行业深度报告:DeepSeek系列报告之AI+医疗
查看原文
核心能力
电子设备
2025-02-19
来源:计算机行业深度报告:DeepSeek系列报告之AI+医疗
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起