计算机行业周报:Grok 4发布,模型底座能力更近一步
请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 行业研究 太平洋证券股份有限公司证券研究报告 2025 年 07 月 13 日 行业周报 看好 / 维持 计算机 计算机 计算机行业周报(20250707-20250713): Grok 4 发布,模型底座能力更近一步 ◼ 走势比较 ◼ 推荐公司及评级 相关研究报告 << 计 算 机 行 业 周 报 ( 2025030-20250704): 国产 GPU 企业申请上市,关注国产算力进展>>--2025-07-07 << 计 算 机 行 业 周 报 ( 20250616-20250622): 华为 HDC 2025 召开,鸿蒙、AI、机器人亮点突出>>--2025-06-23 << 计 算 机 行 业 周 报 ( 20250609-20250615):豆包、OpenAI 模型更新,成本大幅下降>>--2025-06-16 证券分析师:曹佩 电话: E-MAIL:caopeisz@tpyzq.com 分析师登记编号:S1190520080001 证券分析师:王景宜 电话: E-MAIL:wangjy@tpyzq.com 分析师登记编号:S1190523090002 报告摘要 行情回顾:本周(2025.7.7-2025.7.11)申万计算机行业指数上涨3.22%,在 31 个申万一级行业中排名第 6 位。截至本周五(7 月 11 日),计算机行业指数与较年初上涨 9.75%,跑赢沪深 300 指数 7.72pct。 7 月 10 日,xAI 发布新一代大模型 Grok 4 系列。Grok 4 系列包括Grok 4 和 Grok 4 Heavy 两个版本,Grok 4 为单智能体模型,Grok 4 Heavy 为多智能体的升级版,可支持 4 个 agent 同时工作。Grok 4 系列推理能力大幅提升,在多个基准测试中刷新行业 SOTA。 Grok 4 系列在各项专业学科基准测试中表现大幅领先,在知识能力上已经超越研究生水平。在 HLE(Humanities Last Exam,由各学科专家编写的高难度学术测试集)测试中,在使用工具的情况下,Grok 4 的成绩为 38.6%,Grok 4 Heavy 的成绩为 44.4%,大幅超越 o3 和 Gemini 2.5 Pro。如果在推理阶段增加算力投入并使用工具,则分数进一步提升至 50.7%。在 AIME25、GPQA、HMMT25 等其他权威基准测试方面, Grok 4 Heavy均超越其他此前最先进的模型夺冠。 Grok 展现出较强的解决复杂现实任务的能力。在衡量复杂任务解决能力的商业环境测试 Vending-Bench 中,Grok-4 模拟经营取得的利润是第二名 Claude Opus 4 的两倍。在游戏领域,Grok-4 可以设计和构建视频游戏,包括资源获取、写代码等,研究人员用 4 个小时制作出一款第一人称射击游戏。此外,Grok 4 在生物医药、金融等领域也取得较大突破。 Grok 4 性能的大幅提升主要来源于算力投入的大幅增长,以及在训练阶段引入工具使用。Grok-4 在 xAI 建设的 20 万卡集群 Colossus 上运行强化学习训练,其训练量是 Grok-2 的 100 倍、Grok-3 的 10 倍。Grok 4 Heavy 通过提高强化学习阶段的算力投入以提升模型效果。Grok 4 特别强调了在后训练过程中原生融入工具,比如在“人类最后考试 HLE”上,在后训练中融入工具,不仅比不使用工具能取得更高分数,而且 Scaling提升效率也更高。即增加同样的计算资源,工具融入训练能带来更高智能。 投资建议:xAI 新发布的模型进一步加强了基座模型能力,有望加速AI 应用落地。重点推荐金山办公、用友网络、赛意信息、熵基科技、云从科技等,AI 应用的发展也会促进基础设施的发展,重点推荐海光信息、智微智能、联想集团等。 风险提示: AI 技术发展不及预期,市场竞争加剧。 (10%)10%30%50%70%90%24/7/1524/9/2524/12/625/2/1625/4/2925/7/10计算机沪深300 请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 行业周报 P2 计算机行业周报(20250707-20250713):Grok 4 发布,模型底座能力更近一步 目录 一、 Grok 4 模型发布,推理能力大幅提升 .............................................. 4 二、 行情回顾 ...................................................................... 8 三、 投资建议 ...................................................................... 9 四、 风险提示 ...................................................................... 9 请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 行业周报 P3 计算机行业周报(20250707-20250713):Grok 4 发布,模型底座能力更近一步 图表目录 图表 1: Grok 4 和 Grok 4 Heavy 在 HLE 测试中的表现 ...................................... 4 图表 2: Grok 4 系列在多项基准测试中取得 SOTA .......................................... 5 图表 3: Grok 在 Vending-Bench 测试中大幅领先于其他模型 ................................. 5 图表 4: Grok 性能随着计算量提升得到指数级增长 ......................................... 6 图表 5: 在后训练阶段引入工具使模型性能提升 ........................................... 7 图表 6: 目前主流模型 API 输入/输出价格 ................................................ 7 图表 7: xAI 模型发布计划 ............................................................. 8 图表 8: 申万一级行业周涨幅(7.7-7.11) ............................................... 8 图表 9: 申万计算机指数和沪深 300 指数年初至今涨跌幅(截至 7.11) ....................... 8 图表 10: 本周计算机行业涨跌幅前五 ......................
[太平洋]:计算机行业周报:Grok 4发布,模型底座能力更近一步,点击即可下载。报告格式为PDF,大小0.55M,页数11页,欢迎下载。
