软件与服务行业AI产业跟踪:马斯克发布Grok-4,大模型持续突破获得新发展

请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业跟踪:马斯克发布 Grok-4,大模型持续突破获得新发展 报告要点 [Table_Summary]7 月 10 日,xAI 发布 Grok-4,包括 Grok 4(单智能体版本)和 Grok 4 Heavy(更强大的多智能体版本)。定价为$30/月(SuperGrok)、$300/月(SuperGrok Heavy),当前可通过 xAI API、X 平台使用,支持 256k token 上下文窗口。Grok 4 的多代理协作、工具深度集成与跨学科能力已颠覆传统测试上限,未来核心挑战将从“通过人类考试”转向“通过物理验证发明新技术”。 分析师及联系人 [Table_Author] 宗建树 SAC:S0490520030004 SFC:BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业跟踪:马斯克发布 Grok-4,大模型持续突破获得新发展 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 7 月 10 日,xAI 发布 Grok-4,包括 Grok 4(单智能体版本)和 Grok 4 Heavy(更强大的多智能体版本)。定价为$30/月(SuperGrok)、$300/月(SuperGrok Heavy),当前可通过 xAI API、X 平台使用,支持 256k token 上下文窗口。 事件评论 ⚫ 多项基准测试实现超越,学术基准测试表现顶尖。HLE(Humanities Last Exam)考试表现亮眼,Grok4(no tools/Heavy)得分 25.4%/44.4%,均打破 Gemini 2.5pro 纪录,此外,Grok4 在学术领域展现出强大统治力。Grok4(no tool/heavy)在 GPQA(博士级 QA基准)中得分别为 87.5%/88.9%,超过第二名 Gemini 2.5pro(86.4%);AIME25 获得满分,领先 o3(98.8%);哈佛-麻省理工数学竞赛(HMMT)中得分最高达 96.7%,远超Gemini 2.5 pro(82.5%)、USAMO(美国数学奥林匹克)最高得分 61.9%,超 Gemini DeepThink(49.4%)。Vending Bench 中 Grok-4 同样夺魁,净值为 Claude Opus 4 两倍。 ⚫ 训练突破,更强大的 Agent 能力。(1)训练规模实现跃迁,构建全球顶级超算集群(10 万张 H100 GPU)支持训练。Grok 2 到 Grok 4 的训练量提升 100 倍,在强化学习(RL)阶段投入的算力是市面上其他任何模型的 10 倍以上。通过数据筛选和算法优化实现预训练效率突破强化学习(RL)投入显著增加,推动模型推理能力质变;(2)多代理协作架构:Grok 4 Heavy 采用多代理并行计算,通过“学习小组”模式协作解题,推理时算力提升约 10 倍,解决单代理无法攻克的复杂问题(如 HLE 考试中 50%文本类题目);(3)工具整合创新。工具使用能力内化至训练过程(如 CUDA、原生工具调用),实现超越 Grok 3 的泛化式工具调用,计划接入企业级工具(有限元分析、CFD 等),解决真实复杂场景问题的能力进一步提升。 ⚫ 产品化进展来看,语音模式迎来重大改进。从功能演示来看,产品化落地速度加快,AI 应用层有望加速放量:(1)信息整合:对 X 平台信息深度整合、资料分析、舆情时间线生成等能力深化;(2)语音模式升级,延迟降低 50%,新增电影预告片级配音、支持即兴创作、自然对话流测试,语音功能活跃用户 8 周内增长 10 倍。(3)SuperGrok Heavy(300 美元/月)开放:用户可调度多代理研究助手,开发者可借助 API 快速构建自动化商业逻辑(如库存管理、供应商谈判),我们认为,Grok4 的突破有望加速 AI 应用层商业化落地。 ⚫ 2025 年内模型能力预计持续补强,持续关注 AI 产业变革。马斯克公布 xAI 近期计划,预计 8 月发布 Coding 模型, 9 月发布多模态智能体,10 月预计发布视频生成模型,当前Grok 4 基于第 6 代基础模型,第 7 代将重点优化视觉能力,即将支持企业级物理仿真工具链。当前 Agent 投资核心逻辑强化,持续看好 Agent 商业化元年及投资机遇。建议关注:1)AI Agent 相关厂商;2)云服务厂商方面,Agent 应用有望落地,关注推理需求带来的推动;3)IDC,重点关注与腾讯、阿里、字节等大厂合作的 IDC。 风险提示 1、AI 技术发展不及预期; 2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《坚定看好新一轮金融创新周期开启 2025 年第27 周计算机行业周报》2025-07-08 •《合同示范文本印发,数据流通交易有望提速》2025-07-07 •《央行发布 CIPS 新规,关注跨境支付投资机遇》2025-07-06 -8%25%59%92%2024/72024/112025/32025/7软件与服务软件与服务沪深300指数2025-07-17%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 5 行业研究 | 点评报告 风险提示 1、AI 技术发展不及预期,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,投入厂商仍然存在失败风险。 2、下游应用需求不及预期,人工智能本质是通过供给创新催生需求扩容,目前大模型仍处于商业模式摸索期,倘若本轮技术变革无法真实带动下游需求,投入厂商将受到影响。 %research.95579.com3 请阅读最后评级说明和重要声明 4 / 5 行业研究 | 点评报告 投资评级说明 行业评级 报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 看 好: 相对表现优于同期相关证券市场代表性指数 中 性: 相对表现与同期相关证券市场代表性指数持平 看 淡: 相对表现弱于同期相关证券市场代表性指数 公司评级 报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 买 入: 相对同期相关证券市场代表性指数涨幅大于 10% 增 持: 相对同期相关证券市场代表性指数涨幅在 5%~10%之间 中 性: 相对同期相关证券市场代表性指数涨幅在-5%~5%之间 减 持: 相对同期相关证券市场代表性指数涨幅小于-5% 无投

立即下载
信息科技
2025-07-18
长江证券
5页
0.62M
收藏
分享

[长江证券]:软件与服务行业AI产业跟踪:马斯克发布Grok-4,大模型持续突破获得新发展,点击即可下载。报告格式为PDF,大小0.62M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
可比公司 PE 数据对比
信息科技
2025-07-18
来源:深度报告:国产纳米薄膜龙头,多元布局拓成长空间
查看原文
公司主要费用率预测
信息科技
2025-07-18
来源:深度报告:国产纳米薄膜龙头,多元布局拓成长空间
查看原文
公司收入及毛利率拆分
信息科技
2025-07-18
来源:深度报告:国产纳米薄膜龙头,多元布局拓成长空间
查看原文
菲沃泰的定制化纳米涂层一站式解决方案覆盖领域
信息科技
2025-07-18
来源:深度报告:国产纳米薄膜龙头,多元布局拓成长空间
查看原文
部分消费电子领域客户的合作业务
信息科技
2025-07-18
来源:深度报告:国产纳米薄膜龙头,多元布局拓成长空间
查看原文
客户评估菲沃泰和 P2I 工艺的技术参数对比
信息科技
2025-07-18
来源:深度报告:国产纳米薄膜龙头,多元布局拓成长空间
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起