软件与服务行业AI产业跟踪:x-AI发布Grok-4 Fast,持续关注大模型迭代与AI应用商业化进展

请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业跟踪: x-AI 发布 Grok-4 Fast,持续关注大模型迭代与 AI 应用商业化进展 报告要点 [Table_Summary]2025 年 9 月 15 日,xAI 推出 Grok-4 Fast,系 Grok-4 高速推理版本,为当前旗下最快 AI 模型,生成速度达每秒 75 tokens,比标准版快 10 倍。根据用户反馈,响应速度最高达标准版的10 倍。当前向付费用户推送早期访问版,限 Super Grok 和 X Premium+订阅者使用。我们认为,速度优先的设计使其适用于追求即时效果的场景,交互效率与用户体验显著提升,预计有望进一步集成到开发工具和移动端中,缩短 AI 应用商业化落地周期。 分析师及联系人 [Table_Author] 宗建树 刘思缘 SAC:S0490520030004 SFC:BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业跟踪:x-AI 发布 Grok-4 Fast,持续关注大模型迭代与 AI 应用商业化进展 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 2025 年 9 月 15 日,xAI 推出 Grok-4 Fast,系 Grok-4 高速推理版本,根据用户反馈,响应速度最高达标准版的 10 倍。当前向付费用户推送早期访问版,限 Super Grok 和 X Premium+订阅者使用。 事件评论 ⚫ Fast 版本定位高速推理 AI 助手,有望实现产品分层。模型旨在简化复杂任务流程,解决标准版模型在实时交互场景中的响应延迟问题,以即时反馈提升用户体验,这一更新让模型更适合实时应用场景,如快速代码生成和即时查询处理。我们认为,从产品化和商业化落地角度来看,Fast 版本的推出一方面标志着 xAI 在 AI 产品分层策略上的进一步完善,不同场景下用户可选择“速度优先”或“质量优先”,未来有望进一步进行产品带的细分。此外,本次新增“后台思考功能”(仍在测试中),或能让用户在助手思考时继续聊天。若未来后台思考与更多模式选择性结合,Grok 有望在 AI 助手实用性上获得突破。 ⚫ 模型牺牲部分精度换取极低延迟,或从“思考型”向“即时型”转型。Grok-4 Fast 架构层面针对快速输出进行专项优化,推理延迟从前代模型 200ms 降至 20ms 以内,接近人类日常水平(通常为 10-30ms)。用户反馈来看,模型在保持基准测试高准确的同时输出速度近 170 tokens/秒。我们认为,速度优先的设计使其适用于追求即时效果的场景,Fast版本核心逻辑在于“舍深度换速度、以轻量化换普及度”,通过交互效率与用户体验显著提升,有望进一步集成到开发工具和移动端中,缩短 AI 应用落地周期。 ⚫ 推理效率优先或成新竞争要素。目前其他头部模型厂商也在逐步推出主打低延迟高实时的模型,如 OpenAI 于 2025 年 8 月发布 GPT-5 mini,定位轻量高速版本,Google 于2025 年 6 月发布 Gemini 2.5 Flash-Lite,追求极速、超低延迟、高性价比,且逐步将旗舰能力下放,均体现出将模型推理成本和延迟压低,以便于规模化商用的布局思路。未来模型竞争或将从“极限性能”转向“推理效率优先”,交互范式从“单轮对话”转向“实时交互与多轮 Agent”。 ⚫ 持续关注海内外大模型后续发布。当前 Agent 投资核心逻辑强化,海内外模型加速迭代,随着 AI 货币化开启,预计 Q4 国内模型与应用侧都将迎来核心拐点,模型能力持续提升、成本进一步下降,Coding 等垂直场景 Agent 落地周期有望提前,看好 Agent 商业化元年及投资机遇。 ⚫ 建议关注:1)AI Infra:AI 应用落地有望加速,AI Infra 有望核心收益,重点推荐国内 AI Infra 核心标的阿里巴巴;2)AI Agent 相关厂商;3)中国推理算力产业链;4)云服务厂商方面关注推理需求带来的推动;5)IDC,重点关注与腾讯、阿里、字节等大厂合作的 IDC。 风险提示 1、AI 技术发展不及预期; 2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《交通强国建设试点有望开展,关注交通信息化投资机遇》2025-09-16 •《2025 年第 37 周计算机行业周报:Qwen3-Next开源发布有望加速 AI 应用落地》2025-09-16 •《商务部发起反歧视立案调查,关注国产 AI 芯片投资机遇》2025-09-15 0%38%76%113%2024/92025/12025/52025/9软件与服务软件与服务沪深300指数2025-09-18%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 5 行业研究 | 点评报告 风险提示 1、AI 技术发展不及预期,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,投入厂商仍然存在失败风险。 2、下游应用需求不及预期,人工智能本质是通过供给创新催生需求扩容,目前大模型仍处于商业模式摸索期,倘若本轮技术变革无法真实带动下游需求,投入厂商将受到影响。 %research.95579.com3 请阅读最后评级说明和重要声明 4 / 5 行业研究 | 点评报告 投资评级说明 行业评级 报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 看 好: 相对表现优于同期相关证券市场代表性指数 中 性: 相对表现与同期相关证券市场代表性指数持平 看 淡: 相对表现弱于同期相关证券市场代表性指数 公司评级 报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 买 入: 相对同期相关证券市场代表性指数涨幅大于 10% 增 持: 相对同期相关证券市场代表性指数涨幅在 5%~10%之间 中 性: 相对同期相关证券市场代表性指数涨幅在-5%~5%之间 减 持: 相对同期相关证券市场代表性指数涨幅小于-5% 无投资评级: 由于我们无法获取必要的资料,或者公司面临无法预见结果的重大不确定性事件,或者其他原因,致使我们无法给出明确的投资评级。 相关证券市场代表性指数说明:A 股市场以沪深 300 指数为基准;新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准;香港市场以恒生指数为基准。 办公地址 [Table_Contact]上海 武汉

立即下载
信息科技
2025-09-18
长江证券
5页
0.64M
收藏
分享

[长江证券]:软件与服务行业AI产业跟踪:x-AI发布Grok-4 Fast,持续关注大模型迭代与AI应用商业化进展,点击即可下载。报告格式为PDF,大小0.64M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
2025Q2 Vs. 2024Q2 全球 PC 出货量(%)(百万台)
信息科技
2025-09-18
来源:集成电路行业深度分析:25Q2封测总结:AI仍为主要驱动因素,头部厂商欲打造尖端封测一站式解决方案
查看原文
头部封测产业链指引
信息科技
2025-09-18
来源:集成电路行业深度分析:25Q2封测总结:AI仍为主要驱动因素,头部厂商欲打造尖端封测一站式解决方案
查看原文
2022Q1-2025Q2 泰瑞达营收及环比、毛利率(%)图 50:2023Q1-2025Q2 泰瑞达各产品营收占比(%)
信息科技
2025-09-18
来源:集成电路行业深度分析:25Q2封测总结:AI仍为主要驱动因素,头部厂商欲打造尖端封测一站式解决方案
查看原文
2022Q1-2025Q2 爱德万各产品营收占比(%)图 48:2022Q1-2025Q2 爱德万各地区营收占比(%)
信息科技
2025-09-18
来源:集成电路行业深度分析:25Q2封测总结:AI仍为主要驱动因素,头部厂商欲打造尖端封测一站式解决方案
查看原文
2022Q1-2025Q2 ASMPT 毛利率(%)图 44:2022Q1-2025Q2 ASMPT 利润率(%)
信息科技
2025-09-18
来源:集成电路行业深度分析:25Q2封测总结:AI仍为主要驱动因素,头部厂商欲打造尖端封测一站式解决方案
查看原文
2025Q2 欣铨科技按产品划分营收占比(%)图 34:2025Q2 欣铨科技按应用划分营收占比(%)
信息科技
2025-09-18
来源:集成电路行业深度分析:25Q2封测总结:AI仍为主要驱动因素,头部厂商欲打造尖端封测一站式解决方案
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起