软件与服务行业AI应用进行时：GLM-5.1发布高速版，看好模型架构创新与商业化进展加速

请阅读最后评级说明和重要声明丨证券研究报告丨行业研究丨点评报告丨软件与服务 [Table_Title] AI 应用进行时：GLM-5.1 发布高速版，看好模型架构创新与商业化进展加速报告要点 [Table_Summary]5 月 22 日，智谱面向部分企业客户提供 GLM-5.1 高速版 API，模型输出速度达到 400 tokens/s，刷新当前全球大模型厂商 API 速度上限。分析师及联系人 [Table_Author] 宗建树刘思缘 SAC：S0490520030004 SFC：BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明丨证券研究报告丨更多研报请访问长江研究小程序软件与服务 cjzqdt11111 [Table_Title2] AI 应用进行时：GLM-5.1 发布高速版，看好模型架构创新与商业化进展加速行业研究丨点评报告 [Table_Rank] 投资评级看好丨维持 [Table_Summary2] 事件描述 5 月 22 日，智谱面向部分企业客户提供 GLM-5.1 高速版 API，模型输出速度达到 400 tokens/s，刷新当前全球大模型厂商 API 速度上限。事件评论 ⚫ 输出速度 400 tokens/s，顶尖模型跑出最快速度。国产模型首次在完整保留旗舰级能力的同时，实现生产级低延迟响应，AI 开始从“等待式问答”迈向“实时协作”。当前 GLM-5.1高速版已面向智谱 MaaS 平台部分企业客户开放服务，商业化加速进行中。对照 2 月Claude Opus 4.6 推出极速模式 Fast Mode，速度比标准版快 2.5 倍，价格翻 6 倍，我们认为本轮更新后智谱有望实现 Token 价格进一步大幅上涨。 ⚫ 提前押注“推理时代”的 Scaling Law 变化：Agent、语音交互、代码补全、工具调用，以及 Test-Time Scaling 的兴起，正在把推理重新推向 latency-first。传统推理框架在单Token、小 Batch、高并发场景下，会被 Host 调度、显存读写与跨算子同步等“非计算开销”拖慢，导致 GPU 算力无法真正释放。TileRT 通过静态编排、Persistent Kernel 与多卡异构协同，本质上是在压缩 GPU 空转时间，让同样的硬件跑出更高吞吐、更低延迟和更低单位 Token 成本。 ⚫ 今年国产模型 Infra 能力今年迅速提升，推理引擎和推理框架持续重构。重构趋势是从算子级优化转向（1）持久化执行、片上流水、异构协同；（2）模型‑系统‑硬件协同设计，全面压缩执行间隙，以速度作为新的扩展维度。从工作流上看，过去执行更接近 compute → sync（同步等待） → compute，而未来会向 compute ↔ communication ↔ compute转变，转向为持续重叠的执行流水线，从“跑得快”到“持续跑得快”。 ⚫ 后续模型将比拼系统级能力。大模型竞争正从“训练 Scaling Law”转向“速度 Scaling Law”：过去行业比拼的是参数量、数据量与训练算力，而在 Agent 与实时交互时代，速度开始直接决定模型在固定延迟预算内能够完成的推理深度、交互质量与任务复杂度。因此，当系统逐渐逼近硬件极限后，单纯依赖框架层局部优化已难以持续提升性能，未来竞争核心将转向模型、编译器与硬件的一体化协同设计。 ⚫ 模型从需求拐点走向需求差异化走向系统级竞争，后续还会继续走向场景端生态端开拓，市场空间持续扩大，需求拐点明确，市场空间广阔，模型持续加速迭代，看好国产模型与算力的全面共振。风险提示 1、AI 技术发展不及预期； 2、下游应用需求不及预期。市场表现对比图(近 12 个月) 资料来源：Wind 相关研究 [Table_Report]•《2026 年第 20 周计算机行业周报：电信 Token套餐上线，重点关注算力基础设施》2026-05-21 •《“星枢计划”正式启动，上海发力太空算力》2026-05-21 •《“九章四号”原型机公布，中国量子计算机再迎突破》2026-05-20 -10%7%23%40%2025/52025/92026/12026/5软件与服务沪深3002026-05-24%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 5 行业研究 | 点评报告风险提示 1、AI 技术发展不及预期，本次大模型创新伴随参数量及模态的增速能力天花板尚未达到，但模型效果本身仍存瓶颈及问题，倘若 AI 技术发展不及预期，投入厂商仍然存在失败风险。 2、下游应用需求不及预期，人工智能本质是通过供给创新催生需求扩容，目前大模型仍处于商业模式摸索期，倘若本轮技术变革无法真实带动下游需求，投入厂商将受到影响。 %research.95579.com3 请阅读最后评级说明和重要声明 4 / 5 行业研究 | 点评报告投资评级说明行业评级报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准，投资建议的评级标准为：看好：相对表现优于同期相关证券市场代表性指数中性：相对表现与同期相关证券市场代表性指数持平看淡：相对表现弱于同期相关证券市场代表性指数公司评级报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准，投资建议的评级标准为：买入：相对同期相关证券市场代表性指数涨幅大于 10% 增持：相对同期相关证券市场代表性指数涨幅在 5%～10%之间中性：相对同期相关证券市场代表性指数涨幅在-5%～5%之间减持：相对同期相关证券市场代表性指数涨幅小于-5% 无投资评级：由于我们无法获取必要的资料，或者公司面临无法预见结果的重大不确定性事件，或者其他原因，致使我们无法给出明确的投资评级。相关证券市场代表性指数说明：沪深两市以沪深 300 指数为基准；北交所市场以北证 50 指数为基准；新三板市场以三板成指为基准；香港市场以恒生指数为基准。办公地址 [Table_Contact]上海武汉 Add /虹口区新建路 200 号国华金融中心 B 栋 22、23 层 P.C /（200080） Add /武汉市江汉区淮海路 88 号长江证券大厦 37 楼 P.C /（430023）北京深圳 Add /朝阳区景辉街 16 号院 1 号楼泰康集团大厦 23 层 P.C /（100020） Add /深圳市福田区中心四路 1 号嘉里建设广场 3 期 36 楼 P.C /（518048） %%%%%%%%research.95579.com4 请阅读最后评级说明和重要声明 5 / 5 行业研究 | 点评报告分析师声明本报告署名分析师以勤勉的职业态度，独立、客观地出具本报告。分析逻辑基于作者的职业理解，本报告清晰准确地反映了作者的研究观点。作

立即下载

信息科技

2026-05-25

长江证券

5页

0.62M

[长江证券]:软件与服务行业AI应用进行时：GLM-5.1发布高速版，看好模型架构创新与商业化进展加速，点击即可下载。报告格式为PDF，大小0.62M，页数5页，欢迎下载。

本报告共5页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共5页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

软件与服务行业AI应用进行时：GLM-5.1发布高速版，看好模型架构创新与商业化进展加速

关于我们

联系我们

软件与服务行业AI应用进行时：GLM-5.1发布高速版，看好模型架构创新与商业化进展加速

关于我们

联系我们

小程序

公众号