计算机行业事件点评-再谈Token需求“通胀”:从云到大模型

本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 1 计算机行业事件点评 再谈 Token 需求“通胀”:从云到大模型 glmszqdatemark [Table_Author] 分析师:吕伟 执业证书:S0590525110033 邮箱:lvwei_yj@glms.com.cn 事件:2 月 12 日,智谱在官方渠道宣布上调 GLM Coding Plan 订阅价格,涨幅“至少 30%”。 此前,海外云厂商于本月纷纷提价,如 Google Cloud 在北美涨价幅度达 100%,在欧洲与亚洲也同步上调;同时 AWS 的价格也上调了约 15%。综合来看,Token 需求“通胀”不仅利好云端算力,也让模型厂商拥有了议价权。 颠覆传统互联网的免费路径:传统互联网软件的典型路径是先用免费换用户规模,凭借“用户数和时长”换议价权,然后在广告、会员订阅、增值服务、交易抽佣里变现,免费背后的底层原因无非是边际成本极低。即多一个用户或多一次点击,成本却可以被带宽与存储规模效应稀释,从而达到近似为零的边际成本。 云计算时代也出现过类似的“先免费/低价再扩张”,但云的计费单位很快变成 CPU/存储/带宽/请求数,客户也习惯了“按量计费”。云能收费,是因为它交付的是明确的资源和 SLA(服务提供商与客户签订的服务等级协议)。但当行业依旧处在“模型价格战”时,智谱却出现了涨价的信号,我们认为这意味着大模型时代的“计量单位”从流量(DAU/时长)转向 Token(推理消耗),而 Token 的消耗在越来越多场景里是刚需。 大模型时代的变化:Token 变成“可计量的生产资料”,不再是“免费流量”。大模型把“对话/写代码/生成内容”这类看似是由软件供应商提供的服务,变成了强依赖算力的在线推理服务。对模型厂商而言,每一次回答都要实打实地消耗 GPU、显存、带宽与电力;对用户来说,每一次“让模型多想一会儿、写一段更长的代码、跑一个更复杂的任务”都对应更多 Token 的消耗,于是 Token 天然成为新的计量单位。智谱此前正因为用户增长导致算力阶段性紧张,对 Coding Plan 做过“限量发售”安排,这与其后续涨价形成了一个非常典型的“供需链条”:需求在短期内大幅增长→资源呈现刚性约束(导致限流/限量)→涨价。 当高峰期拥堵与资源紧张出现时,涨价是一种让模型厂筛选需求的机制,比“无差别限流”更能保护用户的体验。并且,模型厂商的成本端仍与 GPU 供给、利用率、推理优化强相关,涨价/更合理的分层定价能把模型厂商从“边际收益受算力成本约束”的陷阱里拉出来,在保持订阅留存的前提下有利于提升毛利与现金流质量。 Token 需求在“通胀”:“Token 通胀”,不是指 Token 本身变贵,而是指单位时间内、单位用户的 Token 消耗结构性上升。Token 需求的高涨有以下几个原因:· ● 从“问答”变为“干活”:模型发展至今,用户不再满足于简单的回答形式,而是开始让模型重构代码、改写文件、生成文档和跑测试等等。编程场景的特征天然是“长上下文、多轮迭代、大量输出”,这对 Token 是大量的消耗。通过智谱的表述,也证实了开发者依靠其模型用于编码支持,导致 Token 消耗的快速增长。 ● 从“单轮”到“Agent 的多轮”:智谱把 GLM-5 定位为面向 Coding 与 Agent场景的新一代模型;2 月 12 日,MiniMax 也把正式上线的最新旗舰编程模型 M2.5 标注为全球首个为 Agent 场景原生设计的生产级模型。将 M2.5 的编程与智能体性能(Coding&Agentic)直接对标 Claude Opus4.6。Agent 会 推荐 维持评级 相对走势 相关研究 1. 计算机行业事件点评:AI+招采迎来政策红利-2026/02/11 2. 计算机行业周报 20260207:再次强调迎接新一轮大模型创新潮-2026/02/08 3. 计算机行业事件点评:Clawdbot 系列研究之核心受益方向:大模型篇-2026/02/04 4. 计算机行业事件点评:Clawdbot 系列深度总起篇:AI“杀手级”应用的雏形-2026/02/02 5. 计算机行业周报 20260201:2025Q4 持仓分析:持仓历史底部,AI 主线持续走强-2026/02/02 -20%-3%13%30%2025/22025/82026/2计算机沪深3002026 年 02 月 13 日本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 2 行业事件点评/计算机 主动规划、检索、执行、反思,多次调用模型,Token 消耗自然按步骤累加。 ● 推理强度上升:更多“深度思考、更长链路推理”会显著提高输出与中间过程的Token 消耗。对开发者而言,这往往带来更高成功率与更少返工,用户反而愿意“增加 Token 投入来换取效率”。 我们认为,这意味着 Token 不是传统互联网时代边际成本几乎为零的“流量”,而是生产任务时必不可少的“燃料”。 投资建议:云计算逐步变为“卖资源”,而大模型厂商化身“卖 Token 燃料+卖成果”。智谱 GLM Coding Plan 的涨价折射的是产业定价逻辑的改变:当推理消耗变成生产资料,模型厂商有机会把“算力稀缺”通过分层定价与订阅化产品转化为毛利与现金流。建议后续持续关注: ● 大模型厂商:能在编程、Agent、企业流程等高 ROI 场景中维持订阅留存与企业席位扩张,能把“Token 用量”稳定转成“省人省时省返工”的交付价值时,就具备了穿越开源与价格战的能力。建议关注 MiniMax 和智谱等优质大模型公司。 ● 云厂商与算力基础设施:AI 拉动的 IT 支出与基础设施投入仍处上行周期,云侧有望受益于 GPU 算力、存储与网络 I/O 等“伴随型消耗”的持续增长。建议关注金山云、优刻得、首都在线等。 ● 安全治理与运行时的防护工具:随着企业把 AI 嵌入工作流,数据泄露、代理越权等风险有望推动“AI 安全平台/治理平台”成为刚需层。建议关注深信服、启明星辰、三六零等。 短期观察提价与需求(Token“通胀”)带来的边际改善,中期跟踪企业席位与订阅留存带来的续费与扩张,长期看好治理工具普及带来的“AI 防火墙”新增市场。 风险提示:技术路线变革具有不确定性;行业竞争加剧。 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 3 行业事件点评/计算机 图1:智谱 GLM Coding Plan 涨价通知 资料来源:智谱官方微信公众号,国联民生证券研究所 图2:智谱 GLM Coding Plan 限售公告 资料来源:智谱官方微信公众号,国联民生证券研究所 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 4 行业事件点评/计算机 图3:Google Cloud 涨价通知 资料来源:谷歌官网,国联民生证券研究所 图4:OpenClaw 发布以来 Tokens 调用量趋势图

立即下载
电子设备
2026-02-14
国联民生证券
5页
1.47M
收藏
分享

[国联民生证券]:计算机行业事件点评-再谈Token需求“通胀”:从云到大模型,点击即可下载。报告格式为PDF,大小1.47M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
分行业样本企业资本结构情况 图 15:分行业样本企业偿债指标变动
电子设备
2026-02-13
来源:中国半导体行业展望
查看原文
分行业样本企业获现与资本开支情况 图 13:分行业样本企业运营效率指标变动
电子设备
2026-02-13
来源:中国半导体行业展望
查看原文
分行业样本企业收入及毛利率情况 图 11:2025 年前三季度样本企业盈利及期间费用率变动
电子设备
2026-02-13
来源:中国半导体行业展望
查看原文
近年来全球半导体材料销售额情况(亿美元,%)
电子设备
2026-02-13
来源:中国半导体行业展望
查看原文
近年来全球半导体设备销售额情况(十亿美元,%)
电子设备
2026-02-13
来源:中国半导体行业展望
查看原文
2021~2027 全球数据中心市场规模及预测(亿美元) 图 7:我国 AI 芯片市场规模变化情况(亿元)
电子设备
2026-02-13
来源:中国半导体行业展望
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起