软件与服务行业深度报告:AI沉思录(二),Token工厂,从“堆资源”到“榨资源”的产业趋势

行业研究丨深度报告丨软件与服务 [Table_Title] AI 沉思录(二):Token 工厂:从“堆资源”到“榨资源”的产业趋势 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 2 / 26 丨证券研究报告丨 报告要点 [Table_Summary]Token 工厂的出现标志着智算产业正在从资源竞争进入效率竞争阶段,可能意味着过去以“堆资源”为核心的产业逻辑正式朝着“榨资源”的方向转型。不同模式下的北极星指标也发生了根本性变化:过去,智算中心主要关注资源的多寡,但在 Token 工厂北极星指标就变成了有限资源的Token 生产效率,目前的常用指标是 token/s 或 token/任务。目前市场主流的商业模式包括通用 Token 和垂类行业 Token 两种。 分析师及联系人 [Table_Author] 杨洋 郭敬超 卢之晗 SAC:S0490517070012 SAC:S0490525120002 SAC:S0490525120001 SFC:BUW100 %%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 沉思录(二):Token 工厂:从“堆资源”到“榨资源” 的产业趋势 行业研究丨深度报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] Token 工厂:以高效生产 Token 为核心产出指标的新一代 AI 基础设施 Token 工是以 Token 吞吐量为核心产出指标的新一代 AI 基础设施。其运营目标不再是简单提供 GPU 算力,而是将电力、GPU、网络和模型高效转化为持续输出的 Token 流,并最终转化为智能服务和收入。正如英伟达黄仁勋所提出的,AI 工厂的本质是将能源转化为 Token,再将Token 转化为实际价值,而 Token 正逐渐成为衡量 AI 生产力的核心单位。 由于 Token 吞吐量直接决定了 AI 工厂的收入能力和资本回报率(ROI),如何高效榨取有限资源、最大化单位 GPU和单位功耗所产生的 Token 数量,正在成为 AI 基础设施竞争的新焦点。在这一过程中,竞争逻辑也正在从“拥有多少 GPU”转向“如何让 GPU 生产更多 Token”。 量:AI 系统软件栈决定了 Token 工厂的资源转化效率 AI 时代,GPU 已经逐渐成为标准化的算力资源,其性能决定了 Token 工厂的理论生产能力上限,而真正决定既定的算力资源能够释放多少价值的,则是覆盖调度平台、推理引擎、编译器和模型优化在内的 AI 系统软件栈。相比传统云时代主要依赖硬件扩容提升计算能力,Token 工厂更强调通过软件持续挖掘存量算力的生产效率,即以更少的 GPU、更低的功耗生产更多的Token。本报告中将主要讨论两项核心能力:1)以调度平台为核心,通过各项技术提高 GPU利用率,减少资源碎片化和空闲时间,让更多 GPU 真正投入 Token 生产。2)以芯模协同为核心,通过芯片架构、编译器、推理框架与模型结构的联合优化,提高单位 GPU 的 Token 生成效和单位功耗性能,进一步释放硬件潜力。 价:Token 的定价本质上由推理成本、能力溢价和竞争策略共同决定 Token 的定价本质上由推理成本、能力溢价和竞争策略共同决定,但不同层级 Token 的主导因素存在显著差异。对于基础设施级 Token 而言,由于模型能力趋于同质化、市场竞争激烈,厂商定价主要围绕推理成本展开,价格持续向边际成本收敛,长期壁垒更多来自成本优化和资源运营效率。对于专家级 Token 而言,用户开始根据任务复杂度主动选择模型,模型能力成为影响定价的重要因素,因此其定价逻辑表现为“推理成本+能力溢价”,具备更强的推理能力、专业能力和品牌影响力的模型能够获得更高定价。 商业模式看,通用 Token 和垂类行业 Token 的竞争壁垒截然不同 针对不同层级、不同需求的市场,目前衍生出了两种商业模式:聚合平台和垂类行业 Token。聚合平台模式是当前主流的商业模式之一,可以形象地比喻为“大模型界的 App Store”或“AI 算力聚合路由平台”。它自身不训练任何大模型,而是通过搭建一个统一的中间层,将全球各大厂商的 AI 模型接口(API)打包整合,为开发者提供一站式的调用服务。垂类行业 Token 指的是部分拥有特定行业 Know-how 的软件公司通过将自己的行业数据和 Know-how 封装进传统的 Token,从而进一步生产出更加具备行业生产力的垂类 Token,以获得更大的利润空间。 风险提示 1、模型发展不及预期风险; 2、算力供给不足风险; 3、数据供应不足风险; 4、行业竞争加剧风险。 [Table_StockData] 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《Token 工厂:从“堆 GPU”到“榨 Token”》2026-06-29 •《2026 年第 25 周计算机行业周报:原动力大会召开在即,关注国产模型及算力》2026-06-25 •《力箭一号达成百星里程碑,我国商业航天有望迈向规模化交付阶段》2026-06-24 -20%-3%13%30%2025/62025/102026/22026/6软件与服务沪深3002026-06-30%research.95579.com3 请阅读最后评级说明和重要声明 4 / 26 行业研究 | 深度报告 目录 Token 工厂的出现标志着智算产业正在从资源竞争进入效率竞争阶段 .......................................... 6 从“堆资源”到“榨资源”,行业北极星指标或发生本质变化 ............................................................................... 6 Token 吞吐量直接决定 Token 工厂的收入 ...................................................................................................... 6 AI 系统软件栈决定了 Token 工厂的资源转化效率......................................................................... 7 调度层面优化:AI 云调度能力的重要性超过了传统云 ................................................................................... 7 芯模协同优化:提升 Token 产出效率.................................................

立即下载
信息科技
2026-07-01
长江证券
26页
3.49M
收藏
分享

[长江证券]:软件与服务行业深度报告:AI沉思录(二),Token工厂,从“堆资源”到“榨资源”的产业趋势,点击即可下载。报告格式为PDF,大小3.49M,页数26页,欢迎下载。

本报告共26页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共26页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关报告
热门报告
加入社群
回顶部
报告群
公众号
小程序
在线客服
收起