科技行业动态点评-Token推动计算Compute需求:非线形增长
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 科技 Token 推动计算 Compute 需求:非线形增长 华泰研究 科技 增持 (维持) 计算机 增持 (维持) 谢春生 研究员 SAC No. S0570519080006 SFC No. BQZ938 xiechunsheng@htsc.com +(86) 21 2987 2036 王浩天 联系人 SAC No. S0570125010006 wanghaotian@htsc.com +(86) 21 2897 2228 徐诚伟 联系人 SAC No. S0570125070089 xuchengwei@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2025 年 7 月 17 日│中国内地 动态点评 Token 调用量与算力需求非线性增长 推理和 Token 调用量之间不是线性关系:从 Agentic AI 底层来看,推理过程的倍数项包含 Agent 数和迭代次数,多 Agent 协作和多工具调用带来 Token 消耗量倍数增长。Token 的增长与算力硬件需求之间也不是线性关系:据黄仁勋在 3 月份的 GTC 大会中所述,“Token量增长 10 倍,所需的算力量的增长可能增长 100 倍”。这是因为推理过程变得更加复杂,在同样的算力条件下,计算的时间也将增长,如果要求模型具备交互性与实时性,则需要将计算速度提升 10 倍。我们认为,Agentic AI 将带来 Token 调用量 10 倍以上增长,从而带来算力需求 100 倍以上提升。目前市场对于算力需求有较大的预期差,未来算力需求空间广阔。 三条 Scaling 曲线为算力需求打开空间 目前市场熟知的 Scaling law 是预训练 Scaling law,即数据和参数量的增长可以提升模型性能。对预训练 Scaling law 见顶的担忧导致市场对算力的需求的低估。但我们认为,考虑到后训练 Scaling 和推理 Scaling,AI 对算力的需求仍有大量空间。推理 Scaling 的必要性在于提高模型性能,特别是模型在困难问题方面的表现,是通往 Agentic AI 的重要路径。回顾 Grok 4 的发展历程,对应了三条 Scaling 曲线。2025 年 2 月,Grok 3 发布,相比于Grok 2,将预训练阶段的算力扩大 10 倍,实现性能的突破,对应预训练阶段的 Scaling law。2025 年 7 月,Grok 4 发布,将后训练与推理过程的算力扩大 10 倍,在推理/测试阶段花费更多时间思考,调用更多算力,例如通过多 Agent 共同思考,商议问题结果,进一步在 HLE 测评集上实现突破,对应后训练与推理过程的 Scaling law。 Token 调用量随推理扩展呈倍数增长 GTC 2025 大会中,黄仁勋多次提到了“Agentic AI”,理解 Agentic AI 才能理解大会中 Token 量大幅增长的结论。我们认为 Deep Research 是“Agentic 化”的 AI Search,是研究 Agentic AI 合适的抓手。我们从 Deep Research 的底层系统设计入手,分析得出 Token 量增长源于多 Agent 和多工具调用,并基于系统运行流程对 Token 增量进行量化。根据我们的测算,Deep Research 的 Token 消耗可能接近单次聊天的 50 倍。对于比 Deep Research 更复杂的一般 Agentic AI,Token 增长量会更高。 AI 算力需求随 Token 增长呈倍数增长 推理过程中存在延迟与吞吐量两个重要指标,两个指标相互制约,分别决定了用户对于模型/AI 应用的使用体验(若延迟过高,则会失去用户)与模型/AI 应用厂商的总任务处理量,对应 AI 服务的量价关系,从而决定了 AI 服务的商业化。考虑模型/AI 应用厂商 Token 经济学的“帕累托最优”问题,则需要追求用户使用量与 AI 服务质量之间的平衡,而想要扩大最优边界,则需要增加算力硬件。随着推理过程变得更加复杂,在同样的算力条件下计算的时间也将增长。用户太久的等待将失去耐心,如果要求模型具备交互性与实时性,则需要用额外的算力来减少因为单任务 Token 量扩大带来的时延,即用算力换时间,所以算力需求的增长与 Token 的增长呈倍数关系。 风险提示:宏观经济波动,模型迭代不及预期,AI 商业化进展不及预期。 (12)12365983Jul-24Nov-24Mar-25Jul-25(%)科技计算机沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 科技 正文目录 New Scaling:不止于预训练,三条 Scaling 推动算力需求增长 ................................................................................ 3 从三条 Scaling law 的差异看为什么算力需求将继续增长 ..................................................................................... 3 推理 Scaling 的必要性和算力消耗量化 ................................................................................................................. 4 Grok 系列模型的发展对应了三条 Scaling 曲线 ..................................................................................................... 5 从 Deep Research 看 Agentic 对 Token 量的影响 ..................................................................................................... 8 Deep Research 是研究 Agentic AI 的重要抓手之一 .............................................................................................. 9 Deep Research 的 Token 多在哪?基于底层系统设计视角的分析 ..................................................................... 10 从 Search 到 Research,量化 Agentic 的 Token 影响 ...
[华泰证券]:科技行业动态点评-Token推动计算Compute需求:非线形增长,点击即可下载。报告格式为PDF,大小3.15M,页数23页,欢迎下载。

