科技行业动态点评-Token推动计算Compute需求:非线形增长

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 科技 Token 推动计算 Compute 需求:非线形增长 华泰研究 科技 增持 (维持) 计算机 增持 (维持) 谢春生 研究员 SAC No. S0570519080006 SFC No. BQZ938 xiechunsheng@htsc.com +(86) 21 2987 2036 王浩天 联系人 SAC No. S0570125010006 wanghaotian@htsc.com +(86) 21 2897 2228 徐诚伟 联系人 SAC No. S0570125070089 xuchengwei@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2025 年 7 月 17 日│中国内地 动态点评 Token 调用量与算力需求非线性增长 推理和 Token 调用量之间不是线性关系:从 Agentic AI 底层来看,推理过程的倍数项包含 Agent 数和迭代次数,多 Agent 协作和多工具调用带来 Token 消耗量倍数增长。Token 的增长与算力硬件需求之间也不是线性关系:据黄仁勋在 3 月份的 GTC 大会中所述,“Token量增长 10 倍,所需的算力量的增长可能增长 100 倍”。这是因为推理过程变得更加复杂,在同样的算力条件下,计算的时间也将增长,如果要求模型具备交互性与实时性,则需要将计算速度提升 10 倍。我们认为,Agentic AI 将带来 Token 调用量 10 倍以上增长,从而带来算力需求 100 倍以上提升。目前市场对于算力需求有较大的预期差,未来算力需求空间广阔。 三条 Scaling 曲线为算力需求打开空间 目前市场熟知的 Scaling law 是预训练 Scaling law,即数据和参数量的增长可以提升模型性能。对预训练 Scaling law 见顶的担忧导致市场对算力的需求的低估。但我们认为,考虑到后训练 Scaling 和推理 Scaling,AI 对算力的需求仍有大量空间。推理 Scaling 的必要性在于提高模型性能,特别是模型在困难问题方面的表现,是通往 Agentic AI 的重要路径。回顾 Grok 4 的发展历程,对应了三条 Scaling 曲线。2025 年 2 月,Grok 3 发布,相比于Grok 2,将预训练阶段的算力扩大 10 倍,实现性能的突破,对应预训练阶段的 Scaling law。2025 年 7 月,Grok 4 发布,将后训练与推理过程的算力扩大 10 倍,在推理/测试阶段花费更多时间思考,调用更多算力,例如通过多 Agent 共同思考,商议问题结果,进一步在 HLE 测评集上实现突破,对应后训练与推理过程的 Scaling law。 Token 调用量随推理扩展呈倍数增长 GTC 2025 大会中,黄仁勋多次提到了“Agentic AI”,理解 Agentic AI 才能理解大会中 Token 量大幅增长的结论。我们认为 Deep Research 是“Agentic 化”的 AI Search,是研究 Agentic AI 合适的抓手。我们从 Deep Research 的底层系统设计入手,分析得出 Token 量增长源于多 Agent 和多工具调用,并基于系统运行流程对 Token 增量进行量化。根据我们的测算,Deep Research 的 Token 消耗可能接近单次聊天的 50 倍。对于比 Deep Research 更复杂的一般 Agentic AI,Token 增长量会更高。 AI 算力需求随 Token 增长呈倍数增长 推理过程中存在延迟与吞吐量两个重要指标,两个指标相互制约,分别决定了用户对于模型/AI 应用的使用体验(若延迟过高,则会失去用户)与模型/AI 应用厂商的总任务处理量,对应 AI 服务的量价关系,从而决定了 AI 服务的商业化。考虑模型/AI 应用厂商 Token 经济学的“帕累托最优”问题,则需要追求用户使用量与 AI 服务质量之间的平衡,而想要扩大最优边界,则需要增加算力硬件。随着推理过程变得更加复杂,在同样的算力条件下计算的时间也将增长。用户太久的等待将失去耐心,如果要求模型具备交互性与实时性,则需要用额外的算力来减少因为单任务 Token 量扩大带来的时延,即用算力换时间,所以算力需求的增长与 Token 的增长呈倍数关系。 风险提示:宏观经济波动,模型迭代不及预期,AI 商业化进展不及预期。 (12)12365983Jul-24Nov-24Mar-25Jul-25(%)科技计算机沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 科技 正文目录 New Scaling:不止于预训练,三条 Scaling 推动算力需求增长 ................................................................................ 3 从三条 Scaling law 的差异看为什么算力需求将继续增长 ..................................................................................... 3 推理 Scaling 的必要性和算力消耗量化 ................................................................................................................. 4 Grok 系列模型的发展对应了三条 Scaling 曲线 ..................................................................................................... 5 从 Deep Research 看 Agentic 对 Token 量的影响 ..................................................................................................... 8 Deep Research 是研究 Agentic AI 的重要抓手之一 .............................................................................................. 9 Deep Research 的 Token 多在哪?基于底层系统设计视角的分析 ..................................................................... 10 从 Search 到 Research,量化 Agentic 的 Token 影响 ...

立即下载
综合
2025-07-17
华泰证券
23页
3.15M
收藏
分享

[华泰证券]:科技行业动态点评-Token推动计算Compute需求:非线形增长,点击即可下载。报告格式为PDF,大小3.15M,页数23页,欢迎下载。

本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
隆鑫通用燃油摩托车销量(排量>250cc,辆) 图10:隆鑫通用燃油摩托车同比(排量>250cc,%)
综合
2025-07-17
来源:摩托车行业系列点评十八:中大排销量创新高 自主高端化提速
查看原文
钱江摩托燃油摩托车销量(排量>250cc,辆) 图8:钱江摩托燃油摩托车同比(排量>250cc,%)
综合
2025-07-17
来源:摩托车行业系列点评十八:中大排销量创新高 自主高端化提速
查看原文
春风动力摩托车销量(排量>250cc,辆) 图6:春风动力摩托车同比(排量>250cc,%)
综合
2025-07-17
来源:摩托车行业系列点评十八:中大排销量创新高 自主高端化提速
查看原文
两轮燃油摩托车销量(250<排量≤400cc,辆,%) 图4:两轮燃油摩托车销量(400<排量≤500cc,辆,%)
综合
2025-07-17
来源:摩托车行业系列点评十八:中大排销量创新高 自主高端化提速
查看原文
行业总体两轮燃油摩托车销量(排量>250cc,辆) 图2:行业总体两轮燃油摩托车同比(排量>250cc,%)
综合
2025-07-17
来源:摩托车行业系列点评十八:中大排销量创新高 自主高端化提速
查看原文
可比公司估值(截至 2025 年 7 月 16 日)
综合
2025-07-17
来源:HVLS风扇领军企业,AI+打造第二成长曲线
查看原文
ai总结
AI智能总结
本报告探讨了Token调用量与算力需求之间的非线性增长关系,指出Agentic AI将推动算力需求大幅提升,并分析了三条Scaling曲线对算力需求的长期影响。 1. Token调用量与算力需求呈非线性增长:Agentic AI通过多Agent协作和多工具调用使Token消耗量呈倍数增长,而算力需求增长更为显著,可能达到Token增长量的10倍。 2. 三条Scaling曲线共同推动算力需求:除预训练Scaling外,后训练Scaling和推理Scaling为算力需求打开新空间,特别是在模型微调和复杂推理场景下,算力消耗可能达到传统模型的30-100倍。 3. 推理Scaling是提升模型性能的关键路径:在训练数据受限的情况下,通过增加推理时间和计算量可显著提升模型在困难问题上的表现,这是实现Agentic AI的重要途径。 4. 延迟与吞吐量的平衡决定商业化潜力:AI服务提供商需要在用户体验(延迟)和处理能力(吞吐量)之间寻求帕累托最优,这需要通过增加算力硬件来扩展最优边界。 5. Deep Research案例显示Agentic AI的Token消耗可达普通聊天的50倍,更复杂的Agentic AI系统将带来更高的Token增长,进而驱动算力需求呈倍数级提升。
热门报告
加入社群
回顶部
报告群
公众号
小程序
在线客服
收起