科技行业动态点评:从Token角度,测算AI算力需求

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 科技 从 Token 角度,测算 AI 算力需求 华泰研究 科技 增持 (维持) 计算机 增持 (维持) 谢春生 研究员 SAC No. S0570519080006 SFC No. BQZ938 xiechunsheng@htsc.com +(86) 21 2987 2036 王浩天 联系人 SAC No. S0570125010006 wanghaotian@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2025 年 7 月 01 日│中国内地 动态点评 推理算力需求增长或快于算力单位成本下降 总算力支出受到算力需求与成本的共同影响。随 AI 应用用户数量的不断增长及 Agent 的渗透不断提升,推理端算力需求不断上升;同时,由于硬件的迭代与 infra 算法的不断改进,模型推理的单位成本不断下降,模型推理价格目前已下降到 2023 年初的 1/100 以下,目前市场对未来推理端算力支出节奏存在分歧。本报告旨在提供一个推理算力需求从用户渗透到 Token 调用、再到硬件支出的分析框架,我们通过对 Google 与微软(OpenAI)未来Token 调用量、算力总需求和未来硬件支出节奏的测算,得出结论:推理算力需求增长速度快于单位算力成本的降低。我们持续看好推理端算力需求的加速增长。 海内外大厂 Token 调用量增长迅速,推理算力需求快速增长 海外 CSP 厂商来看,根据 25 年 5 月 Google I/O 大会数据,Google 的 Token月均调用量从 24 年 4 月的 9.7 万亿增长至 25 年 4 月的 480 万亿,增长 50倍。根据微软 FY25Q3 电话会数据,Azure AI 基础设施在 25 年一季度处理了超 100 万亿 Token,较去年同期增长 5 倍,其中 3 月份单月 Token 调用量达 50 万亿。国内互联网大厂来看,25 年 5 月字节火山引擎 Token 日均调用量为 16.4 万亿(月均 508T),是 24 年 5 月的 137 倍。我们认为,海内外大厂 Token 调用量已出现明显加速拐点,推理端算力需求快速增长。 考虑到单位算力成本下降后,Google 算力支出仍有望高增 AI 搜索的渗透是 Google Token 调用量增长的主要驱动,通过对 AI Overview、AI Mode、Gemini 2C 应用和其他推理需求的测算,我们预测Google 25 年第二季度 Token 总量有望达到 2009 万亿,环比增长 223%,相较于 24Q2 的 71 万亿 Token 增长接近 30 倍。单位算力成本 = 单位价格 / 算力,受软件算法优化与新版本芯片的部署影响,单位算力成本呈现下降趋势,根据我们测算,4/5/6 月单位算力成本分别环比下降 14%/13%/13%,下降幅度小于 4/5/6 月算力需求提升的环比增速 56%/38%/32%。根据我们测算结果,Google 25 年二季度推理算力开支仍有望环比增长 100%以上。 用户使用量与 Deep Research 的渗透有望驱动微软算力需求高增 微软 Token 调用量的提升主要源于 OpenAI ChatGPT 网页的访问量上升及Deep Research 功能的渗透。考虑到以上两因素的影响,在我们的预测框架下,微软 25 年第二季度的总 Token 调用量有望达到 205 万亿,环比增长约100%。算力成本角度,算法优化带来模型浮点运算利用率的提升,即同样数量的芯片能带来更多的有效算力。根据我们测算,考虑到算法优化带来的算力成本下降后,微软年底的推理算力卡需求量仍约为 3 月的两倍有余,我们预测微软的算力硬件需求仍将维持高速增长。 风险提示:宏观经济波动;技术落地不及预期;本研报中涉及到未上市公司和未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。 (12)10325375Jul-24Oct-24Feb-25Jun-25(%)科技计算机沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 科技 正文目录 海内外大厂 Token 调用量增长迅速,推理算力需求加速放量 ...................................................................................... 3 北美大厂 Token 调用量与算力需求测算 ....................................................................................................................... 5 Google Token 调用量与算力需求测算 ................................................................................................................... 5 Google Token 调用量增长,主要源于 AI 搜索的拓展 ................................................................................... 5 Google Token 调用量测算 ............................................................................................................................. 5 Google Token 量快速增长有望带来资本开支持续高增 ................................................................................. 7 微软 Token 调用量与算力需求测算 ....................................................................................................................... 9 OpenAI Token 调用量增长主要源于用户数量增长与 Deep Research 功能的渗透 ....................................... 9 微软算力需求测算:年底等效 H100 芯片需求约为 25 年 3 月的两倍有余 .................................................. 11 结论:推理算力需求增长速度快于单位算力成本的降低 ..............................

立即下载
综合
2025-07-07
华泰证券
17页
0.89M
收藏
分享

[华泰证券]:科技行业动态点评:从Token角度,测算AI算力需求,点击即可下载。报告格式为PDF,大小0.89M,页数17页,欢迎下载。

本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共17页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图38.近 20 年投资与实体是油价波动的主要解释 图39.近 5 年避险对油价波动解释力度显著增加
综合
2025-07-07
来源:大宗商品分析框架之六:欧洲复兴+地缘扰动,原油会再涨么?
查看原文
图35.原油的边际供需变动总结
综合
2025-07-07
来源:大宗商品分析框架之六:欧洲复兴+地缘扰动,原油会再涨么?
查看原文
图31.美元指数与原油期货价格 图32.美元体系与原油价格关系
综合
2025-07-07
来源:大宗商品分析框架之六:欧洲复兴+地缘扰动,原油会再涨么?
查看原文
图28.特朗普能源政策梳理
综合
2025-07-07
来源:大宗商品分析框架之六:欧洲复兴+地缘扰动,原油会再涨么?
查看原文
图26.对等关税缓和对原油需求提振测算
综合
2025-07-07
来源:大宗商品分析框架之六:欧洲复兴+地缘扰动,原油会再涨么?
查看原文
图24.三种情形下伊以冲突对油价中枢影响
综合
2025-07-07
来源:大宗商品分析框架之六:欧洲复兴+地缘扰动,原油会再涨么?
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起