计算机行业大模型及AI应用专题:从Tokens角度跟踪AI应用落地进展
从Tokens角度跟踪AI应用落地进展——计算机行业大模型及AI应用专题评级:推荐(维持)证券研究报告2025年09月14日计算机刘熹(证券分析师)S0350523040001liux10@ghzq.com.cn请务必阅读报告附注中的风险提示和免责声明2相对沪深300表现表现1M3M12M计算机7.8%20.6%89.7%沪深3009.1%16.2%42.5%最近一年走势相关报告《计算机事件点评:甲骨文RPO增至4550亿美元,AI算力强力增长 (推荐)*计算机*刘熹》——2025-09-12《液冷:AI算力新一极——AI算力“卖水人”专题系列(6)(推荐)*计算机*刘熹》——2025-08-17《计算机专题报告:OpenAI发布GPT-5,AI应用业绩提速——模型及AI应用月报(202507)(推荐)*计算机*刘熹》——2025-08-09-16%4%25%45%66%86%2024/07/042024/10/022024/12/312025/03/312025/06/29计算机沪深300请务必阅读报告附注中的风险提示和免责声明3u本报告主要解决:1)tokens调用量概念界定、2)tokens调用量应用端拆解、3)tokens调用量展望三方面问题。uTokens:模型定价的主要单位,与收入同步高增ü Tokens 是大语言模型用来切割自然语言文本的基本单位,本质反映大语言模型计算量。在推理过程中,token是计算的基本单位,模型对每个token的处理都需要消耗计算资源,处理的token数量越多,计算量会呈平方级增长。ü OpenAI、Anthropic、字节跳动等基模厂商的主流商业模式包括C端订阅/付费/间接和B端行业客户/API调用。同时,tokens是模型变现中的最小单位,厂商主要围绕tokens定价。ü 模型厂商以tokens为主要定价单位的底层逻辑是算力投入,模型调用时的tokens消耗量与相应算力投入存在强关联性。ü 模型厂商营收正与其tokens调用量呈现显著同步的高增趋势,特别是对于OpenAI、Anthropic,因为其商业模式为典型的C端订阅/付费和B端行业客户/API调用,收入与tokens调用量关系紧密。uTokens调用量应用端拆解:B+C双端ü今年来,受C端AI原生应用/AI功能等用户基础扩张及B端行业客户加速渗透驱动,Google、字节跳动、OpenAI等海内外头部模型厂商日均Tokens调用量持续增长。拆解来看:• C端驱动:包括原C端产品内部的附加AI功能、聊天助手、新兴应用(图像、视频、陪伴、办公、教育赛道);• B端驱动:包括行业企业客户、直接API调用。u展望:技术迭代解锁应用需求,算力投入加大模型厂预期乐观ü 大模型的技术迭代方向为推理增强+多模态+Agent化+长上下文,这样的技术迭代趋势将增强AI在更复杂、更具备“生产力”的关键场景下的实用性、准确性,使得AI应用加速落地,并且带来存量场景和增量场景的tokens增长空间。• 存量:“推理增强”将模型的一次性回答拆解为多步并进行多次调用;“多模态”需增加对图片、语音、视频等的编码解码;“Agent化”会在模型生成的过程中引入工具链;“长上下文”使得大型文档/项目可被全量处理而无需截断。• 增量:大量原本因“不准、不全、不落地”而被搁置的需求有望被解锁。当准确率、可控性跨过可行性线后,用户特别是B端企业(有生产力场景需求)或将从观望转为批量采购。ü 使用成本侧,模型厂进行了算力成本优化、多价格策略的尝试以压降大模型使用成本,企业/个人模型调用ROI得以提高。ü 2025年及以后,模型厂算力投入仍在加码并有望成为支撑千亿美元营收预期的核心。u投资建议:大模型技术迭代不断加速,B/C双端大量新应用场景将被解锁;国内AI应用公司成长主线明确,业绩提速在即;维持对AI应用方向“推荐”评级。u风险提示:宏观经济影响下游需求、人工智能产业发展不及预期、技术突破放缓、商业化进度不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期。请务必阅读报告附注中的风险提示和免责声明41、Tokens:模型定价的主要单位,与收入同步高增请务必阅读报告附注中的风险提示和免责声明5uTokens 是大语言模型(LLM)用来切割自然语言文本的基本单位,可以直观的理解为“字”或“词”。各大模型的切割规则不完全相同,通常1个中文词语、1个英文单词、1个数字或1个符号计为1个 token,并赋予相应的数字编号。一般情况下, token 和字数的换算比例大致为——1个英文字符≈0.4个token、1个中文字符≈0.5至1个token,可以近似地认为一个汉字就是一个 token。uTokens调用量本质反映大语言模型计算量。大语言模型将输入文本切割为tokens,并转换为相应数字编码,经模型内部推理计算后,最终以一连串tokens的形式进行文本输出。在这个过程中,token是计算的基本单位,模型对每个token的处理都需要消耗计算资源,处理的token数量越多,计算量会呈平方级增长。因此,tokens调用量本质反映了模型推理过程的计算量。资料来源:AI大模型开发与实践公众号,DeepSeek官网图:大语言模型输入过程:将输入文本切割为token,再转化为向量进行处理图:DeepSeek V3.1的输出:最大输出长度为8k/64k tokens请务必阅读报告附注中的风险提示和免责声明6uOpenAI、Anthropic、字节跳动等基模厂商的主流商业模式包括C端订阅/付费/间接和B端行业客户/API调用:1)C端:原生聊天助手、工具类原生应用(影视、图片、编程等)的订阅收入、付费功能以及与内部C端产品整合后的间接收入(如Google Chrome);2)B端:为大客户落地AI应用、企业直接API调用。uTokens是模型变现中的主要单位,厂商主要围绕tokens定价:无论是C端打包收费还是B端按量计价,模型厂商定价都以tokens为核心单位。资料来源:非凡产研公众号,量子位公众号,第一财经YiMagazine,超算百科公众号,CMAI-Hub,阿里云开发者,36Kr、腾讯网,e公司,海豚投研,腾讯科技,OpenAI开发者社区,中新网浙江,OpenAI官网,国海证券研究所图:基模厂商主流商业模式图:围绕tokens的定价方式,以OpenAI为例C端打包收费,有使用限制B端API按量计价,并设置多样化策略,轻量级的mini、nano每百万tokens输入/输出价格更便宜C端原生聊天助手订阅/付费ChatGPT、Gemini APP、豆包APP等工具类原生应用订阅/付费包括影视(Flow、即梦等)、图片(Whisk、醒图/星绘)、办公、编程(Claude Code)等类别整合后的间接收入例如谷歌搜索整合AI Overview功能后提升了用户活跃度并使得广告收入增长B端行业大客户Google发布“全球601个领先企业AI应用案例”报告、火山引擎原动力大会明确以低价换企业市场,宣传“好模型让每家企业用得起”直接API调用各模型厂AI开放平台上汇聚大量开发者(特别是Anthropic,以企业级API为收入主力)请务必阅读报告附注中的风
[国海证券]:计算机行业大模型及AI应用专题:从Tokens角度跟踪AI应用落地进展,点击即可下载。报告格式为PDF,大小3.26M,页数30页,欢迎下载。
