2026年计算机行业中期策略:从训练到推理时代的拐点
从训练到推理时代的拐点——2026年计算机行业中期策略分析师:郑宏达 S0800524020001 邮箱地址:zhenghongda@research.xbmail.com.cn分析师:谢忱S0800524040005 邮箱地址:xiechen@research.xbmail.com.cn分析师:李想S0800525040006 邮箱地址:lixiang@research.xbmail.com.cn分析师:卢可欣 S0800525080006 邮箱地址:lukexin@research.xbmail.com.cn分析师:王朗S0800526040009 邮箱地址:wanglang@research.xbmail.com.cn西部证券研发中心 2025年6月17日证券研究报告请务必仔细阅读报告尾部的投资评级说明和声明核心结论22026年是AI从训练转向推理主导的拐点。OpenClaw、ClaudeCode等开源与闭源Agent框架以燎原之势迅速普及,算力的应用从训练走向智能体等推理需求主导,从问答模式走向智能体循环,从单轮生成升级为多步规划、持续执行,推理首超训练成为算力需求的重心。进入推理时代,算力基础设施的核心关注点是Token成本的低延迟、调度算法和缓存管理,通过极致优化实现高效服务。在芯片层,以Groq LPU为代表的专用推理芯片兴起,推动推理能力和效率普惠,并与GPU结合进行异构计算,实现性能互补;在网络互联层,超节点以高速互联、内存池化、高度集成等优势精准适配推理高并发、实时交互和大显存消耗需求,助推系统向万卡集群演进,以太网交换机凭借其普适性和经济性,有望成为AI时代数据中心网络架构的主流选择。模型层面,Claude Opus 4.8、GPT 5.5、GLM-5.1、DeepSeek V4、Minimax-M3等前沿模型密集发布,模型迭代节奏进一步加快,模型能力提升聚焦agent、coding与多模态,进一步迈向生产力级别的智能。展望2026年下半年:芯片、互联、算力,技术进步与整体需求依旧蓬勃发展,模型能力的边界有望进一步拓展,助推AI应用的深度和广度持续提升。建议关注方向:1)国内外模型商业化提速,规模化应用有望带动Tokens消耗高增,继续看好AI算力。 2)国产模型能力持续提升,具备性能和性价比优势,继续看好国产模型厂商。3)模型应用有望在B端、C端持续展开,看好具备垂直行业know-how的AI应用厂商。风险提示:AI 技术突破不及预期;大模型应用落地节奏不及预期;宏观经济增长不及预期,IT预算不及预期;国际环境发生变化。行业评级超配前次评级超配评级变动维持相对表现 1个月 3个月 12个月计算机-11.21 -11.241.07沪深3001.486.34 27.41近一年行业走势-4%1%6%11%16%21%26%31%计算机沪深300CONTENTS目录CONTENTS目 录推理时代需要怎样的硬件和软件架构体系推理时代的模型层投资建议010203智能体框架流行,推理时代开始风险提示0405请务必仔细阅读报告尾部的投资评级说明和声明推理算力占比快速提升,2026年首超训练成为算力主体4•推理首超训练,算力重心发生根本性转移:AI模型生命周期分训练与推理两段——训练是“一次性建厂”式的集中投入,模型一旦定型、成本即趋于收敛;推理则是“7×24永续调用”,每一次用户请求、每一步Agent任务都在持续消耗算力,需求随用户普及与智能体长任务能力快速增长。算力的应用从训练走向推理主体及智能体主导,算力的架构技术、应用场景、商业模式等发生显著变化:从阅读检索到深度思考从单轮生成升级为多步规划、持续执行;算力架构从注意力经济到生产力经济;智能体驱动从被动问答转向主动任务执行;部署形态从纯云端走向“云—边—端”协同;商业模式从成本中心到价值引擎。•根据麦肯锡公司,预计到2030年推理将超越训练,占到全球数据中心AI算力需求的一半以上,推理侧将成为未来几年算力投资的重要增量。•中国推理需求倍数更高:在国产替代与应用落地的双重驱动下,中国推理需求扩张较全球更为剧烈,邬贺铨院士指出中国推理需求已达训练的8倍。同时,推理对单卡算力的要求低于训练,更看重成本、能效与规模化部署,推理有望成为国产算力厂商确定性更高的突围窗口。资料来源:IDC《2025年中国人工智能计算力发展评估报告》、麦肯锡官网、 西部证券研发中心图:全球数据中心负载规模及预测(2025-2030)图:中国AI服务器工作负载中训练与推理的比例(2024-2028)请务必仔细阅读报告尾部的投资评级说明和声明Token调用量与日俱增,国产开源模型成为全球推理新主力5•Token调用量伴随推理需求指数级放大:AI工作重心从训练转向推理、再转向Agent,频繁的工具调用、多步规划与长程执行不断拉长模型的输出链路,单次任务的Token消耗相比单轮对话是数量级的差距。全球知名的多模型聚合平台OpenRouter为全球超过800万用户,提供涵盖Anthropic、Google、OpenAI、xAI和DeepSeek等领先AI供应商的400多个模型访问,是观察全球真实推理调用的窗口。根据OpenRouter官方,该平台的周Token处理量已从2025年11月的约5万亿激增至2026年5月的25万亿(约100万亿/月),半年增长了5倍。•国产模型在agent调用方面性价比凸显:开源模型与闭源模型形成稳定“双轨”结构——闭源定义性能与可靠性上限,开源以成本、透明与性价比优势承接agent时代的大规模推理负载。PinchBench专门针对OpenClaw任务对大模型进行基准测试:在成功率方面,Qwen3.7达到92.5%,仅次于第一名的ClaudeOpus4.8,Mimo-v2.5、Deepseekv4等国产开源模型也排名靠前。资料来源:OpenRouter 官网、西部证券研发中心图:OpenRouter 周度 Token 处理量及月度模型调用量排名请务必仔细阅读报告尾部的投资评级说明和声明Agent框架广泛流行,智能体循环主导推理需求6•从单次对话到智能体循环:AI模型的使用形态正在从“单轮文本补全”转向“多步骤、工具集成且推理密集型的工作流”,LLM请求的不仅仅是简单的问题或孤立指令,而是结构化的、类似智能体的循环的一部分,调用外部工具、对状态进行推理,并在更长的上下文中持续运行。•OpenClaw为代表的开源Agent框架崛起:OpenClaw诞生于2025年底,是一款开源的AI智能体框架,在四个月内登顶Github软件项目星标榜史上第一。它能主动调用工具、访问网络、操作软件、发送消息,可持续在后台运行,像一个永不下班的私人助理OpenClaw的核心能力:底层的操作系统级访问(终端命令、文件读写、进程管理)、中间层的应用程序控制(浏览器自动化、邮件客户端操作、即时通讯接入),以及上层的多步骤任务编排(将复杂目标拆解为子任务并自主执行)。OpenClaw在技术栈中占据了一个前所未有的位置,一个能操控所有其他应用程序的智能代理。资料来源:OpenRouter官网、新智元公众号、西部证券研发中心图:OpenRout
[西部证券]:2026年计算机行业中期策略:从训练到推理时代的拐点,点击即可下载。报告格式为PDF,大小3.73M,页数25页,欢迎下载。



