软件与服务行业AI产业跟踪:月之暗面发布并开源Kimi K2 Thinking,关注国内大模型推理能力迭代进展

请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业跟踪:月之暗面发布并开源 Kimi K2 Thinking,关注国内大模型推理能力迭代进展 分析师及联系人 [Table_Author] 宗建树 刘思缘 SAC:S0490520030004 SFC:BUX668 报告要点 [Table_Summary]11 月 6 日,月之暗面正式发布了 Kimi K2 Thinking 模型,其为具有通用 Agentic 能力和推理能力的思考模型,擅长深度推理,可以通过多轮工具调用,解决各类复杂难题,是 Kimi 迄今能力最强的开源思考模型。Kimi K2 Thinking 是基于“模型即 Agent”理念训练的新一代 Thinking Agent,它原生掌握“边思考,边使用工具”的能力,无需人类干预,即可自主实现高达 300 轮的工具调用和持续稳定的多轮思考能力。考虑到当前成本仍为制约 token 消耗量的核心因素,Kimi K2 Thinking 的出现有望开辟降本新范式。继续看好国产 AI 产业链,持续重点推荐铲子股和卡位优势显著的巨头本身。 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业跟踪:月之暗面发布并开源 Kimi K2 Thinking,关注国内大模型推理能力迭代进展 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 11 月 6 日,月之暗面正式发布并开源 Kimi K2 Thinking 模型,MoE 架构,总参 1T,激活参数32B,上下文长度 256K,更好支持国产 GPU。 事件评论 ⚫ 能力全面提升,开闭源模型差距进一步收敛。定位基于“模型即 Agent”理念训练的新一代 Thinking Agent,原生掌握“边思考,边使用工具”的能力。(1)推理性能全面提升:HLE 测试中以 44.9%准确率超过 GPT-5(41.7%)取得 SOTA;(2)自主搜索与浏览能力:BrowseComp 测试得分 60.2% (人类平均得分 29.2%),超越 GPT-5(54.9%)拿下 SOTA ,此外在 BrowseComp-ZH、SEAL-0、FinSearchComp-T3 等基准测试中均拿下 SOTA 成绩。(3)Agentic 编程能力增强,在 Tau2 Bench Telecom 基准测试中,K2 Thinking 以 93%分位列第一,在 SWE-Multilingual、SWE-bench Verified、LiveCodeBench V6 测试得分为 61%、71%、83%,该模型在 HTML、React 等方面的任务上有了很明显的进步,并与 Claude Sonnet 4.5 和 GPT-5 不相上下。 ⚫ 受益于长程规划和自主搜索能力的提升,推理表现更稳定。K2 可借助多达上百轮的“思考→搜索→浏览网页→思考→编程”动态循环,持续地提出并完善假设、验证证据、进行推理,并构建出逻辑一致的答案,任务拆分更加清晰、可执行。从实测来看,面对复杂问题时,K2 Thinking 会自己拆解步骤、搜索信息、调用外部工具、再整合结果,团队把这种机制称为“交替思考”,让推理更连贯。 ⚫ 通用基础能力升级,是少数具有多工具调用能力的开源模型。在无人干预情况下,K2 Thinking 可连续调用 200-300 次工具,通过同时扩展思考 Token 和工具调用轮次,模型实现了更强的 Agent 和推理性能。我们认为,从交互到反思,K2 Thinking 实现多轮地使用工具,具备了 Agent 重要的特征。 ⚫ 工程落地层面,原生 INT4 量化提升推理效率与硬件兼容性。在后训练阶段采用了量化感知训练(QAT),并对 MoE 组件应用了 INT4 纯权重(weight-only)量化,使得 Kimi K2 Thinking 能够在复杂推理和 Agentic 任务中支持原生的 INT4 推理,并将生成速度提升了约 2 倍。低比特量化是降低大规模推理服务器的延迟和 GPU 显存占用的有效方法,INT4对推理硬件的兼容性更强,对国产加速计算芯片更友好,有望开辟国产模型降本新路线。 ⚫ 定价层面,价格与 KimiK2-0905 相同,输入 4 元/M tokens,输出 16 元/M tokens,命中缓存的输入为 1 元。速度高达 100 Token/s 的 Turbo API 也同步上架,输入 8 元/M tokens,输出 58 元/M tokens,命中缓存的输入为 1 元。模型定价略高于同期上新的 Minimax-M2。 ⚫ 关注模型后续发布。当前时点大模型技术仍在不断迭代,近期国内模型仍在技术侧不断演化,考虑到当前成本仍为制约 token 消耗量的核心因素,商业化落地需要进一步关注模型在降本层面的效果。继续看好国产 AI 产业链,持续重点推荐铲子股和卡位优势显著的巨头本身。风险提示 1、AI 技术发展不及预期; 2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《重仓超配比例仍回落,聚焦国产 AI 链主线--计算机行业 2025Q3 基金持仓分析》2025-11-05 •《2025 年第 44 周计算机行业周报:关注国产 AI应用出海投资机遇》2025-11-05 •《AI 产业已进入“良性循环”,全球算力基建持续加速》2025-11-03 -20%0%20%40%2024/112025/32025/72025/11软件与服务软件与服务沪深3002025-11-11%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 5 行业研究 | 点评报告 风险提示 1、AI 技术发展不及预期,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,投入厂商仍然存在失败风险。 2、下游应用需求不及预期,人工智能本质是通过供给创新催生需求扩容,目前大模型仍处于商业模式摸索期,倘若本轮技术变革无法真实带动下游需求,投入厂商将受到影响。 %research.95579.com3 请阅读最后评级说明和重要声明 4 / 5 行业研究 | 点评报告 投资评级说明 行业评级 报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 看 好: 相对表现优于同期相关证券市场代表性指数 中 性: 相对表现与同期相关证券市场代表性指数持平 看 淡: 相对表现弱于同期相关证券市场代表性指数 公司评级 报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级

立即下载
综合
2025-11-12
5页
0.64M
收藏
分享

软件与服务行业AI产业跟踪:月之暗面发布并开源Kimi K2 Thinking,关注国内大模型推理能力迭代进展,点击即可下载。报告格式为PDF,大小0.64M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
数据中心自建电源初始投资提升测算
综合
2025-11-12
来源:电力行业:美国缺电研究系列之六问六答
查看原文
数据中心共址自建电源的各个技术路线成本分析
综合
2025-11-12
来源:电力行业:美国缺电研究系列之六问六答
查看原文
火电缓退与加密货币负荷对缺电程度的影响分析
综合
2025-11-12
来源:电力行业:美国缺电研究系列之六问六答
查看原文
美国 2025-2030 年火电机组退役情况(GW) 图 6:美国加密货币挖矿设施分布情况(截至 2024 年 1 月)
综合
2025-11-12
来源:电力行业:美国缺电研究系列之六问六答
查看原文
数据中心或是 SAIDI 提升的重要因素
综合
2025-11-12
来源:电力行业:美国缺电研究系列之六问六答
查看原文
美国历年用户平均停电时长(min)
综合
2025-11-12
来源:电力行业:美国缺电研究系列之六问六答
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起