软件与服务行业AI产业速递：Kimi发布k1.5新模型，国产模型推理性能飞跃

请阅读最后评级说明和重要声明丨证券研究报告丨行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业速递： Kimi 发布 k1.5 新模型，国产模型推理性能飞跃报告要点 [Table_Summary]继 2024 年 11 月发布 k0-math 数学模型、12 月发布 k1 视觉思考模型后，2025 年 1 月 20 日，Kimi 再次发布 k 系列强化学习模型升级进展。最新 k1.5 多模态思考模型的基准测试成绩显示其已达到 SOTA 级别的多模态推理和通用推理能力。近期推理模型的密集发布说明 AI 军备竞赛仍在持续，随着 AI 技术持续演进，推理大模型或在某些场景展现出接近 AGI 的能力，有望加速 AI 应用落地。建议关注：1）中国领先的 AI 大模型厂商，重点推荐国产大模型领军企业科大讯飞；2）中国推理算力产业链，重点推荐国内 AI 芯片领军企业寒武纪。分析师及联系人 [Table_Author] 宗建树宋浪 SAC：S0490520030004 SFC：BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明丨证券研究报告丨更多研报请访问长江研究小程序软件与服务 cjzqdt11111 [Table_Title2] AI 产业速递：Kimi 发布 k1.5 新模型，国产模型推理性能飞跃行业研究丨点评报告 [Table_Rank] 投资评级看好丨维持 [Table_Summary2] 事件描述继 2024 年 11 月发布 k0-math 数学模型、12 月发布 k1 视觉思考模型后，2025 年 1 月 20 日，Kimi 再次发布 k 系列强化学习模型升级进展。最新 k1.5 多模态思考模型的基准测试成绩显示其已达到 SOTA 级别的多模态推理和通用推理能力。事件评论 ⚫ k1.5 的开发过程主要有“预训练--原版监督微调--long-CoT 监督微调--强化学习”四大阶段。提升模型推理能力的主要方向在于基于强化学习的 reward model 方式不断完善思路链、提升性能，Kimi 在此基础上进行优化并推出 k1.5 模型，其设计与训练的关键要素包括：1）上下文扩展：长文本能力一直是 kimi 的优势所在，k1.5 成功将强化学习（RL）的上下文窗口扩展到 128k，并实现随着上下文长度增加模型性能攀升。2）优化策略：Kimi 推导出了 long-CoT 的 RL 公式，并通过有效采样策略、长度惩罚和数据配方等方式进行优化。3）简洁的框架：基于扩展上下文长度的能力，学习到的思维链具备规划、反思、修正等特点，避免了蒙特卡洛树搜索、价值函数和过程奖励模型等复杂技术，进而使框架更加简洁。4）多模态能力：由于 k1.5 在文本和视觉数据上联合训练，因而具有联合推理两种模态的能力。 ⚫ k1.5 多模态思考模型的基准测试成绩显示其已达到 SOTA 级别的多模态推理和通用推理能力。从模型测试结果看，k1.5 模型的两大版本均具备领先的推理性能：1）long-CoT 版本测试结果：AIME 为 77.5，MATH 500 为 96.2，Codeforces 为 94%分位水平，MathVista为 74.9，各项成绩比肩 OpenAI 的 o1 模型；2）short-CoT 版本测试结果：AIME 为 60.8，MATH 500 为 94.6，LiveCodeBench 为 47.3，表现显著优于现有的 short-CoT 模型，例如 GPT-4o 和 Claude Sonnet 3.5。 ⚫ 后训练时代模型加速升级，推理能力逐渐向 AGI 迈进，有望加速 AI 应用落地。随着训练数据的穷尽，预训练缩放定律法则的边际效益开始递减，基于强化学习的后训练逐渐成为模型推理能力提升的主要路径。从时间线及效果来看，2024 年 9 月 OpenAI 率先发布 o1系列模型，证明模型在经过强化学习训练后可以带来推理能力显著提升。随后各大模型厂商以此为标本进行研发追赶，12 月 20 日 Google 推出 Gemini 2.0 Flash Thinking 与 o1竞争，1 天后 OpenAI 发布 o3 和 o3-mini 推理系列模型再度宣告身位领先。聚焦国内，以 DeepSeek 与 Kimi 为代表的模型厂商持续追赶，频繁发布新产品。各自最新模型的推理能力已对齐海外并在价格上具备性价比优势。近期推理模型的密集发布说明 AI 军备竞赛仍在持续，随着 AI 技术持续演进，推理大模型或在某些场景展现出接近 AGI 的能力，有望加速 AI 应用落地。 ⚫ 投资建议：看好推理算力与应用侧受益。一方面，国产推理模型持续迭代，推理侧的 scaling up 将带来推理算力需求的显著提升；另一方面，模型能力的提升有望加速 AI 应用落地进程。建议关注：1）中国领先的 AI 大模型厂商，重点推荐国产大模型领军企业科大讯飞；2）中国推理算力产业链，重点推荐国内 AI 芯片领军企业寒武纪。 ⚫议关注：1）中国领先的 AI 大模型厂商，重点推荐国产大模型领军科大讯飞；2）中国推理算力产业链，重点推荐国内 AI 芯片领军寒武纪。风险提示 1、AI 技术发展不及预期；2、下游应用需求不及预期。市场表现对比图(近 12 个月) 资料来源：Wind 相关研究 [Table_Report]•《算力产业跟踪：太行算力中心二期获批，字节算力布局持续升级》2025-01-21 •《Neuralink 完成第三例人体手术，脑机接口商业化稳步推进》2025-01-17 •《国家层面系统规划，数据标注产业有望加速发展》2025-01-16 -20%2%24%47%2024/12024/52024/92025/1软件与服务沪深300指数2025-01-22%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 7 行业研究 | 点评报告图 1：Kimi-k1.5 模型性能比肩 o1 模型（long-CoT 模式）资料来源：Kimi 官方公众号，长江证券研究所图 2：Kimi-k1.5 模型性能比肩 o1 模型（Short-CoT 模式）资料来源：Kimi 官方公众号，长江证券研究所 %%research.95579.com3 请阅读最后评级说明和重要声明 4 / 7 行业研究 | 点评报告图 3：Kimi k 系列模型路线图资料来源：Kimi 官方公众号，长江证券研究所 %%%%%%%%research.95579.com4 请阅读最后评级说明和重要声明 5 / 7 行业研究 | 点评报告风险提示 1、AI 技术发展不及预期，本次大模型创新伴随参数量及模态的增速能力天花板尚未达到，但模型效果本身仍存瓶颈及问题，倘若 AI 技术发展不及预期，投入厂商仍然存在失败风险。 2、下游应用需求不及预期，人工智能本质是通过供给创新催生需求扩容，目前大模型仍处于商业模式摸索期，倘若本轮技术变革无法真实带动下游需求，投

立即下载

信息科技

2025-01-23

长江证券

7页

0.84M

[长江证券]:软件与服务行业AI产业速递：Kimi发布k1.5新模型，国产模型推理性能飞跃，点击即可下载。报告格式为PDF，大小0.84M，页数7页，欢迎下载。

本报告共7页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共7页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

软件与服务行业AI产业速递：Kimi发布k1.5新模型，国产模型推理性能飞跃

关于我们

联系我们