软件与服务行业AI产业速递:Kimi发布k1.5新模型,国产模型推理性能飞跃

请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业速递: Kimi 发布 k1.5 新模型,国产模型推理性能飞跃 报告要点 [Table_Summary]继 2024 年 11 月发布 k0-math 数学模型、12 月发布 k1 视觉思考模型后,2025 年 1 月 20 日,Kimi 再次发布 k 系列强化学习模型升级进展。最新 k1.5 多模态思考模型的基准测试成绩显示其已达到 SOTA 级别的多模态推理和通用推理能力。近期推理模型的密集发布说明 AI 军备竞赛仍在持续,随着 AI 技术持续演进,推理大模型或在某些场景展现出接近 AGI 的能力,有望加速 AI 应用落地。建议关注:1)中国领先的 AI 大模型厂商,重点推荐国产大模型领军企业科大讯飞;2)中国推理算力产业链,重点推荐国内 AI 芯片领军企业寒武纪。 分析师及联系人 [Table_Author] 宗建树 宋浪 SAC:S0490520030004 SFC:BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业速递:Kimi 发布 k1.5 新模型,国产模型推理性能飞跃 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 继 2024 年 11 月发布 k0-math 数学模型、12 月发布 k1 视觉思考模型后,2025 年 1 月 20 日,Kimi 再次发布 k 系列强化学习模型升级进展。最新 k1.5 多模态思考模型的基准测试成绩显示其已达到 SOTA 级别的多模态推理和通用推理能力。 事件评论 ⚫ k1.5 的开发过程主要有“预训练--原版监督微调--long-CoT 监督微调--强化学习”四大阶段。提升模型推理能力的主要方向在于基于强化学习的 reward model 方式不断完善思路链、提升性能,Kimi 在此基础上进行优化并推出 k1.5 模型,其设计与训练的关键要素包括:1)上下文扩展:长文本能力一直是 kimi 的优势所在,k1.5 成功将强化学习(RL)的上下文窗口扩展到 128k,并实现随着上下文长度增加模型性能攀升。2)优化策略:Kimi 推导出了 long-CoT 的 RL 公式,并通过有效采样策略、长度惩罚和数据配方等方式进行优化。3)简洁的框架:基于扩展上下文长度的能力,学习到的思维链具备规划、反思、修正等特点,避免了蒙特卡洛树搜索、价值函数和过程奖励模型等复杂技术,进而使框架更加简洁。4)多模态能力:由于 k1.5 在文本和视觉数据上联合训练,因而具有联合推理两种模态的能力。 ⚫ k1.5 多模态思考模型的基准测试成绩显示其已达到 SOTA 级别的多模态推理和通用推理能力。从模型测试结果看,k1.5 模型的两大版本均具备领先的推理性能:1)long-CoT 版本测试结果:AIME 为 77.5,MATH 500 为 96.2,Codeforces 为 94%分位水平,MathVista为 74.9,各项成绩比肩 OpenAI 的 o1 模型;2)short-CoT 版本测试结果:AIME 为 60.8,MATH 500 为 94.6,LiveCodeBench 为 47.3,表现显著优于现有的 short-CoT 模型,例如 GPT-4o 和 Claude Sonnet 3.5。 ⚫ 后训练时代模型加速升级,推理能力逐渐向 AGI 迈进,有望加速 AI 应用落地。随着训练数据的穷尽,预训练缩放定律法则的边际效益开始递减,基于强化学习的后训练逐渐成为模型推理能力提升的主要路径。从时间线及效果来看,2024 年 9 月 OpenAI 率先发布 o1系列模型,证明模型在经过强化学习训练后可以带来推理能力显著提升。随后各大模型厂商以此为标本进行研发追赶,12 月 20 日 Google 推出 Gemini 2.0 Flash Thinking 与 o1竞争,1 天后 OpenAI 发布 o3 和 o3-mini 推理系列模型再度宣告身位领先。聚焦国内,以 DeepSeek 与 Kimi 为代表的模型厂商持续追赶,频繁发布新产品。各自最新模型的推理能力已对齐海外并在价格上具备性价比优势。近期推理模型的密集发布说明 AI 军备竞赛仍在持续,随着 AI 技术持续演进,推理大模型或在某些场景展现出接近 AGI 的能力,有望加速 AI 应用落地。 ⚫ 投资建议:看好推理算力与应用侧受益。一方面,国产推理模型持续迭代,推理侧的 scaling up 将带来推理算力需求的显著提升;另一方面,模型能力的提升有望加速 AI 应用落地进程。建议关注:1)中国领先的 AI 大模型厂商,重点推荐国产大模型领军企业科大讯飞;2)中国推理算力产业链,重点推荐国内 AI 芯片领军企业寒武纪。 ⚫议关注:1)中国领先的 AI 大模型厂商,重点推荐国产大模型领军科大讯飞;2)中国推理算力产业链,重点推荐国内 AI 芯片领军寒武纪。风险提示 1、AI 技术发展不及预期;2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《算力产业跟踪:太行算力中心二期获批,字节算力布局持续升级》2025-01-21 •《Neuralink 完成第三例人体手术,脑机接口商业化稳步推进》2025-01-17 •《国家层面系统规划,数据标注产业有望加速发展》2025-01-16 -20%2%24%47%2024/12024/52024/92025/1软件与服务沪深300指数2025-01-22%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 7 行业研究 | 点评报告 图 1:Kimi-k1.5 模型性能比肩 o1 模型(long-CoT 模式) 资料来源:Kimi 官方公众号,长江证券研究所 图 2:Kimi-k1.5 模型性能比肩 o1 模型(Short-CoT 模式) 资料来源:Kimi 官方公众号,长江证券研究所 %%research.95579.com3 请阅读最后评级说明和重要声明 4 / 7 行业研究 | 点评报告 图 3:Kimi k 系列模型路线图 资料来源:Kimi 官方公众号,长江证券研究所 %%%%%%%%research.95579.com4 请阅读最后评级说明和重要声明 5 / 7 行业研究 | 点评报告 风险提示 1、AI 技术发展不及预期,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,投入厂商仍然存在失败风险。 2、下游应用需求不及预期,人工智能本质是通过供给创新催生需求扩容,目前大模型仍处于商业模式摸索期,倘若本轮技术变革无法真实带动下游需求,投

立即下载
信息科技
2025-01-23
长江证券
7页
0.84M
收藏
分享

[长江证券]:软件与服务行业AI产业速递:Kimi发布k1.5新模型,国产模型推理性能飞跃,点击即可下载。报告格式为PDF,大小0.84M,页数7页,欢迎下载。

本报告共7页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共7页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
过去一周涨幅前十个股(%) 图 3:过去一周跌幅前十个股(%)
信息科技
2025-01-23
来源:通信行业周报:CPO引领数据互联发展热潮,多环节设备商有望受益
查看原文
中信一级行业周涨幅(%)
信息科技
2025-01-23
来源:通信行业周报:CPO引领数据互联发展热潮,多环节设备商有望受益
查看原文
台积电分制程收入情况 图 10:台积电先进制程收入占比
信息科技
2025-01-23
来源:软件与服务行业美股科技股观察|24Q4业绩跟踪:台积电业绩强劲,AI需求高增长,未来五年指引乐观
查看原文
台积电分地区营收结构
信息科技
2025-01-23
来源:软件与服务行业美股科技股观察|24Q4业绩跟踪:台积电业绩强劲,AI需求高增长,未来五年指引乐观
查看原文
台积电分业务收入情况 图 7:台积电分业务收入同比增速
信息科技
2025-01-23
来源:软件与服务行业美股科技股观察|24Q4业绩跟踪:台积电业绩强劲,AI需求高增长,未来五年指引乐观
查看原文
台积电毛利率、利润率变动情况 图 5:台积电费用率变动情况
信息科技
2025-01-23
来源:软件与服务行业美股科技股观察|24Q4业绩跟踪:台积电业绩强劲,AI需求高增长,未来五年指引乐观
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起