计算机行业投资策略周报:Kimi发布多模态思考模型k1.5,对标OpenAI o1

计算机/ 行业投资策略周报/ 2025.01.25 请阅读最后一页的重要声明! Kimi 发布多模态思考模型 k1.5,对标 OpenAI o1 证券研究报告 投资评级:看好(维持) 最近 12 月市场表现 分析师 杨烨 SAC 证书编号:S0160522050001 yangye01@ctsec.com 分析师 王妍丹 SAC 证书编号:S0160524040002 wangyd01@ctsec.com 相关报告 1. 《豆包大模型更新至 1.5-pro,更真实、更懂你 》 2025-01-24 2. 《DeepSeek-R1:强化学习+知识蒸馏,比肩 o1》 2025-01-22 3. 《一文读懂美国 BIS 最新禁令》 2025-01-19 核心观点 ❖ Kimi 发布多模态思考模型 k1.5。2025 年 1 月 20 日,Kimi 发布了多模态思考模型 k1.5,并且模型性能直接对标 OpenAI 满血版 o1,在数学、代码、多模态推理能力等方面全方面追平,是 OpenAI 之外首个多模态 o1 模型。这是继去年 11 月他们发布 k0-math 数学模型,12 月发布 k1 视觉思考模型之后,连续第三个月带来 k 系列强化学习模型的升级。根据 Kimi 发布的技术报告,在 LongCoT 模式下,Kimik1.5 的数学、代码、多模态推理能力,达到了长思考 SOTA 模型 OpenAIo1 满血版的水平。这也是全球范围内,首次有 OpenAI之外的公司达到。而在 ShortCoT 模式下,Kimik1.5 大幅领先 GPT-4o 和Claude3.5 的水平。 ❖ 通过强化学习,实现高效长上下文 RL 训练。传统语言模型的预训练依赖“下一个词预测”范式,其性能受限于高质量静态数据的规模。尽管计算资源的扩展遵循 Scaling Law,但数据瓶颈日益显著。为此,Kimi 提出通过强化学习(Reinforment Learning,后文简称 RL)解锁新维度:模型通过探索生成数据并基于奖励信号优化,突破静态数据限制。Kimi k1.5 的核心目标是通过 RL和多模态训练,构建一个兼具长上下文推理能力与高效部署潜力的模型。 ❖ 引入 Partial rollout 技术,优化复杂推理能力。Kimi 团队在模型训练中引入了“部分展开(Partial Rollout)”技术,该技术有效地提高了训练效率,通过复用训练轨迹(存储在 replay buffer 中),减少了计算资源的浪费。每一次训练迭代不仅包括模型的展开和储存,还能在下次迭代中继续利用之前的计算结果,确保效率的同时降低了资源消耗。这样的设计在需要处理长序列任务时,表现尤其突出。特别地,Kimi 团队还在奖励模型中单独加入了代码执行服务,以提升编码领域的任务能力。 ❖ 投资建议:建议重点关注基础设施领域的公司,如英伟达、海光信息、寒武纪、协创数据、英维克、中科曙光、浪潮信息、润泽科技、欧陆通、曙光数创、申菱环境、东阳光等,同时持续关注全球各大模型厂商、学界的创新进展。 ❖ 风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。 单击或点击此处输入文字。 -23%-11%2%14%27%39%计算机沪深300 谨请参阅尾页重要声明及财通证券股票和行业评级标准 2 行业投资策略周报/证券研究报告 1 Kimi 发布多模态思考模型 k1.5,性能对标满血 o1 ............................................................................ 3 2 通过强化学习,实现高效长上下文 RL 训练 ....................................................................................... 4 2.1 k1.5 模型训练的关键要素 .................................................................................................................. 4 2.2 技术创新:引入 Partial rollout 技术,实现高效的长上下文 RL 训练 ........................................ 5 3 投资建议 ................................................................................................................................................... 7 4 风险提示 ................................................................................................................................................... 7 图 1. Kimi k1.5 发布 ........................................................................................................................................ 3 图 2. Kimi k1.5 long-CoT results.................................................................................................................... 3 图 3. Kimi k1.5 short-CoT results .................................................................................................................. 4 图 4. 长链到短链的性能表现:所有 Kimik1.5 系列模型都展示了比其他模型更好的标记效率 ........... 5 图 5. 面向大型语言模型的大规模强化学习训练系统 ................................................................................. 6 图 6. 混合部署框架 ...................................................................................................................................

立即下载
电子设备
2025-01-26
财通证券
8页
0.97M
收藏
分享

[财通证券]:计算机行业投资策略周报:Kimi发布多模态思考模型k1.5,对标OpenAI o1,点击即可下载。报告格式为PDF,大小0.97M,页数8页,欢迎下载。

本报告共8页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共8页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
计算机重点公司估值表
电子设备
2025-01-26
来源:计算机行业周报:Agent+持仓,均有乐观信号!
查看原文
软件当前的风险偏好 图 9:嵌入式软件当前的风险偏好
电子设备
2025-01-26
来源:计算机行业周报:Agent+持仓,均有乐观信号!
查看原文
2014-2024 计算机(申万)PE 估值
电子设备
2025-01-26
来源:计算机行业周报:Agent+持仓,均有乐观信号!
查看原文
2014-2024 计算机行业 PS(TTM) 图 6:2014-2024 计算机行业 PCF(TTM)
电子设备
2025-01-26
来源:计算机行业周报:Agent+持仓,均有乐观信号!
查看原文
计算机(申万)2025.1.24 整体估值处于历史中上水平 PE(TTM) PS(TTM) PCF(TTM)
电子设备
2025-01-26
来源:计算机行业周报:Agent+持仓,均有乐观信号!
查看原文
24Q4 持仓市值超过 1 亿元,减仓比例前十大标的
电子设备
2025-01-26
来源:计算机行业周报:Agent+持仓,均有乐观信号!
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起