AI创新及互联网行业国产模型系列深度(3):月之暗面(Kimi),从长上下文到率先迈入万亿参数,Agentic可期
月之暗面(Kimi):从长上下文到率先迈入万亿参数,Agentic可期——国产模型系列深度(3)证券研究报告行业动态报告分析师:杨艾莉yangaili@csc.com.cn010-85156448SAC编号:S1440519060002SFC编号:BQI330发布日期:2026年6月8日本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。分析师:杨晓玮yangxiaowei@csc.com.cnSAC编号:S1440523110001分析师:马晓婷maxiaoting@csc.com.cnSAC编号:S14405250700131核心观点月之暗面(Moonshot AI)成立于2023年3月。同年10月,公司以中文200万字长文本能力被市场关注,Kimi智能助手开始逐步在C端破圈。2024年公司加大投放并上线会员订阅,整体MAU一度高达3600万,成为第一批国产Chatbot中的顶流之一。2025年随着DeepSeek-R1的上线,公司开始停止投放流量,回归模型层面的研发,2025年7月推出Kimi k2模型,是国内首个万亿参数的开源MoE模型,开始深耕Coding与Agentic场景。2026年1月Kimi K2.5版本发布,模型能力进一步提升。进入2026年,根据媒体报道公司ARR快速增长,3月初突破1亿美元,4月继续增长至超 2 亿美元。根据华峰资本,Kimi最新估值超200亿美金。2投资逻辑一、Kimi的长上下文基因与早期对C端的探索1、Kimi的模型Taste,很大程度来自创始人杨植麟及其清华系创始团队的技术背景。杨植麟在清华与CMU攻读计算机期间师承顶级 AI学者,包括现Apple AI首席研究员与Google AI首席科学家。在2019年发布的两篇论文,是现代长上下文技术的奠基性论文之一(Transformer XL 和 XLNet,被引用超过1万次),我们认为这也是其创立月之暗面坚持长上下文思想的来源。其他核心创始人,张宇韬/周昕宇/吴育昕(联合创始人)都出身清华计算机系,团队技术功底强。2、2024年,Kimi以长上下文率先突围国产Chatbot,获得用户认可。2023年10月,Kimi的模型就主打全球最长20万汉字无损上下文,在“百模大战”初期就凭借差异化快速突围。2024年4月到10月,是Kimi投放最激进的半年,当时Kimi、豆包、元宝并称AI三大投流大户,有数据统计24年10月单月行业三家投流总额超过30亿元人民币。24年10月Kimi的MAU冲至3600万,位列当时国产Chatbot第一梯队。二、25年战略转型,聚焦模型训练,推出K2正式迈入万亿参数俱乐部1、2025年2月DeepSeek推出后,Kimi宣布暂停投放,公司战略资源重新聚焦模型训练。我们认为第一阶段Kimi 在C端的尝试虽然没有大获全胜,但早期就显示出与其他国产模型气质不同之处:有技术基础的同时也具备对商业的敏锐度,在与阿里/腾讯共同竞争环境下,也仍然能在用户侧获取不小声量。2、K2模型的重要转折:首个1T参数的开源国产模型。2024年,市场开始担心大模型智能水平和Scaling Law接近上限,部分公司转而走向小而美的性价比路线。而Kimi坚信Scaling Law,K2是首个1T参数的开源国产模型。作为一家独角兽,Kimi训练1T量级参数的大模型需要非常强的工程化能力压缩Logit ️,K2的MuonClip优化器引入了QK-Clip机制,是目前公开文献万亿参数级MoE模型训练稳定性的优秀记录。3投资逻辑3、K2.5/2.6的推理优化能力优秀,KV优化,以及Agent Swarm集群。26年的K2.5是K系列首个原生多模态旗舰,在维持万亿参数规模的同时引入自研视觉编码器MoonViT-3D,实现纯语言到原生多模态的架构跨越。能力重心向代码与Agentic方向集中发力。K2.6又引入Agent Swarm,单次会话最多调度300个子 Agent、协调4000 步,相比K2.5的100个子 Agent /1500步,分别增长200%/167%。4、对比其他国产模型:与智谱定价同梯队,Coding和Agentic能力强。K2.6模型的定价为输入$0.95/输出$4.00/每百万tokens,是DeepSeekV4-Pro($0.14输入)的7倍、MiniMaxM2.5($2.40输出)的1.7倍。如果对标海外仍比GPT-5.2、ClaudeSonnet4.6便宜1/2至1/4。K2.5的SWE-bench Verified得分76.8%,超越同期主流闭源模型,标志着Kimi从“规模突破”转向“能力落地”。三、商业化&估值:26年ARR攀升,最新估值超200亿美金1、ARR:在2025年7月K2开源之前Kimi的商业化相对平缓。26年3月随着K2.5的发布,ARR突破1亿美金,4月ARR进一步环比翻倍至2亿美金。2、海外市场对Kimi非常重要,主要通过三类渠道触达用户:1)主流公有云,有效触达B端企业客户,已入驻AWS Bedrock、GCP Vertex AI、Azure Foundry;2)推理优化平台,对延迟和成本敏感的规模化开发者,目前已接入Groq、TogetherAI、Fireworks AI、SiliconFlow等;3)各类CodingAgent,对接日常普通个人开发者,目前已集成在Cursor、Cline、Roo Code等AI编程工具。3、最新估值攀升至200亿美金。2026年5月Kimi完成最新一轮20亿美元扩展轮融资,投后估值达200亿美元,股东汇聚阿里、腾讯、美团等核心投资方。目前,Kimi 创立至今已累计融资超过 50 亿美金,这一数字基本上在一众国产模型(IPO前累计融资额)中名列前茅。4投资逻辑展望未来,我们认为 Kimi 的潜力巨大:1)公司是国内第一批迈向1T等超大参数训练的开源模型之一,核心团队坚信 scaling law并追求智能的绝对上限。我们认为随着Kimi后续推出更大规模参数模型(K3),公司模型能力的提升将持续。2)基模能力强+Harness强。其KV与Agent Swarm等算法与工程成本优化能力强,对于未来抢占 Coding 和Agentic 市场具备优势。3)从早年公司愿意砸钱与阿里腾讯共同抢占C端,证明其对商业敏感且愿意下注,这在后续大模型马拉松式的商业化竞争中将展现其长远的价值和意义。5目录1Kimi长上下文基因与早期C端探索2K2/2.5的转折为何重要:研发和工程化的差异优势3商业化与估值走到了哪一步?6Kimi(月之暗面):国产模型Tier 1,初期C端破圈,深耕Coding与Agentic 月之暗面(Moonshot AI)成立于2023年3月。同年10月公司以中文200万字长文本能力破圈,Kimi智能助手开始逐步在C端获得用户认可。2024年公司加大投放并上线会员订阅,整体MAU一度高达3600万,成为第一批国产Chatbot头部产品。2025年随着DeepSeek-
[中信建投]:AI创新及互联网行业国产模型系列深度(3):月之暗面(Kimi),从长上下文到率先迈入万亿参数,Agentic可期,点击即可下载。报告格式为PDF,大小3.32M,页数28页,欢迎下载。



