软件与服务行业AI产业跟踪:DeepSeek-V3.2-Exp发布,持续看好国内大模型商业化落地与出海趋势
请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业跟踪:DeepSeek-V3.2-Exp 发布,持续看好国内大模型商业化落地与出海趋势 报告要点 [Table_Summary]2025 年 9 月 29 日,DeepSeek-V3.2-Exp 正式发布,参数量 685B,系实验性(Experimental)版本,在 V3.1-Terminus 基础上引入 DSA(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方 App、网页端、小程序均已同步更新,API 大幅度降价。持续关注 DeepSeek 后续发布,模型使用成本的下降是持续性趋势,今年是模型实用性、全面性、Agent 能力、性价比提升核心的一年,后续有望持续促进垂类场景落地,并且带动云及硬件需求量提升,有望利好后续国内模型凭低成本出海趋势。 分析师及联系人 [Table_Author] 宗建树 刘思缘 SAC:S0490520030004 SFC:BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业跟踪:DeepSeek-V3.2-Exp 发布,持续看好国内大模型商业化落地与出海趋势 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 2025 年 9 月 29 日,DeepSeek-V3.2-Exp 正式发布,参数量 685B,系实验性(Experimental)版本,在 V3.1-Terminus 基础上引入 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方 App、网页端、小程序均已同步更新,API 大幅度降价。 事件评论 ⚫ 长文本训推效率显著优化。V3.2-Exp 定位“迈向新一代架构的中间步骤”,在此前发布的V3.1-Terminus 基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。DSA 核心机制:通过引入高效组件闪电索引器(Lightning Indexer)给历史词打分,挑出最相关的几个(top-k),只和这些词进行注意力计算。这样模型能抓住最重要的信息,核心注意力的计算复杂度从 O(L²)骤降至 O(Lk),算力大幅节省,由此训练和推理速度实现大幅提升,尤其在长文本场景下效果明显,且复杂度低,可用 FP8 实现,有望加速规模化落地。 ⚫ 成本降低促进落地,并且有望成为出海核心产品。V3.2-Exp 在实际部署的推理成本测试中,端到端的加速效果和成本节约非常显著,API 成本降低 50%以上。当前输入价格由¥0.5/M tokens→¥0.2/M tokens(缓存命中)、¥4/M tokens→¥2/M tokens(缓存未命中),输出价格¥12/M tokens→¥3/M tokens,模型竞争力极大提升。我们认为现阶段成本仍是现阶段制约 AI 大规模普及的核心因素,V3.2 大幅降本有助于国内 AI 普及率提升与出海竞争。 ⚫ 训练流程分阶段优化,兼顾效率与性能。V3.2-Exp 的训练流程分为两个阶段:首先在持续预训练中,先用 Dense Warm-up 让闪电索引器学会模仿完整注意力分布,再逐步切换到稀疏模式,让模型适应只关注最相关的 token;后训练中,结合专家蒸馏(从数学、编程、推理等领域专家模型提炼知识)和混合强化学习(一次性平衡推理、Agent 与对齐训练),保证模型在不同任务上稳健泛化。最终结果表明,无论在短文本还是长文本任务上,V3.2-Exp 的表现都与前一代密集注意力模型 V3.1-Terminus 基本持平,未出现实质性性能下降。我们认为这为大模型突破长文本瓶颈指明新工程路径与可复用的范式。 ⚫ V3.2-Exp 并非最终形态,而是从密集注意力迈向新一代高效架构的过渡版本,持续关注DeepSeek 后续发布。我们认为,模型使用成本的下降是持续性趋势,今年是模型实用性、全面性、Agent 能力、性价比提升核心的一年,后续有望持续促进垂类场景落地,并且带动云及硬件需求量提升,有望利好后续国内模型凭低成本出海趋势。强烈看好国内 AI应用货币化开启及 Agent 商业化投资机遇。建议关注:1)AI Infra;2)AI Agent 相关厂商;3)中国推理算力产业链;4)CSP 厂商方面关注推理需求带来的推动;5)IDC,重点关注与头部大厂合作的 IDC。 ⚫风险提示 1、AI 技术发展不及预期; 2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《AI 产业跟踪:通义 Qwen3-Max 正式发布,引领“参数革命”,持续关注大模型商业化进展》2025-09-29 •《国机采标准更新,关注信创产业进展》2025-09-29 •《开辟未来产业新赛道,关注量子信息、脑机接口等产业投资机遇》2025-09-29 -11%10%31%52%2024/92025/12025/52025/9软件与服务软件与服务沪深300指数2025-10-05%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 5 行业研究 | 点评报告 风险提示 1、AI 技术发展不及预期,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,投入厂商仍然存在失败风险。 2、下游应用需求不及预期,人工智能本质是通过供给创新催生需求扩容,目前大模型仍处于商业模式摸索期,倘若本轮技术变革无法真实带动下游需求,投入厂商将受到影响。 %research.95579.com3 请阅读最后评级说明和重要声明 4 / 5 行业研究 | 点评报告 投资评级说明 行业评级 报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 看 好: 相对表现优于同期相关证券市场代表性指数 中 性: 相对表现与同期相关证券市场代表性指数持平 看 淡: 相对表现弱于同期相关证券市场代表性指数 公司评级 报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 买 入: 相对同期相关证券市场代表性指数涨幅大于 10% 增 持: 相对同期相关证券市场代表性指数涨幅在 5%~10%之间 中 性: 相对同期相关证券市场代表性指数涨幅在-5%~5%之间 减 持: 相对同期相关证券市场代表性指数涨幅小于-5
[长江证券]:软件与服务行业AI产业跟踪:DeepSeek-V3.2-Exp发布,持续看好国内大模型商业化落地与出海趋势,点击即可下载。报告格式为PDF,大小0.63M,页数5页,欢迎下载。
