人工智能专题:后R1时代,DeepSeek发展的三大阶段
第1页 / 共8页 本报告版权属于中原证券股份有限公司 www.ccnew.com 请阅读最后一页各项声明 计算机 分析师:唐月 登记编码:S0730512030001 tangyue@ccnew.com 021-50586737 后 R1 时代,DeepSeek 发展的三大阶段 ——人工智能专题 证券研究报告-行业分析报告 强于大市(维持) 计算机相对沪深 300 指数表现 资料来源:中原证券研究所,聚源 相关报告 《计算机行业月报:国产算力芯片迎来高光时刻,超节点和集群层面双双赶超》 2025-09-19 《人工智能专题:三大要素齐发力,AI 应用步入全面加速期》 2025-03-07 联系人: 李智 电话: 0371-65585629 地址: 郑州郑东新区商务外环路10 号18 楼 地址: 上海浦东新区世纪大道1788 号T1 座22 楼 发布日期:2025 年 10 月 14 日 投资要点: ⚫ DeepSeek 在年初发布了 R1 以后,受到了各界普遍关注。后续来看,DeepSeek 并没有如期发布更先进的模型 R2,而是在进行更多小版本的更新换代。结合每个阶段的发展重点,我们将其划分为 3 个主要的发展阶段。 ⚫ 阶段一:性能提升。DeepSeek 在 3 月推出的 V3-0324 和 5 月推出的 R1-0528,通过后训练实现了模型能力的提升,弥补了和头部模型之间的差距。 ⚫ 阶段二:实现混合推理架构、Agent 能力提升、与国产芯片协同优化。从 8 月以后,DeepSeek 也顺应了海外混合推理架构和Agent 能力提升的大趋势,推出了 V3.1 和 V3.1-Terminus,Agent能力有了较大提升,思考效率也有提升。V3.1 采用 UE8M0 FP8缩放格式训练,针对即将发布的下一代国产芯片设计,实现国产大模型和国产芯片协同设计的优化,对国产化芯片的应用起到积极的推动作用。 ⚫ 阶段三:提效降价,国产适配加速。9 月发布的 V3.2-Exp,基于V3.1-Terminus 构建,引入了新的注意力机制 DSA,在保持模型性能的稳定的同时,在训练推理效率方面有了较大的提升,带来了模型较大幅度的降价。考虑到当前大模型之间能力差距在缩小,成本的下降意味着模型具有更好的性价比和可推广性,也将促进应用端实现更多功能的落地。DeepSeek 新兴 AI 编程语言选用TileLang 这个新兴 AI 编程语言,可以实现对不同硬件平台的支撑,极大地改善了国产卡目前所面对的 CUDA 带来的生态壁垒问题,为国产大模型软硬件生态建立起到了极大的推动作用。发布的当天,国产芯片华为昇腾和寒武纪同步宣布完成对 V3.2-Exp 的零日适配,国产 AI 产业从“单点突破”迈向“系统协同”的又一个标志性事件。 风险提示:国际形势变化。 -9%-1%7%16%24%33%41%50%2024.102025.022025.062025.10计算机沪深300第2页 / 共8页 计算机 本报告版权属于中原证券股份有限公司 www.ccnew.com 请阅读最后一页各项声明 内容目录 1. 阶段一:性能提升 .......................................................................................... 3 2. 阶段二:实现混合推理架构、Agent 能力提升、与国产芯片协同优化 ........... 3 3. 阶段三:提效降价,国产适配加速 ................................................................. 5 4. 风险提示 ......................................................................................................... 7 图表目录 图 1:DeepSeek 模型的代码智能体能力对比 ........................................................................ 4 图 2:DeepSeek 模型的搜索智能体能力对比 ........................................................................ 4 图 3:DeepSeek 模型的数学能力对比 ................................................................................... 4 图 4:DeepSeek 模型的科学测试成绩对比 ............................................................................ 4 图 5:DeepSeek 模型的代码生成能力对比 ............................................................................ 4 图 6:DeepSeek 模型的推理与百科知识能力对比 ................................................................. 4 图 7:计算精度及位数分布示意图 .......................................................................................... 5 图 8:DeepSeek 模型 API 调用价格(元/百万 Tokens) ....................................................... 6 图 9:TileLang 简介 ................................................................................................................ 6 表 1:DeepSeek 的主要模型发布情况 ....................................................................................... 3 表 2:华为昇腾系列芯片发布计划及芯片性能 ......................................................................... 5 第3页 / 共8页 计算机 本报告版权属于中原证券股份有限公司 www.ccnew.com 请阅读最后一页各项声明 DeepSeek 在年初发布了 R1 以后,受到了各界普遍关注。后续来看,DeepSeek 并没有如期发布更先进的模型 R2,而是
[中原证券]:人工智能专题:后R1时代,DeepSeek发展的三大阶段,点击即可下载。报告格式为PDF,大小0.8M,页数8页,欢迎下载。
