计算机行业AIGC系列报告之DeepSeek深度解析:DeepSeek推动高性能AI普惠,AI生态繁荣发展
敬请阅读末页的重要说明 2025 年 02 月 04 日 推荐(维持) AIGC 系列报告之 DeepSeek 深度解析 TMT 及中小盘/计算机 DeepSeek-V3 奠定模型高效训练基础,R1 通过大规模强化学习使开源模型推理能力追平 o1。开源模型直接带来 AI 产业模型能力普遍提升,同时低廉的使用成本搭配卓越的性能倒逼 OpenAI 降低 GPT 使用成本、加速模型迭代,促进产业生态繁荣。大模型能力普遍提升首先利好 AI 应用开发,尤其小模型易于在端侧落地,长期看 DeepSeek 带来的应是算力层面的杰文斯悖论,整体 AI 应用生态繁荣应将带来推理算力的更大需求。 ❑ DeepSeek-V3 奠定模型高效基础,R1 通过大规模强化学习使开源模型推理能力追平 o1。DeepSeek-V3 通过算法创新和工程优化大幅提升模型效率,从而降低成本,提高性价比。DeepSeek-V3 为了实现高效的推理和经济的训练,沿用了 V2 即提出的 MLA 和 DeepSeekMoE,同时通过 MTP、FP8 精度训练、并行优化等方法进一步提升效率。在 V3 基础上,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1 正式版,还蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。 ❑ 算法的改进和优化带来模型能力提高的同时成本降低,持续提升模型性价比,推动 AI 生态繁荣。DeepSeek-R1 在 Web 和 App 端可完全免费使用,模型均开源,多领域性能比肩 OpenAI o1,API 服务定价为每百万输入 tokens 1元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元,OpenAI-o3价格仍约为 R1 的八倍。当前 V3 及 R1 模型已迅速集成进海内外各大云平台中,直接拉高模型能力下限,促进 AI 应用开发提速升级。 ❑ OpenAI 快速跟进,AI 行业迭代速度加快。1 月 31 日,OpenAI 推出了全新推理模型 o3-mini,并首次向免费用户开放推理模型,o3-mini 是 OpenAI 推理系列中最新、成本效益最高的模型,现在已在 ChatGPT 和 API 中上线。2月 2 日,OpenAI 推出面向深度研究领域的智能体产品 deep research,能够针对复杂任务在互联网上开展多步骤调研,并在几十分钟内完成人类需耗费数小时才能完成的工作,深度研究功能专为金融、科学、政策、工程等领域的高强度知识工作者设计。 ❑ 投资建议:1)云厂商加速接入 DeepSeek,低廉的使用成本搭配卓越的性能倒逼 OpenAI 降低 GPT 使用成本。此外,DeepSeek 开源模式有望快速提升其他大模型综合实力,大模型能力普遍提升首先利好 AI 应用开发。重点关注有垂类优势的头部 AI 应用厂商以及 AI Agent 最有落地场景的企业级服务软件:金山办公、用友网络、金蝶国际、泛微网络、合合信息、同花顺、万兴科技、福昕软件、彩讯股份。2)AI 模型更易在端侧落地,软件 Agent 情绪有望延伸至硬件,关注端侧 AI 机器人、眼镜、玩具、手机、PC 等方向。3)长期看,DeepSeek 带来的应是算力层面的杰文斯悖论,整体 AI 应用生态繁荣带来推理算力的更大需求,建议关注金山云、宝信软件(通信)、数据港、寒武纪、海光信息、中科曙光。 ❑ 风险提示:AI 应用研发进度不及预期、地缘政治风险、AI 芯片研发不及预期、技术创新不及预期。 行业规模 占比% 股票家数(只) 278 5.5 总市值(十亿元) 3172.0 3.8 流通市值(十亿元) 2759.2 3.7 行业指数 % 1m 6m 12m 绝对表现 -3.9 53.9 23.8 相对表现 0.2 42.0 9.3 资料来源:公司数据、招商证券 相关报告 1、《重点关注 AI 应用及端侧 Agent— — 计 算 机2月 投 资 策 略 》2025-02-03 2、《微软 FY25Q2 业绩跟踪—智能云业务增速不及预期,AI 投入趋势不改》2025-02-01 3、《计算机行业 24Q4 机构持仓分析—机构持仓触底反弹,AI、信创等方向获加配》2025-01-23 刘玉萍 S1090518120002 liuyuping@cmschina.com.cn 林语潇 S1090524120004 linyuxiao1@cmschina.com.cn -20020406080100Feb/24Jun/24Sep/24Jan/25(%)计算机沪深300DeepSeek 推动高性能 AI 普惠,AI 生态繁荣发展 敬请阅读末页的重要说明 2 行业深度报告 正文目录 一、 DeepSeek 开源模型能力对标 OpenAI o1 ................................................. 4 二、 DeepSeek 核心技术创新解析 ................................................................... 5 1、 DeepSeek-V3 通过算法创新和工程优化实现大幅降本 ............................... 5 (1) MLA 提升推理效率 .................................................................................. 6 (2) DeepSeekMoE 提升模型性价比 .............................................................. 7 (3) MTP、FP8 精度训练、并行优化进一步提升效率 ................................... 8 2、 DeepSeek-R1 探索 RL 可能性,开源能力追平 o1 ..................................... 9 (1) R1-Zero 展示纯 RL 训练给 LLM 带来的潜力 ........................................... 9 (2) R1 补充了带有对用户友好的冷启动数据的强化学习 ............................ 10 (3) 模型蒸馏显著提升小模型推理能力 ........................................................ 11 3、 DeepSeek Janus-Pro——统一多模态开源模型,仅使用少量算力训练 ... 12 三、 模型降价提效推动 AI 生态繁荣 .....................................
[招商证券]:计算机行业AIGC系列报告之DeepSeek深度解析:DeepSeek推动高性能AI普惠,AI生态繁荣发展,点击即可下载。报告格式为PDF,大小2.21M,页数17页,欢迎下载。
