计算机行业:DeepSeek开启盈利新时代!关注应用、云厂及国产算力、数据库投资机遇
请务必阅读正文之后的重要声明部分计算机证券研究报告/行业点评报告2025 年 03 月 03 日评级:增持(维持)分析师:孙行臻执业证书编号:S0740524030002Email:sunxz@zts.com.cn基本状况上市公司数361行业总市值(亿元)45,969.02行业流通市值(亿元)39,634.33行业-市场走势对比相关报告1、《量子计算:“量”力而行,下一代计算革命伊始》2025-02-232、《国家数据集团组建在即,数据要 素 市 场 化 改 革 步 入 深 水 期 》2025-02-16报告摘要工程优化能力:算力效率跃升,极致发挥 Hopper 架构性能。DeepSeek 宣布以“完全公开透明”方式开源 5 个生产级代码库,从注意力机制、通信库、矩阵计算库、并行优化策略和数据存储系统方面极致压榨算卡性能。Day1:FlashMLA 解码内核,专为 Hopper 架构 H800 GPU 优化,通过多层注意力机制(MLA)并行化设计,实现 3000GB/s 内存带宽与 580 TFLOPS 算力。该技术可支撑高并发实时生成任务,单卡推理效率达行业平均水平的 8 倍,为AI 规模化应用降低算力瓶颈。Day2:全球首个 MoE 专用通信库 DeepEP,深度融合 NVLink 与 RDMA 技术,节点间通信延迟降至微秒级。其“专家小组分工”机制动态分配 GPU 资源,空闲时自动降频,配合 FP8 调度与计算-通信重叠策略,填补分布式训练工具链空白。Day3:开源 DeepGEMM 矩阵库,以 300 行核心代码实现 FP8 精度通用矩阵运算。JIT 编译动态适配 Hopper 张量核心,算力峰值达 1350 TFLOPS。轻量化设计支持边缘设备部署,验证 FP8 商用可行性,为低耗 AI 提供标准化工具,推动行业向高效集约化迭代。Day4:开源三项并行优化技术,DualPipe 算法实现前向/反向计算 100%重叠;EPLB 动态平衡 MoE 专家负载,提升 GPU 利用率。V3 模型预训练仅耗 278.8万 H800 GPU 小时(成本 557 万美元),较同类产品节省算力资源,代码生成与数学推理性能超越 GPT-4o。Day5:并行文件系统 3FS,基于 RDMA 网络与高速 SSD 构建共享存储层,180节点集群读取吞吐量达 6.6TiB/s,单客户端 KVCache 查询峰值 40+GiB/s。配合SmallPond 分布式排序方案,110.5TiB 数据排序耗时 30 分 14 秒(3.66TiB/分钟),验证海量数据处理能力。DeepSeek 开源周带来四大深远影响:1)通过云厂商部署、私有云部署与端侧部署三类模式,加速 AI 全场景渗透。2)在杰文斯悖论驱动下,其算力效率跃升与多模态技术突破进一步刺激全球算力需求扩张。3)推动数据库向新型基础设施升级。4)商业化层面,开源生态与分层收费模式显著降低企业应用成本国产应用厂商盈利空间全面打开。商业进展盈喜:估测成本利润率达 545%,AI Infra 价值重估。3 月 1 日,DeepSeek披露其通过硬件优化(全 H800 GPU 集群+FP8/BF16 精度),与动态资源调度,在保障服务质量的同时实现了 545%的成本利润率,验证了从算法到工程的全链路突破。新品蓄势待发:R2 模型有望于 2025 年 5 月前发布。DeepSeek 被曝加速推进第二代大模型 R2 研发,或将提前至 5 月前发布,迭代周期从 R1 的 13 个月压缩至 3-4 个月,创行业新纪录。投资建议:1)官方技术解读表明,通过部署 DeepSeek 的服务,理论上收益和利润率可以达到很高。DS 的惊艳收益有望促进应用爆发,建议关注金山办公、同花顺、合合信息、萤石网络等;2)应用爆发带来的庞大推理需求,以及未来图像+声音+视频的全面智能体会支撑起更多业务场景,大型云厂具备规模、infra 优势,能够以更低的成本支持高并发的业务需求。海外高性能芯片供应受限,国产算力结合算法架构创新有望弯道超车。建议关注阿里巴巴、海光信息、中科曙光、神州数码等;3)通过将结构化和非结构化数据集成在高性能、分布式的命名空间,实现实时分析能力,传统数据库有望升级为新型数据基础设施,建议关注达梦数据、星环科技、海量数据等。风险提示:技术优化边际递减风险;开源生态依赖风险;商业场景错配风险;行业竞争超速风险;研究报告中使用的公开资料可能存在信息滞后或更新不及时的风险。行业点评报告- 2 -请务必阅读正文之后的重要声明部分内容目录一、工程优化能力:算力效率跃升,极致发挥 Hopper 架构性能................................... 31.1 Day 1:FlashMLA-针对 Hopper 优化的高效多层注意力解码内核..................... 31.2 Day 2:DeepEP-打破分布式训练瓶颈的高效通信库通信库...............................41.3 Day 3:DeepGEMM-专为 FP8 矩阵乘法设计的开源库......................................61.4 Day 4:三项并行优化技术-突破超大规模模型训练效率瓶颈..............................71.5 Day 5:3FS&Small pond 联袂加速数据处理 .................................................... 91.6 DS 开源周四大影响研判 .................................................................................. 11二、商业进展盈喜:估测成本利润率达 545%,AI Infra 价值重估............................... 12三、新品蓄势待发:R2 模型有望于 2025 年 5 月前发布...............................................15投资建议..........................................................................................................................15风险提示..........................................................................................................................15图表目录图表 1: DeepSeek Day1 内容........................................................................................3图表 2: FlashMLA 的意义.........
[中泰证券]:计算机行业:DeepSeek开启盈利新时代!关注应用、云厂及国产算力、数据库投资机遇,点击即可下载。报告格式为PDF,大小1.83M,页数16页,欢迎下载。
