半导体行业专题研究:AI存储革命已至,“以存代算”开启存储新纪元
行业报告 | 行业专题研究 请务必阅读正文之后的信息披露和免责申明 1 半导体 证券研究报告 2025 年 09 月 26 日 投资评级 行业评级 强于大市(维持评级) 上次评级 强于大市 作者 唐海清 分析师 SAC 执业证书编号:S1110517030002 tanghaiqing@tfzq.com 李泓依 分析师 SAC 执业证书编号:S1110524040006 lihongyi@tfzq.com 资料来源:聚源数据 相关报告 1 《半导体-行业研究周报:25Q2 半导体业绩总结及展望:AI 驱动与国产替代共筑成长主线》 2025-09-02 2 《半导体-行业研究周报:3 季度半导体景气度展望乐观,持续重点关注国产算力及自主可控方向》 2025-08-25 3 《半导体-行业研究周报:“以存代算”开启存储新纪元,7 月半导体行情延续 景气》 2025-08-19 行业走势图 AI 存储革命已至,“以存代算”开启存储新纪元 “以存代算”发展背景:AI 推理成价值核心,HBM 瓶颈凸显产业痛点,“以存代算”应运而生。当前,AI 推理已成为衡量大模型商业化价值的关键标尺,但在实际应用中仍面临“推不动、推得慢、推得贵”的严峻挑战。为突破算力瓶颈与“存储墙”制约,“以存代算”作为一种颠覆性技术范式应运而生。该技术通过将 AI 推理过程中的矢量数据(如 KV Cache)从昂贵的DRAM 和 HBM 显存迁移至大容量、高性价比的 SSD 介质,实现存储层从内存向 SSD 的战略扩展,而非简单替代。其核心价值在于显著降低首 Token时延、提升推理吞吐量,并大幅优化端到端的推理成本,为 AI 大规模落地提供可行路径。 “以存代算”核心技术:“以存代算”CachedAttention 技术是一种通过将 AI 推理中历史对话的 KV Cache 缓存到 HBM+DRAM+SSD 等外部存储介质。在该系统中,HBM 作为 GPU 本地高速存储,负责存储当前活跃会话的 KV Cache,支撑 LLM 推理计算;DRAM 作为中间缓存层,承接 HBM 的异步写入与 SSD 的预加载,平衡速度与容量;SSD 则作为长期存储层,提供大容量持久化存储,承载非活跃历史数据。“以存代算”CachedAttention 将首 Token 时延(TTFT)显著缩短了 87%,并提升了 Prefill 阶段 7.8 倍的吞吐量,从而将端到端推理成本降低了 70%。 “以存代算”硬件突破:在 “以存代算”技术范式下,SSD 不再是单纯的数据存储载体,而是深度参与 AI 推理的核心组件,其需承接从 HBM、DRAM 卸载的 KV Cache,因此被赋予大容量、高吞吐、低延迟的新要求,以缓解对高成本 HBM 的依赖。同时,SSD 主控芯片作为 “控制大脑”,需通过先进算法优化数据寻址调度,支撑 AI 推理中数据高效流转。在此背景下,AI SSD 技术将沿三大方向发展:颗粒上,向 QLC 颗粒演进,凭借技术升级实现高性能与大容量兼顾,满足 AI 大模型数据存储调用需求;接口协议上,以 PCIe 5.0/6.0 接口搭配 NVMe 协议为基础,未来融入 CXL 技术,进一步提升带宽与降低延迟;功能上,向智能化升级,如铠侠计划推出软件让 SSD 自主处理 AI 检索任务,Solidigm 探索液冷方案优化散热,实现存储与 AI 推理的深度协同。 “以存代算”企业布局:“以存代算”的核心实践已获产业龙头积极布局。华为 UCM 作为 “以存代算” 产品化关键载体,构建智能分级缓存,数据可根据记忆热度在 HBM、DRAM、SSD(固态硬盘)等存储介质中实现按需流 动 ; 同 时 融 合 多 种 稀 疏 注 意 力 算 法 , 实 现 存 算 深 度 协 同 。 除 了 以HBM+DRAM+SSD 构建的多级缓存体系外,还存以 KVCache 缓存技术为核心的多元实践。浪潮存储 AS3000G7 优化存储架构与缓存管理机制,智能调度 KVCache 数据,具备高扩展性,能快速处理热数据,为 AI 推理等应用提供高效稳定的存储算力。焱融 YRCloudFile KVCache 依托自研分布式文件系统,实现 KVCache 数据在分布式环境下的高效存取与智能负载均衡,兼容性强,提升数据与计算协同效率。国际层面,铠侠、美光、Solidigm等 巨 头 正 积 极 推 动 AI SSD 的 技 术 迭 代 与 产 品 创 新 。 我 们 认 为 ,QLC+PCIe/NVMe+CXL 有望构筑下一代 AI SSD 基座,推动 SSD 从单纯存储介质,升级为 AI 推理“长期记忆”载体。 投资建议:AI 存储革命已至,“以存代算”催生核心机遇,显著节省算力消耗加速 AI 推理,带动 SSD 需求增速高于传统曲线。建议关注: 存储模组厂商:江波龙(天风计算机联合覆盖)、德明利、佰维存储、朗科科技、联芸科技、万润科技等;存储芯片:兆易创新、普冉股份、北京君正、东芯股份、恒烁股份、澜起科技、聚辰股份等;存储分销与封测:香农芯创、深科技、太极实业、中电港等 风险提示:地缘政治带来的不可预测风险,需求复苏不及预期,技术迭代不及预期,产业政策变化风险 0%19%38%57%76%95%114%2024-092025-012025-052025-09半导体沪深300 行业报告 | 行业专题研究 请务必阅读正文之后的信息披露和免责申明 2 内容目录 1. 发展背景:AI 推理成价值核心,HBM 瓶颈凸显产业痛点...................................................... 4 1.1. AI 大模型推理中存在推不动、推得慢、推得贵三大挑战............................................... 4 1.2. HBM 突破存储墙,海外垄断下技术难度和成本高企成最大障碍 ................................ 4 2. 核心技术:以存代算元年开启,打破 HBM 限制重构 AI 存储生态 ...................................... 5 2.1. 产业背景:AI 推理成本高企与 HBM 瓶颈催生“以存代算”新范式 ......................... 5 2.2. 技术背景:KV Cache 重复计算成推理效率关键制约...................................................... 6 2.3. 技术机制:以存储换计算,实现 KV Cache 持久化与多级缓存................................... 7 3. 企业布局:华为领衔重点推广,浪潮、焱融乘风而上 ............................................................. 9 3.1. 华为 UCM:以存代算产品化载体,软件定义突破 HBM 资源枷锁 ............
[天风证券]:半导体行业专题研究:AI存储革命已至,“以存代算”开启存储新纪元,点击即可下载。报告格式为PDF,大小2.82M,页数24页,欢迎下载。



