2025年AI存储系统需求研究

[编号ODCC- 2025- 0A002]AI 存储系统需求研究系点 燃 算2 0 2 5 年 9 月前言随着大模型参数量从十亿级跃升至万亿级,AI 系统对存储带宽、容量与时延的需求呈指数级增长。本文系统梳理了 AI 在“训练-推理-本地部署”三大阶段的存储流量特征,指出 PCIe 总线带宽已逐渐落后于计算、网络、存储三者的需求增速,成为新的系统级瓶颈。结合最新学术与产业数据,本文定量分析了 PCIe 4.0/5.0/6.0/7.0 在不同模型规模下的理论余量与实际缺口,并对比 NVLink、CXL、UCIe 等新兴互连技术的补偿效果。最后,面向边缘与终端的本地部署场景,提出以存储-计算协同设计、分层缓存、高并发 NAND 和内存内计算为核心的缓解路径。目录一、研究有关的技术现状综述................................................................................... 1二、AI 时代的存储挑战..............................................................................................2(一)AI 计算范式的转变与存储需求..............................................................2(二)存储墙问题的加剧................................................................................... 3(三)存力问题的瓶颈分析与解决策略........................................................... 3三、AI 应用不同阶段对存储系统的要求分析..........................................................4(一)白皮书有关的技术背景........................................................................... 4(二)AI 存储流量的模型..................................................................................7(三)AI 存储系统需求研究方案......................................................................7四、人工智能系统从训练到应用的八个阶段的存储需求..................................... 11(一)阶段 1:数据摄取(Data Ingestion)...................................................11(二)阶段 2:预处理(Pre-processing).......................................................13(三)阶段 3:训练(Training).....................................................................15(四)阶段 4:Checkpoint................................................................................17(五)阶段 5:微调(Fine-tuning)................................................................19(六)阶段 6:推理(Inference)................................................................... 20(七)阶段 7:边缘服务(Edge Serving).....................................................22(八)阶段 8:终端离线(On-device)..........................................................26五、人工智能应用对存储系统的压力评测方法..................................................... 30(一)带宽赤字指数(BDI)与展望.............................................................. 30(二)PCIe 6.0/7.0 技术透视........................................................................... 33(三)CXL 3.0/3.1 技术解析........................................................................... 36(四)NVLink 5.0 & UCIe 2.0.......................................................................... 39(五)硅光互连:光子在 AI 机柜中的再定位.............................................42(六)近存计算(Near-Data Processing, NDP)............................................ 44六、国产 AI 生态系统的存储架构建议................................................................. 48七、结论与未来工作................................................................................................. 50八、参考文献............................................................................................................. 52图 目 录图 1 2023–2024 年已公开场景的 BDI 结果 ...............30图 2 公开路线打分情况 ................................ 32AI 存储系统需求研究(ODCC-2025-0A002)1一、研究有关的技术现状综述在大模型参数规模持续膨胀的背景下,人工智能系统正由“计算主导”

立即下载
综合
2025-10-10
57页
4.79M
收藏
分享

2025年AI存储系统需求研究,点击即可下载。报告格式为PDF,大小4.79M,页数57页,欢迎下载。

本报告共57页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共57页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
表 4 智能客服资源负载
综合
2025-10-10
来源:OTII-E边缘AI推理一体机
查看原文
图 15 智能客服工作流
综合
2025-10-10
来源:OTII-E边缘AI推理一体机
查看原文
表 3 AI 视频搜索资源负载
综合
2025-10-10
来源:OTII-E边缘AI推理一体机
查看原文
图 13 视频搜索工作流
综合
2025-10-10
来源:OTII-E边缘AI推理一体机
查看原文
图 10 多节点多卡并行
综合
2025-10-10
来源:OTII-E边缘AI推理一体机
查看原文
图 8 单节点多模型资源分配
综合
2025-10-10
来源:OTII-E边缘AI推理一体机
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起