通信行业:数字经济专题报告之二十二:大模型驱动存储技术演进,存储全闪存化、网络化
请仔细阅读在本报告尾部的重要法律声明 [Table_Title] 数字经济专题报告之二十二:大模型驱动存储技术演进,存储全闪存化、网络化 [Table_Title2] 通信行业 [Table_Summary] 1、存储全闪存化、网络化 1)先进芯片(或者服务器)不等于先进算力,算力、存储、网络任一环节不可或缺:大模型进入万亿参数时代,单体服务器算力有限,需要将大量服务器打造大规模算力集群。 因此用上了先进芯片并不代表就拥有了先进算力,高性能计算存在“木桶效应”,计算、存储、网络任一环都不可或缺。 2)AI 工作负载在不同阶段需要部署互补型存储介质及架构:ML 和 DNN 工作负载对存储架构具有重大影响:由于 GPU 的并行处理能力和绝对密度,从基于磁盘的系统读取训练数据是最常见的瓶颈之一。要减少 GPU 空闲时间,可以使用固态阵列或驱动器或其他形式的非易失性存储器来优化预处理管道。NVMe SSD 可以缓解与神经网络相关的低带宽和高延迟问题。 3)产业变化:存储全闪存化、存储网络化 PCIe+NVMe 作为 SSD 主流方案持续高增,验证技术路线逻辑。 存储以太网络化:传统 FC 最高 32G/64G 带宽,不满足全闪存高吞吐的需求,高带宽以太网技术成为新一代存储网络的事实标准。 4)国内企业级 SSD 诸多公司产品发展策略以固件、控制器等产品或者技术往下游模组延伸为主。国内 SSD 产业链厂商可以概括为“具备主控设计能力的模块生产公司”,相关具备 PCIe SSD 核心能力的公司包括:相关上市公司:同有科技、江波龙、佰维存储、国科微(有研发投入)等,相关非上市公司:得一微、忆恒创源(固件)、得瑞领新(固件+主控)、大普微等。 分布式存储取代传统存储,存储网络高级控制器国产化机遇期:中国大陆拥有众多的光纤系统、交换系统和大数据产业基地,预计未来将会有非常广阔的国产替代空间,相关公司包括华澜微(HBA 控制芯片、RAID 控制芯片)、国芯科技(上市公司、RAID 控制芯片)等。 2、通信板块观点 结合业绩确定性及估值两方面因素考虑,我们建议关注包括军工通信、面板以及低估的算力基础设施及工业互联网个股: 1)持续推荐算力基础设施 服务器等设备商:紫光股份(华西通信&计算机联合覆盖)、中兴通讯等; 算力中心:光环新网; 算力硬科技产业链:新雷能(服务器电源); 评级及分析师信息 [Table_IndustryRank] 行业评级: 推荐 [Table_Pic] 行业走势图 [Table_Author] 分析师:宋辉 邮箱:songhui@hx168.com.cn SAC NO:S1120519080003 联系电话: 分析师:柳珏廷 邮箱:liujt@hx168.com.cn SAC NO:S1120520040002 联系电话: -12%1%14%26%39%52%2022/042022/072022/102023/012023/04通信沪深300证券研究报告|行业点评报告 仅供机构投资者使用 [Table_Date] 2023 年 04 月 24 日 证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p1证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p1138717 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 2 19626187/21/2019028 16:59 2)军工通信:烽火电子(华西通信&军工联合覆盖)、海格通信(华西通信&军工联合覆盖)、七一二等; 3)工业互联:金卡智能(华西通信&机械联合覆盖)等; 4)液晶面板拐点:TCL 科技(华西通信&电子联合覆盖)等; 5)AI 应用:航天信息(华西通信&计算机联合覆盖)等。 3、风险提示 AI 底层相关顶层政策滞缓影响行业应用落地;AI 厂商相关资本开支不及预期。 证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p2证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p2 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 3 19626187/21/2019028 16:59 1. 大模型驱动存储技术演进 1.1.先进芯片(或者服务器)不等于先进算力,算力、存储、网络任一环节不可或缺 大模型进入万亿参数时代,单体服务器算力有限,需要将大量服务器通过RDMA 网络相连,打造大规模算力集群。通过对处理器、网络架构和存储性能的全面优化,为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。 算力问题之所以成为行业头疼的难题,是因为当前大模型需要万亿参数时代,单体 AI 服务器算力有限,需要将大量 AI 服务器、存储系统通过高性能网络相连,打造大规模算力集群。 因此用上了先进芯片并不代表就拥有了先进算力,高性能计算存在“木桶效应”,一旦计算、存储、网络任一环节出现瓶颈,就会导致运算速度严重下降。 图 1 算力、存储、网络任一环节不可或缺 资料来源:华为,华西证券研究所 存储层面,几千台计算节点同时读取一批数据集,需要尽可能缩短加载时长。新一代集群,引入了腾讯云最新自研存储架构,支持不同场景下对存储的需求。其自研的文件存储、对象存储架构,具备 TB 级吞吐能力和千万级 IOPS,充分满足大模型训练的大数据量存储要求。 1.2.AI 工作负载在不同阶段需要部署新的存储介质和架构 从数据管理的角度来看,AI 训练及推理具有四个关键阶段: 数据收集和整合(I/O 密集型):从跨用户环境中不同来源收集数据开始,然后将这些数据转换为特定格式,并选择性地加以统一。某些情况下,托管在云生态系统中的来源于外部的数据和数据集还需要在数据收集和融合管道中进行整合。 证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p3证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p3 证券研究报告|行业点评报告 请仔细阅读在本报告尾部的重要法律声明 4 19626187/21/2019028 16:59 数据准备和清理(I/O 极度密集型):在收集和整合阶段获得的数据通常为原始数据,需要实时清理,包括数据去重、删除格式错误条目、删除离群数据、删除错误数据和启发式回填。清理后,需要将数据转换为 AI 模型需要的格式。常用转换例程包括旋转、贴标签、过滤、二次采样和标准化。 模型训练(统计 ML、DNN): 统计 ML(读取密集型):统计 ML 工作负载通常由传统 ML 分析组成,包括随机森林、决策树、集群、支持向量机等。从数据需求角度来说,这些模型的训练需要的数据较少。 DNN:DNN 工作负载通常涵盖非常深入的神经网络,涉及一系列复杂模型,如卷积神经网络、循环神经网络等。这些模型一般使用高度并行化的技术进行实施。这些模型的特性各不相同,因此需要大量(经过清理且添加标签的)数据进行训练。这些模型的训练数据集大小在单个模型中可轻松扩展到多个 PB。训练阶段的核心运行包括大量随机小型 (KB) 读取操作。 推
[华西证券]:通信行业:数字经济专题报告之二十二:大模型驱动存储技术演进,存储全闪存化、网络化,点击即可下载。报告格式为PDF,大小1.05M,页数10页,欢迎下载。