电子行业AI系列专题报告(一):AI算力参数爆发,兼论国产算力比较

请务必阅读正文之后的信息披露和法律声明 [Table_Main] 证券研究报告 | 行业点评 电子 2024 年 01 月 19 日 电子 优于大市(维持) 证券分析师 陈海进 资格编号:S0120521120001 邮箱:chenhj3@tebon.com.cn 研究助理 徐巡 邮箱:xuxun@tebon.com.cn 谢文嘉 邮箱:xiewj3@tebon.com.cn 市场表现 相关研究 1.《存储价格周度跟踪-0108:料号上涨提速, DDR4DDR3 或进入补涨阶段》,2024.1.8 2.《电子周观点:关注鸿蒙链和 CES展 AI PC 等应用》,2024.1.7 3.《海光信息(688041.SH):业绩预告 Q4 同环比大幅增长,算力国产化大势所趋》,2024.1.3 4.《存储价格周度跟踪-0103:23 年末交易有所降温,国产 SSD 模组占比提升》,2024.1.3 5.《电子周观点:关注 CES 展中 AI 应用、智能驾驶进展》,2024.1.1 AI 算力参数爆发,兼论国产算力比较——AI 系列专题报告(一) [Table_Summary] 投资要点:  算力参数:多厂商逐鹿 AI,矩阵计算为核心算力参数。AI 算力参数种类繁多,其本质是精度与运算效率的取舍。为更好适应 AI 大模型的训练与推理,FP32 Tensor Core,BF16 等新兴数据类型应运而生。以 FP32 Tensor Core 为例,其为英伟达张量计算的数据格式,使得模型训练性能大幅提升。英伟达 H200 的 FP32 算力为67TFlops,对应 FP32 Tensor Core 算力为 989TFlops,性能大幅提升。而国内各算力厂商产品性能迭代顺利,华为海思此前发布的昇腾 910 在 FP16 算力性能上接近 A100,下一代 910B 性能有望显著提升。寒武纪 370 对标英伟达 L2芯片。海光信息深算三号研发进展顺利;龙芯中科第二代图形处理器 LG200 单节点性能达 256GFlops-1TFlops,将基于 2K3000 的 GPGPU 技术及 3C6000 的龙链技术,研制专用 GPGPU 芯片。  互联参数:多卡互联为大模型桎梏,国内外差距巨大。相比小模型,大模型要求在模型切分后进行模型并行。模型并行使得多个 GPU 能同时运行模型的一部分,并在共享结果后进入到下一层。大模型的发展使得类似英伟达 NVLink、NVSwitch等互联技术的重要性快速提升,同时互联性能参数也成为各大模型实际效果好坏的重要凭依。大多数厂商利用 PCIe 进行互联,而英伟达的 NVLink 能够实现 GPU间的直接互联,从而大幅提升通信效率,其 NVLink 带宽可达到 900 GB/s。在大规模高精度的 3D FFT、3950 亿参数的大模型训练上,H100+NVLink 组合的提升显著。我们认为随着大模型的复杂化,NVLink 等多卡互联技术将愈加重要。在多卡互联上,国内外厂商亦有所差距。以寒武纪 MLU370-X8 为例,寒武纪为多卡系统专门设计了 MLU-Link 桥接卡,其可实现 4 张加速卡为一组的 8 颗思元 370 芯片全互联,每张加速卡可获得 200GB/s 的通讯吞吐性能,带宽为 PCIe 4.0 的 3.1倍。但相比英伟达 NVLink 4.0 的 900GB/s,该互联性能仅为英伟达的 22%,仍有较大提升空间。  建议关注: 算力芯片:寒武纪(思元 590 性能有望显著提升)、海光信息(深算三号研发进展顺利)、龙芯中科(将基于 2K3000 的 GPGPU 技术及 3C6000 的龙链技术研制专用 GPGPU 芯片) AI 应用:海康威视、大华股份、乐鑫科技、晶晨股份、恒玄科技、中科蓝讯 服务器:工业富联、沪电股份 服务器存储:澜起科技、聚辰股份 先进封装:通富微电、长电科技、甬矽电子、华天科技  风险提示:下游需求复苏不及预期,技术研发风险,国内外政策和技术摩擦不确定性的风险。 -22%-15%-7%0%7%15%22%2023-012023-052023-092024-01电子沪深300 行业点评 电子 2 / 9 请务必阅读正文之后的信息披露和法律声明 内容目录 1. 算力参数:多厂商逐鹿 AI,矩阵计算为核心算力参数 ................................................... 3 2. 互联参数:多卡互联为大模型桎梏,国内外差距巨大 .................................................... 6 3. 风险提示 ......................................................................................................................... 8 、 图表目录 图 1:深度学习常见数据类型 ............................................................................................... 3 图 2:深度学习混合精度计算 ............................................................................................... 4 图 3:H100 内部芯片架构 .................................................................................................... 4 图 4:国内外各厂商算力芯片参数对比 ................................................................................ 5 图 5:寒武纪 MLU370 产品矩阵 .......................................................................................... 5 图 6:华为 AI 解决方案 .....................................................

立即下载
信息科技
2024-01-20
德邦证券
9页
1.75M
收藏
分享

[德邦证券]:电子行业AI系列专题报告(一):AI算力参数爆发,兼论国产算力比较,点击即可下载。报告格式为PDF,大小1.75M,页数9页,欢迎下载。

本报告共9页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共9页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
可比公司估值
信息科技
2024-01-19
来源:深度报告:3D内容创制经验丰富,数字孪生应用快速拓展
查看原文
公司营收拆分(百万元)
信息科技
2024-01-19
来源:深度报告:3D内容创制经验丰富,数字孪生应用快速拓展
查看原文
“大唐宝藏”虚拟人导览展厅 图39:湖南轻盐数智展示中心
信息科技
2024-01-19
来源:深度报告:3D内容创制经验丰富,数字孪生应用快速拓展
查看原文
国家博物馆-艾雯雯(左)和仝古今(右) 图37:国家大剧院-Art 鹅和元宇宙虚拟数智人-班昭
信息科技
2024-01-19
来源:深度报告:3D内容创制经验丰富,数字孪生应用快速拓展
查看原文
广州人民公园 AR 实景复原 图35:雄安印象·城市厅
信息科技
2024-01-19
来源:深度报告:3D内容创制经验丰富,数字孪生应用快速拓展
查看原文
雄安·容东智慧体验中心裸眼 3D 大屏 图33:凡拓数创 x 珠光·海珠新城裸眼 3D 大屏
信息科技
2024-01-19
来源:深度报告:3D内容创制经验丰富,数字孪生应用快速拓展
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起