电子行业动态点评-GTC 2024:一次践行“Buy More Save More”口号的发布会
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 电子 GTC 2024:一次践行“Buy More Save More”口号的发布会 华泰研究 电子 增持 (维持) 研究员 黄乐平,PhD SAC No. S0570521050001 SFC No. AUZ066 leping.huang@htsc.com +(852) 3658 6000 研究员 余熠 SAC No. S0570520090002 SFC No. BNC535 yuyi@htsc.com +(86) 755 8249 2388 研究员 张皓怡 SAC No. S0570522020001 zhanghaoyi@htsc.com +(86) 21 2897 2228 研究员 胡宇舟 SAC No. S0570523070005 SFC No. BOB674 huyuzhou@htsc.com +(86) 21 2897 2228 研究员 陈钰 SAC No. S0570523120001 chenyu019111@htsc.com +(86) 21 2897 2228 研究员 廖健雄 SAC No. S0570524030001 liaojianxiong@htsc.com +(86) 755 8249 2388 联系人 权鹤阳 SAC No. S0570122070045 SFC No. BTV779 quanheyang@htsc.com +(86) 21 2897 2228 联系人 汤仕翯 SAC No. S0570122080264 SFC No. BUQ838 tangshihe@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2024 年 3 月 26 日│中国内地 动态点评 GTC 2024 启示:一次践行“Buy More Save More”口号的发布会 英伟达于美国时间 3 月 18 日开始召开开发者大会(GTC),发布全新架构BlackeWell 系列芯片(B200, GB200)以及软件和应用更新:1)AI 硬件总体框架变化不大,主要是推出集成度更高的 GB200 解决方案实现大幅度降本,是践行公司 CEO 黄仁勋“Buy More Save More”口号的一次发布会。2)公司推出包括 NIM(Nvidia Inference Microservices)微服务在内的大模型服务,丰富软件产品线。3)面向机器人和自动驾驶,公司推出涵盖 AI大模型训练、仿真和算法执行在内完成的解决方案。我们认为全球算力产业链将有望受益并加速发展。 芯片:GB200 超级芯片大幅降低训练系统成本 本次大会上最新推出的新一代 B200 芯片沿用了台积电 N4 系列工艺,通过裸片连接等新技术,实现比 H100 更大的芯片面积及更高容量内存,算力性能较上一代 H100 提升 5 倍。超级芯片 GB200 由 2 个 B200 Blackwell GPU和 1 个基于 Arm 的 Grace GPU 组成,是英伟达推出的集成度更高的解决方案,在推理大语言模型方面,GB200 性能比 H100 提升了 30 倍,成本和能耗却降低至 1/25。此外英伟达还展示了从 GB200 NVL72 到百亿亿级 AI 超算的搭建过程,可扩展至最高包含 32000 个 GPU 的完整数据中心,我们认为 NVL72 将成为全球客户发展大语言模型背后的重要支撑。 软件:NIM 微服务丰富 AI Foundry 产品线 继 2023 年 GTC 提出 AI Foundry(AI 代工厂)概念,并推出 Nemo 模型服务+DGX 云服务之后,英伟达在本次 GTC 对 AI Foundry 的定义更加清晰,并新推出推理微服务 NIM 作为 AI Foundry 的组成部分。英伟达表示企业拥有数据金矿,AI Foundry 帮助企业以专有数据创建自己的 Copilot 和Chatbot。AI Foundry 由三个部分构成:1)NIM 封装打包 AI 模型(涵盖自有模型、第三方模型);2)Nemo 创建工具来协助客户修改 AI 模型;3)DGX云作为基础设施,供客户部署 AI 模型。我们认为 2B 场景是 AI 大模型落地的重要领域,对垂直行业有深刻理解,有软硬件整合能力的企业更容易享受到 AI 红利。 机器人&自动驾驶:三大平台赋能端到端全栈开放 英伟达表示公司有三大计算机平台,1)DGX:用于 AI 大模型深度训练;2)AGX:移动端的低功耗高性能处理器用于推理;3)Omniverse:在 OVX 计算机上运行的实时模拟和协作平台,用于虚拟仿真以及 RLHF。基于此,为应对机器人&自动驾驶需求搭建了 Jetson/Drive 等全栈的软硬件生态链。在本次 GTC 大会上,英伟达发布了人形机器人基础模型 Project GR00T 和计算机 Jetson Thor,升级了 Isaac 机器人平台,同时推出了 Omniverse Cloud API 以更便捷地打通虚拟仿真测试生态。我们认为这有助于解决行业目前计算资源不足/数据不足的情况,推动机器人/自动驾驶行业发展。 风险提示:AI 及技术落地不及预期;本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。 (30)(20)(11)(1)9Mar-23Jul-23Nov-23Mar-24(%)电子沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 电子 硬件:Buy More Save More 芯片:B200 相比 H100 拥有更大面积,更快的裸片连接与更高容量内存 与上一代 H100 GPU 相比,本次 GTC 大会推出的 B200 在芯片架构上做了明显升级,具体来看,1)Blackwell 架构与 Hopper 架构:B200 GPU 采用台积电 4NP 工艺,包含两颗独立裸片,裸片间通过 10TB/s 的 NV-HBI 链接,整个 GPU 面积约为 Hopper 架构芯片的 2倍,晶体管数量达到 2080 亿个,为 H100 的 2.6 倍。2)内存方面:B200 在内存容量上较上一代也有明显提升。GPU 周围配备了 8 个 HBM3e 内存,总容量达 192GB,带宽为 8TB/s。对比来讲,H100 周围配套 6 颗 HBM3/HBM2e 内存,最高总容量为 96GB,带宽 3.9TB/s。 图表1: B200 和 H100 芯片内部结构对比 资料来源:Nvidia 官网,华泰研究 芯片参数分析:B200 算力性能较上一代 H100 提升 5 倍 英伟达本次 GTC 大会推出的 B200 相较于英伟达前几年推出的 V100(2017 年)、A100 (2020 年)、H100(2022 年)、H200(2023 年)除了在工艺、芯片面积及晶体管数量有提升外,在算力上也引入新的 FP8 及 FP4 两种精
[华泰证券]:电子行业动态点评-GTC 2024:一次践行“Buy More Save More”口号的发布会,点击即可下载。报告格式为PDF,大小1.96M,页数11页,欢迎下载。
