中国科技行业战略:英伟达GTC 2024,从硬件到软件的AI全链条服务
[Table_yejiao1] 本研究报告由海通国际分销,海通国际是由海通国际研究有限公司,海通证券印度私人有限公司,海通国际株式会社和海通国际证券集团其他各成员单位的证券研究团队所组成的全球品牌,海通国际证券集团各成员分别在其许可的司法管辖区内从事证券活动。关于海通国际的分析师证明,重要披露声明和免责声明,请参阅附录。(Please see appendix for English translation of the disclaimer) [Table_yemei1] 热点速评 Flash Analysis [Table_summary] (Please see APPENDIX 1 for English summary) 事件 2024 年 3 月 19 日,英伟达 CEO 黄仁勋在 2024 GTC 人工智能大会上发表“见证 AI 的变革时刻”主题演讲。本次大会中,英伟达推出了新一代 GPU 架构 Blackwell,并发布了一系列基于该架构的新一代硬件产品,同时介绍了其软件生态进展。 点评 新 一代 GPU 架构 Blackwell: 高带宽+第二代 Transformer 引擎,更大更高效。Blackwell 架构旨在降低 AI 计算的成本和能耗,实现更大模型的训练和计算能力的扩展。Blackwell GPU 采用了台积电定制的 4NP 工艺制造,由两颗芯片通过 NV-HBI( 高 达 10TB/s 的芯片到芯片带宽)连接行程一个逻辑芯片,从而集成 2080 亿个晶体管(H100 为 800亿个),AI 性能是上一代 Hopper 架构 H100 芯片的 5 倍;采用第二代 Transformer 引擎,可支持支持双倍的计算和模型大小;搭载第五代 NVLink 技术(第四代 NVLink Switch 芯 片),为每个 GPU 提供 1.8TB/s 的双向吞吐量,以支持多达 576 个 GPU 域内直连为 10 万亿参数级别和基于混合专家模型(MoE)的 LLM 提供高速通信;配备 RAS引擎提供芯片级别的防性维护功能;配备安全 AI,能够高效保护 AI 模型和客户数据,并支持新的本机接口加密协议;全新解压缩引擎支持最新的格式,可加速数据库查询以提供提供最高性能的数据分析和数据科学领域应用。 AI 计 算 业务线产品全面更新,超算拓展性大大提高。基于 Blackwell 芯片,英伟达更新了 AI 计算业务线多款产品,包括新一代 HGX 加速服务器平台 HGX B100/B200 以取代上一代 HGX H100/H200,新一代 DGX AI 计算平台 DGX B200;基于 NVLink-C2C 技术组合 2*B200 GPU+1*Grace CPU 的新一代 GB200 Grace-Blackwell 超 级芯片;基于 36 个GB200 超级芯片(18 个 GB200 服务器节点)的 AI 服务器机架式解决方案 DGX GB200 NVL72,搭载一体式液冷散热和 5,000 条独立线缆,相比基于前一代 H100 的同等规模计算平台,其 LLM 训练性能提高 4 倍、推理性能提高 30倍 ,能源消耗降低 25 倍;在 GB200 NVL72 基础上,通过 NVIDIA Quantum-X800 InfiniBand 网络或 NVIDIA Spectrum™-X800 以太网络组网连接,可拓展成支持数万个 GB200 的 DGX SuperPOD 超 级计算机系统。 软 件生态快速成长。1)微服务(Microservices) 简化企业生成式 AI 部署。英伟达面向企业推出了一系列生成式 AI微服务,旨在帮助企业在自己的平台上开发和部署定制应用程序,提高 AI 应用的安全性和可控性。例如 NIM 推理微 服务通过提供 AI 容器、推理优化和行业标准 API,大幅提高生成式 AI 应用程序的部署时间;CUDA-X 微服务针对数据准备、定制和训练提供端到端的开发模块,加速各领域的 AI 应用开发,包括可定制的语音和翻译 AI 的 NVIDIA Riva、用于路径优化的 NVIDIA cuOpt™用于户高分辨率气候和天气模拟的 NVIDIA Earth-2,还包括例如 RAG、数据微调等面相数据处理的一系列 NeMo 微服务。2)全新 Omniverse Cloud API 发 布。英伟达对其计算机图形与仿真模拟平台 Omniverse 推出了包括 USD Render、USD Write、USD Query、USD Notify 和 Omniverse Channel 共 5 款 API,使开发者可以更加便捷地访问其服务并将其整合到数字孪生设计、机器人和自动驾驶测试等领域。 全 链条服务加速机器人开发。机器人领域,英伟达推出了专用计算平台 Jetson Thor 以提供充足算力支持机器人完成复杂任务并与人和机器进行安全、自然的交互,该平台采用模块化架构,搭载下一代 Blackwell GPU,可提供800TFLOPS@INT8 的 AI 算力。软件层面,除了 Omniverse 仿真模拟平台以外,英伟达还发布了多模态人形机器人通用基础模型 Project GR00T(Generalist Robot 00 Technology),并推出 Isaac 机器人平台的最新进展,例如针对机械臂的模型和 GPU 加速库 Isaac Manipulator、针对 AMR 的视觉 AI 模型 Isaac Perceptor 以及用于大规模训练人形机器人模型的模拟软件 Isaac Lab,同时推出全新云原生工作流编排平台 OSMO 用于调度和管理自主机器人工作负载。 [Table_Title] 研究报告 Research Report 21 Mar 2024 中国科技战略 China Technology Strategy 英伟达 GTC 2024:从硬件到软件的 AI 全链条服务 NVIDIA GTC 2024: Full-chain AI Services from Hardware to Software 姚书桥 Barney Yao 王凯 Kai Wang, CFA barney.sq.yao@htisec.com k.wang@htisec.com 21 Mar 2024 2 [Table_header1] 中国科技战略 China Technology Strategy AI 赋 能 汽车智能化,多家中国车企定点下一代车载计算平台 Drive Thor。 汽车领域,英伟达宣布其下一代车规级计算平台 Drive Thor 既理想、极氪定点之后已获比亚迪、广汽埃安昊铂和小鹏汽车定点,文远知行、Nuro、Plus( 智加科技)、Waabi 等自动驾驶公司也计划采用 Drive Thor 平台开发 L4 级别自动驾驶解决方案。该平台于英伟达在 GTC 2022 大会中首次发布,基于 Blackwell 架构打造,设计为 ASIL-D 功能安全,专为 Transformer、LLM 和生成式 AI 工作负载设计,单芯片算力可达 2000
[海通国际]:中国科技行业战略:英伟达GTC 2024,从硬件到软件的AI全链条服务,点击即可下载。报告格式为PDF,大小2.48M,页数13页,欢迎下载。
