通信行业AI算力架构系列2:腾讯发布星脉网络2.0,可支撑超10万卡集群
敬请阅读末页的重要说明 证券研究报告 | 行业点评报告 2024 年 07 月 03 日 推荐(维持) AI 算力架构系列 2: TMT 及中小盘/通信 事件:7 月 1 日,腾讯宣布其自研星脉高性能计算网络全面升级,升级后的星脉网络 2.0 搭载全自研的网络设备与 AI 算力网卡,可支持超 10 万张卡的超大规模组网,网络通信效率较星脉网络 1.0 提升 60%、大模型训练效率提升 20%。 ❑ 腾讯推动自研星脉网络全面升级,国内智算网络性能再上新台阶。根据腾讯云数据,升级后的星脉网络 2.0 相比于上一代:1)组网规模翻倍:支持单集群超 10 万张 GPU 卡组网;2)网络通信与大模型训练效率显著提升:网络通信效率提升 60%、大模型训练效率提升 20%,如同样的训练集群,计算结果同步时间由上一代的 100 秒降至当前的 40 秒,大模型训练时间由此前的50 天降至 40 天;3)排障能力全面提升:万卡集群故障卡顿、慢节点定位时间由天级降至分钟级。 ❑ 具体来看,星脉网络 2.0 实现四大关键组件能力提升。 1)自研关键设备,智算基建全面升级。在硬件层面,腾讯星脉网络采用全自研网络设备,2.0 版本中自研交换机容量由 25.6T 提升至 51.2T(128 个400G 端口)、自研硅光模块速率由 200G 升级至 400G,并搭载腾讯自研算力网卡(采用最新一代 FPGA 芯片,整卡带宽可达 400G),整机通信带 宽 达 3.2T , 为 业 界 最 高 。 组 网 能 力 方 面 , 腾 讯 星 脉 网 络 采 用“Block-Pod-Cluster”分级架构,以星脉网络 2.0 单 Block 包含 1,024 张GPU、单 Pod 包含 64 个 Block、单 Cluster 包含 2 个 PoD 计算,可支持131,072 张 GPU 组网,单集群 51.2T 三级组网便可以完成超 10 万张卡集群搭建。 2)自研 TiTa 协议 2.0,实现主动拥塞控制算法。腾讯在自研算力网卡上运行自研通信协议 TiTa 2.0(上一代组网中,通信协议部署在交换机上),搭载腾讯主动拥塞控制算法,根据实时网络情况控制数据包发送速率,提前避免拥堵情况发生,并通过智能调度实现网络快速自愈。 3)全新通信库 TCCL 2.0,让 GPU 保持最优性能。腾讯最新高性能集合通信库 TCCL 2.0 通过 NVLink+NET 异构并行通信、Auto-Tune Network Expert 自适应算法等实现数据并行传输,并自动调整数据包分割大小、匹配算法等,帮助 GPU 保持最优性能。 4)运营系统新增灵境仿真平台,排障速度降至分钟级。星脉网络 2.0 运营系统新增腾讯独家灵境仿真平台,可实现 GPU 节点问题精准定位,万卡级训练集群故障卡顿、慢节点定位时间由天级降至分钟级。 ❑ 借助星脉高性能网络,腾讯混元大模型实现快速迭代。基于星脉网络构建的大模型训练集群,其训练速度将为主流框架的 2.6 倍,推理成本将较主流框架下降 70%,并支持国产主流硬件适配。当前,借助星脉网络,腾讯混元大模型已拓展至万亿参数规模,在通用基础能力与专业应用能力方面均处于国内主流大模型领先地位。对内,腾讯内部超 400 个业务及场景接入腾讯混元;对外,腾讯联合生态伙伴提供 50 个行业大模型解决方案。我们认为,星脉网络的迭代升级将有效提升国内大模型的训练效率、降低训练侧成本与推理侧应用门槛,有望在全面自主可控的基础上助力国产大模型应用的加速铺开。 ❑ 风险提示:宏观经济超预期扰动、国内算力基础设施投资不及预期、国内智 行业规模 占比% 股票家数(只) 193 3.8 总市值(十亿元) 2621.8 3.6 流通市值(十亿元) 1964.8 3.0 行业指数 % 1m 6m 12m 绝对表现 -3.2 -13.6 -20.1 相对表现 -0.1 -16.1 -10.4 资料来源:公司数据、招商证券 相关报告 1、《运营商行业系列报告 5:—掘金自由现金流,算力与新质生产力共振》2024-05-29 2、《卫星互联网系列研究报告 3:—“天地一体”手机直连卫星加速演进》2024-05-08 3、《GB200 网络架构测算,1.6T 光模块需求有望超预期—AI 算力架构系列 1》2024-04-17 梁程加 S1090522060001 liangchengjia@cmschina.com.cn 孙嘉擎 S1090523040001 sunjiaqing@cmschina.com.cn -20-100102030Jul/20Nov/20Mar/21Jun/21(%)电子沪深300腾讯发布星脉网络 2.0,可支撑超 10 万卡集群 敬请阅读末页的重要说明 2 行业点评报告 算网络架构后续技术创新不及预期等。 表 1:腾讯 CNIC 算力网卡主要情况 项目 腾讯 CNIC 算力网卡主要能力 负载均衡 全流量逐包负载分担,带宽利用率>97.5% Credit 主动拥塞控制算法 可编程 TiTa 拥塞控制算法(FPGA 升级)、AI 场景仿真带宽利用率>91.5% QP 规格 10K QP 性能保持不变 监控能力 QP 粒度、MPI 粒度 资料来源:ODCC、腾讯云、招商证券 图 1:通信行业历史 PEBand 图 2:通信行业历史 PBBand 资料来源:公司数据、招商证券 资料来源:公司数据、招商证券 10x15x20x25x40x050010001500200025003000350040004500Sep/21Mar/22Sep/22Mar/231.0x1.5x2.0x2.5x3.0x0200400600800100012001400Sep/21Mar/22Sep/22Mar/23 敬请阅读末页的重要说明 3 行业点评报告 分析师承诺 负责本研究报告的每一位证券分析师,在此申明,本报告清晰、准确地反映了分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。 评级说明 报告中所涉及的投资评级采用相对评级体系,基于报告发布日后 6-12 个月内公司股价(或行业指数)相对同期当地市场基准指数的市场表现预期。其中,A 股市场以沪深 300 指数为基准;香港市场以恒生指数为基准;美国市场以标普 500 指数为基准。具体标准如下: 股票评级 强烈推荐:预期公司股价涨幅超越基准指数 20%以上 增持:预期公司股价涨幅超越基准指数 5-20%之间 中性:预期公司股价变动幅度相对基准指数介于±5%之间 减持:预期公司股价表现弱于基准指数 5%以上 行业评级 推荐:行业基本面向好,预期行业指数超越基准指数 中性:行业基本面稳定,预期行业指数跟随基准指数 回避:行业基本面转弱,预期行业指数弱于基准指数 重要声明 本报告由招商证券股份有限公司(以下简称“本公司”)编制。本公司具有中国证监会许可的证券投资咨询业务资格。本报告基于合法取得的信息,但本公司对这些信息的准确
[招商证券]:通信行业AI算力架构系列2:腾讯发布星脉网络2.0,可支撑超10万卡集群,点击即可下载。报告格式为PDF,大小0.61M,页数3页,欢迎下载。
