2025年ETH-X Scale Up 协议测试报告
[编号ODCC-2025-03005]ETH-X Scale Up协议测试报告前言本测试报告依据《ETH-X Scale Up 互联协议规范》,通过原型验证平台,完整实现了 ETH-X 事务层,链路层,物理层的协议,与国内先进交换机通过 400G 接口进行组网,测试了 PAXI PRI 增强承载在典型场景下的可行性和性能指标。报告包含了组网连通性、交换机转发性能、Direct Access 性能、Direct Copy 性能以及 MOE 通信性能多种类型测试,初步验证了该协议在转发时延、端到端通信时延、有效吞吐等关键指标方面能够满足 scale-up 网络通信需求,为后续工程优化与部署提供参考。目录一、 测试背景 ...................................................... 1二、 测试目标和范围 ................................................ 1三、 术语和缩略语 .................................................. 2四、 测试环境和方法 ................................................ 3五、 组网连通性测试 ................................................ 4(一)端到端 RoCEv2 报文收发 .................................. 5(二)端到端 PAXI 报文收发 .................................... 6六、 转发性能测试 .................................................. 7(一)报文转发时延 ........................................... 8七、 Direct Access 性能测试 .........................................9(一)报文承载效率 .......................................... 101. RoCEv2 报文承载效率 ......................................102. ETH-X PAXI PRI 增强报文承载效率 ..........................12(二)单事务响应时延 ........................................ 141. PAXI PRI 增强承载写操作时延 ..............................142. PAXI PRI 增强承载读操作时延 ..............................15(三)访存队列有效吞吐 ...................................... 161. PAXI PRI 增强承载写操作有效吞吐 ..........................162. PAXI PRI 增强承载读操作有效吞吐 ..........................18八、 Direct Copy 性能测试 ..........................................20(一)HBM 间数据拷贝吞吐 .................................... 201. RoCEv2 有效吞吐 ..........................................202. PAXI PRI 增强承载有效吞吐 ................................21九、 MOE 通信性能测试 ..............................................23(一)Dispatch 通信完成时间 ................................. 231. RoCEv2 通信完成时间 ......................................232. PAXI PRI 增强承载通信完成时间 ............................24(二)Combine 通信完成时间 .................................. 261. RoCEv2 通信完成时间 ......................................262. PAXI PRI 增强承载通信完成时间 ............................27(三)AlltoAll 通信性能 ..................................... 281. RoCEv2 通信性能 ..........................................282. PAXI PRI 增强承载通信性能 ................................29图 目 录图 1测试组网环境 ..............................................3图 2原型验证平台 ..............................................4图 3RDMA 工作计时模型 ......................................... 4图 4转发时延计算 ..............................................8ETH-X Scale Up 协议测试报告(ODCC-2025-03005)1一、测试背景随着人工智能(AI)模型规模持续扩展,尤其是在大规模训练和推理场景中,计算集群内部的互联性能已经成为影响整体系统效率和可扩展性的关键因素。ETH-X 项目制定了《ETH-X Scale Up 互联协议规范》,该互联协议面向超节点架构,提供高吞吐、低时延的高性能互联能力,实现 GPU 之间的高效数据访问,满足对数据传输效率和系统扩展性有严格要求的场景需求。本测试报告依据《ETH-X Scale Up 互联协议规范》,围绕协议核心能力开展测试,验证其在典型场景下的可行性和性能优势,为后续工程优化与部署提供支撑。二、测试目标和范围本测试报告聚焦于 ETH-X Scale up 协议(PAXI+PRI)关键能力验证与性能评估,重点覆盖通信时延、吞吐性能等核心指标。测试过程中,引入主流传统互联技术 RoCEv2 作为对比基线,采用对比分析的方法,初步验证该协议在关键性能指标方面的先进性与技术可行性。测试结果将为协议的后续功能优化、标准化推进及工程部署提供量化的数据支持和技术参考。本次测试覆盖了从基础连接能力到典型通信场景,包含组网连通性测试、转发性能测试、Direct Access 性能测试、Direct Copy 性能测试以及 MOE 通信性能测试。1)组网连通性测
2025年ETH-X Scale Up 协议测试报告,点击即可下载。报告格式为PDF,大小8.43M,页数36页,欢迎下载。
