单存储节点支持700+ GPU训练!华瑞指数云首秀登顶MLPerf全球存力榜
2025-08-07 16:28:54AI云资讯2215
北京时间8月4日23时,全球最具权威的AI性能基准评测组织MLCommons®正式发布了最新一轮MLPerf™Storage v2.0存储性能基准测试的结果。华瑞指数云ExponTech作为AI-Native企业级全场景数据基础设施的领导者,与DDN, IBM, HPE, 华为,Hammerspace等众多国际国内领先的厂商同台竞技,凭借创新技术方案和产品参与测试,取得极为出色的成绩,多项指标位居世界第一。
本次测试中,ExponTech与合作伙伴英伟达,Scaleflux, AIC深度合作,采用了软件,硬件均有显著创新的产品方案,目标是验证在AI场景下,采用新一代分布式存储软件栈驱动更加精简,高效的硬件方案,达到更高的性能密度,容量密度和更低的成本,同时在网络方面采用RoCE网络,验证其大规模组网能力以及整体存储方案的大规模扩展能力和并行访问能力。
硬件方面:
与其他参测者采用的许多台高配置的存储服务器+IB网络的整体方案不同,ExponTech方案的存储节点仅使用一台2U的AIC盘框(JBOF F2026),盘框本身没有配置CPU和内存,没有处理能力,主要提供很高的容量密度和硬件可靠性,2U空间可以最多配置26块SSD盘,本次测试配置24块Scaleflux CSD 5000带压缩功能的SSD盘。
盘框内插入4张英伟达Bluefield-3 DPU卡,每个DPU提供200Gbps*2 RoCE网络带宽。ExponTech WADP分布式存储软件完全运行于DPU内,提供高性能,高可靠,功能丰富的分布式存储层。
网络方面,采用4台英伟达Spectrum-X 交换机组成一个2层的 RoCE 网络, 验证大规模组网时的拥塞控制能力。基于这个2层RoCE网络以及ExponTech WADP分布式存储软件,可以扩展到连接1024台盘框,形成一个EB级容量,上百TB级存储带宽的超大规模高性能存储池。
软件方面:
ExponTech WADP (WiDE AI Data Platform) 分布式存储软件,该软件基于完全自主研发的下一代分布式存储引擎WiDE以及下一代分布式元数据引擎天枢构建,在相同的存储池空间内,向上提供丰富的协议接口,包括块存储(NVMe-oF, vhost, iSCSi, CSI-NVMe-oF),文件存储(POSIX, NFS, SMB), 对象存储(S3),KV接口等。本次测试的WADP软件,以分布式架构的方式完全运行于4张Bluefield-3 DPU内,每张DPU仅配置了一块16核的CPU以及48GB内存,显示了WADP软件栈极其高效的硬件利用效率和IO处理能力。
部署架构图:

测试结果:
1、基于1个2U的存储节点以及1个客户端和2个客户端的测试结果显示,可以轻松满足模型ResNet-50的训练需求,单客户端能够支持的GPU卡的数量最高达到240块,带宽23.6GiB/s,在存储节点硬件采用DPU+JBOF, CPU和内存都不是很强(AI 控成本)的前提下,依然领先参与测试的所有厂商方案,位居世界第一。具体的测试结果数据如下:


通过上述测试数据测算,ExponTech WADP使用一个2U的存储节点,在配置4个客户端的场景下,可以支持超过700块 A100 GPU训练卡和约400块 H100 GPU训练卡的训练需求,稳定提供70+GiB/s的带宽,逼近存储节点网络带宽极限。ExponTech WADP也可以支持扩展到更多的2U存储节点,形成大规模高性能存储集群,支持超大规模的AI训练场景。
2、MLPerf™ Storage v2.0测试新推出的检查点(Checkpoint)工作负载专门针对分布式扩展系统中大型语言模型(LLM)的训练场景,重点优化训练过程的备份与恢复速度。ExponTech WADP方案在Llama3-8B模型的实际测试数据位于全球领先水平。


ExponTech WADP方案的实测写带宽16.9GiB/s, 略低于JINIST(采用Huawei OceanStor A800方案)的19.4GiB/s以及ANL(采用开源DAOS方案)的18.1GiB/s, 位居世界第三。但是值得注意的是,ExponTech WADP方案采用的存储硬件配置远低于前两者,使用的物理盘容量仅为前两者的1/5, 展现了极为优异的存储软件栈效率。如果以Checkpoint写入带宽/容量来计算写入效率,ExponTech WADP排名将遥遥领先居第一。
亮点总结:
超高密度与能效,仅使用单台2U JBOF设备搭载DPU作为存储节点,硬件配置规格远低于其他的测试方案,展示出了超高的容量密度,性能密度和能效。
超高性能表现,在硬件规格非常低的前提下,依然展示了超高性能表现,在Resnet50模型训练测试中,单客户端支持的GPU卡数和带宽排世界第一,Llama3模型的Checkpoint写入带宽排世界第三,但使用了最少的SSD盘数,以Checkpoint写入带宽/容量来计算写入效率,ExponTech WADP方案排名将遥遥领先居第一,展示了WADP存储软件极为高效的硬件利用效率。
极致I/O效率,多轮测试均稳定保持96%以上的GPU平均利用率(AU)。
弹性扩展能力,WADP分布式软件架构可并行扩展到1024个节点,实现存储容量,IOPS和带宽的同步并行扩展,同时保持稳定的微秒级时延。
可扩展网络验证,四台NVIDIA Spectrum-X交换机搭建两层RoCE网络,拥塞控制表现优异。结合ExponTech WADP分布式存储软件,方案可横向扩展至超大规模AI训练/推理场景。
存储效率倍增,ScaleFlux CSD5000 SSD提供透明数据压缩/解压缩,在零性能损耗、无额外资源消耗前提下实现存储容量与效率倍增。
首次参与即在MLPerf™ Storage v2.0 AI Storage基准测试中取得优异成绩,这一成就不仅彰显了华瑞指数云ExponTech存储技术的强劲实力,更标志着华瑞指数云ExponTech在业界又达成了一个关键里程碑。此次测试延续了WADP(以其子产品WDS名义)在2023年创下的SPC-1基准测试世界纪录,印证了其在企业关键业务(SPC-1:全球存储性能委员会)与AI工作负载(MLPerf Storage)领域的双重竞争力,是目前全球唯一的一个能够在SPC-1和MLPerf Storage上都能够测试出顶级成绩的分布式存储软件,成为真正覆盖全场景的企业级AI统一平台。在未来企业把AI工作负载与企业关键业务进行结合,实现AI能力在企业业务流程中全面落地的过程中,ExponTech WADP平台将发挥出更加全面的价值。
未来,华瑞指数云ExponTech将在AI大模型领域持续深耕,不断突破性能极限,打造全球领先的AI数据平台,为企业赋能新质生产力。在统一的数据平台产品上同时承载企业的核心生产系统和 AI 数据管道,帮助企业把核心生产数据与 AI 能力相结合,实现 AI 在企业级场景的快捷落地。近期,华瑞指数云ExponTech将正式发布ExponTech WADP的最新版本,一款融合支持企业级生产业务和AI训练推理业务,面向企业级AI的统一数据平台底座产品,欢迎持续关注。
相关文章
- 软硬协同价值升维:aigo存储发布AP10,重塑“友好存储”新标杆
- AI 加持 + 专属存储模式,百奥 PD16LD 让大空间告别潮湿与损耗
- 忆联亮相2026移动云大会,以全场景AI存储方案共筑Token智能新生态
- 暴涨超40%!存储芯片领跑一季度工业增长,超级周期持续发酵
- 绿联携AI NAS参展英特尔峰会,定义智能存储新生态
- 绿联AI NAS亮相英特尔“智存无界·芯联未来“峰会,展现AI存储创新实力
- 媒体观察:让AI走向数据,IBM重写存储“第一性原理”
- 国产品牌的工业设计,到了什么阶段?从 aigo 存储三款红点产品说起
- 海康存储携多款新品亮相2026北京车展 演绎汽车存储新生态
- 从追赶者到“智造”标杆:国内存储厂家金胜电子入选龙华区创新百强
- 简化运维,Dell PowerStore革新Kubernetes容器化存储体验
- 海康存储亮相2026人工智能基础设施峰会 加速布局AI推理存储新赛道
- 梵想亮相HK环球资源展 AIoT矩阵引领智能存储新生态
- 三星推出新款T7 microSD及T9 microSD存储卡,进一步完善其可移动存储产品阵容
- 加码存储布局,积塔构建方案化代工新范式
- 超擎数智获授“ODCC AI存储实验室”, 创新引领大规模推理应用新纪元
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









