Aurora有望成为世界第一超算: 搭载英特尔21248个CPU和63744个GPU
2023-06-28 15:40:13爱云资讯626
阿贡国家实验室和英特尔于近日宣布,Aurora超级计算机的 10,624 个刀片的安装已经完成,该系统将于 2023 年晚些时候上线。该机器使用数万个 Xeon Max“Sapphire Rapids”处理器,配备 HBM2E 内存以及数以万计的数据中心 GPU Max“Ponte Vecchio”计算 GPU 可实现超过 2 FP64 ExaFLOPS 的性能。 这个由HPE 制造的 Aurora 超级计算机由 166 个机架组成,每个机架有 64 个刀片,总共 10,624 个刀片。每个 Aurora 刀片均基于两个 Xeon Max CPU(具有 64 GB 封装 HBM2E 内存)以及六个 Intel Data Center Max“Ponte Vecchio”计算 GPU。这些 CPU 和 GPU 将通过定制的液体冷却系统进行冷却。
(图片来源:英特尔)
Aurora 超级计算机总共配备了 21,248 个通用 CPU,拥有超过 110 万个高性能核心、19.9 PB 的 DDR5 内存、连接到 CPU 的 1.36 PB HBM2E 内存以及 63,744 个专为大规模并行 AI 和 HPC 工作负载而设计的计算 GPU,板载 8.16 PB HBM2E 内存。这些刀片使用专为超级计算机设计的 HPE Slingshot 结构进行互连。 英特尔公司副总裁兼超级计算事业部总经理 Jeff McVeigh 表示:“Aurora 是英特尔 Max 系列 GPU 的首次部署、最大的基于 Xeon Max CPU 的系统以及全球最大的 GPU 集群。” “我们很自豪能够成为这个历史性系统的一部分,并对 Aurora 将实现的突破性人工智能、科学和工程感到兴奋。” Aurora超级计算机采用由1024个固态存储设备组成的存储节点阵列,提供220PB的容量以及31TB/s的总带宽,这将有助于处理涉及海量数据集的工作负载,例如核聚变研究、科学工程、物理模拟、治疗研究、天气预报和其他任务。
(图片来源:阿贡国家实验室)
虽然 Aurora 刀片的安装已经完成,但超级计算机尚未通过验收测试。当它在今年晚些时候上线时,它有望达到超过 2 ExaFLOPS 的理论峰值性能,使其成为进入 Top500 列表时第一台达到这一性能水平的超级计算机。 阿贡国家实验室副实验室主任 Rick Stevens 表示:“在我们努力进行验收测试的同时,我们将使用 Aurora 来训练一些大规模的开源生成人工智能模型用于科学。” “Aurora 拥有超过 60,000 个 Intel Max GPU、非常快的 I/O 系统和全固态大容量存储系统,是训练这些模型的完美环境。”
(图片来源:阿贡国家实验室)
虽然 Aurora 超级计算机尚未通过测试,ANL 尚未向 Top500.org 提交其性能结果,但英特尔借此机会分享了其硬件相对于 AMD 和 Nvidia 的竞争解决方案的性能优势。 据英特尔称,Max 系列 GPU 的初步测试表明,它们在“现实世界的科学和工程工作负载”方面表现出色,在 OpenMC 上提供的性能是 AMD Instinct MI250X GPU 的两倍,并且几乎可以完美地跨数百个节点进行扩展。此外,英特尔表示,其英特尔至强 Max 系列 CPU 在众多实际 HPC 应用中比竞争对手的性能优势高出 40%,这些应用包括 HPCG、NEMO-GYRE、Anerlastic Wave Propagation、BlackScholes 和 OpenFOAM。
相关文章
- 英特尔亮相火山引擎春季原动力大会,共同发布第四代通用型计算实例家族
- 盘中未来:英特尔为农业和生态注入AI科技
- AMD数据中心业务强势扩张,服务器CPU市场份额有望在2026年追平英特尔
- 英特尔推进技术创新,以规模更大的封装满足AI应用需求
- 英伟达与联发科合作开发首款面向游戏笔记本的加速处理器,与英特尔和AMD展开竞争
- 英特尔代工:客户信任为先,推进系统级技术创新和可持续制造
- 英特尔在Linux的Mesa图形驱动中列出四款全新Battlemage显卡,预示新一代游戏GPU即将发布
- 低成本也能实现大模型应用开发,英特尔与火山引擎是怎么做到的?
- 全新英特尔至强6处理器,以PCT技术加速AI工作负载
- 英特尔全新GPU亮相Computex 2025:高显存+多卡扩展,释放创作潜能
- 英特尔以系统级代工模式促进生态协同,助力客户创新
- 英特尔持续推进核心制程和先进封装技术创新,分享最新进展
- 从算力升级到场景落地,英特尔与阿里云联手为智能应用开辟 “快车道”
- 智能应用落地慢、成本高?英特尔 + 阿里云给出 “降维打击” 方案!
- 更强劲、更稳定、更划算!阿里云 ECS g9i +英特尔至强 6 处理器,解锁智能应用的 “超现实速度”
- 英特尔代工:明确重点广合作,服务客户铸信任