NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
2023-01-21 07:55:34AI云资讯1315
2022年3月的GTC技术大会上,NVIDIA正式发布了首款数据中心CPUGrace,同时打造了两颗超级芯片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一。
现在,NVIDIA官方详细揭示了Grace Superchip超级芯片的设计与性能、能效。
它通过NVLink-C2C芯片间互连总线,将两颗Grace CPU整合在一块基板上,彼此之间的双向带宽多达900GB/s。

Grace CPU基于Armv9-A 9.0架构、Neoverse V2 64位内核,以4个128-bit功能单元的方式配置了两组SIMD矢量指令集,一是SVE 2(缩放矢量扩展第二版),二是NEON(高级SIMD)。
它还支持LSE(大型系统扩展),可提供低成本的原子操作,改进CPU通信吞吐。
NVIDIA声称,这种核心的能效,是如今服务器常见x86核心的2倍。


Grace CPU单颗集成72个核心,互相通过3.2TB/s超高带宽的NVIDIA缩放一致性Fabric总线互连,而二合一的超级芯片上就是144个核心。
每核心64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存,一颗超级芯片的所有核心共享234MB三级缓存。

内存整合封装了LPDDR5X,最大容量960GB,最高带宽1TB/s(每一颗500GB/s),还支持ECC。
对比传统的八通道DDR5,这种设计不但带宽高出53%,单位功耗也只有1/8。
对比海量带宽的HBM2e,单位成本只有1/3,容量则可达8倍。
扩展支持八组PCIe 5.0 x16,总带宽1TB/s,还有用于管理的低速PCIe通道。

性能方面,一颗超级芯片的FP64双精度峰值浮点性能可达7.1TFlops(每秒7.1万亿次计算),热设计功耗500W。
NVIDIA对比了AMD Zen3架构的霄龙7763 64核心,双路组成128核心,号称性能可领先1.5-2.5倍,能效可领先2.0-3.5倍!
当然,AMD已经有了Zen4架构、最多96核心的霄龙9004系列,NVIDIA Grace依然还没有商用。


相关文章
- Akamai携手NVIDIA实现首个全球规模化部署的NVIDIA AI Grid平台
- Qt Group 加入 NVIDIA Halos 认证计划,加速物理AI的安全自动化
- NVIDIA 通过 RTX PRO 服务器实现游戏开发虚拟化
- NVIDIA 推出代理式 AI 蓝图与电信推理模型,推动自主网络发展
- Check Point 携手 NVIDIA 构建企业级AI 全栈安全体系
- 超聚变专用计算旗舰产品X3智能工作站,搭载NVIDIA驱动打造AI就绪算力
- FLUX.2 图像生成模型发布,针对 NVIDIA RTX GPU 优化
- 超擎数智亮相 NVIDIA 中国开发者日2025,携手开发者,探索AI无限前景
- 超擎数智亮相 NVIDIA 中国开发者日2025,携手开发者,探索AI无限前景!
- 实现吉瓦级灵活部署:维谛推出面向NVIDIA Omniverse DSX蓝图的快速交付系统级参考架构
- 三星携手NVIDIA 以全新AI工厂引领全球智能制造转型
- 超擎速度!全国首批NVIDIA DGX Spark率先抵达超擎数智,现货在仓,交付启动!
- NVIDIA DLSS 4 技术加速游戏体验,沉浸3A首选华硕天选6 Pro锐龙版
- 从概念愿景到工程就绪:维谛携手NVIDIA推进800 VDC 平台设计,助力下一代AI工厂建设
- 亚信科技融合NVIDIA Omniverse,驱动制造业向“智造”跃升
- 绝影亮相NVIDIA展台,端侧多模态大模型落地成果显著









