NVIDIA 144核心超级CPU揭秘：3.5倍能效碾压AMD 128核心-AI云资讯

2022年3月的GTC技术大会上，NVIDIA正式发布了首款数据中心CPUGrace，同时打造了两颗超级芯片，一是Grace CPU二合一，二是Grace CPU＋Hopper GPU二合一。

现在，NVIDIA官方详细揭示了Grace Superchip超级芯片的设计与性能、能效。

它通过NVLink-C2C芯片间互连总线，将两颗Grace CPU整合在一块基板上，彼此之间的双向带宽多达900GB/s。

Grace CPU基于Armv9-A 9.0架构、Neoverse V2 64位内核，以4个128-bit功能单元的方式配置了两组SIMD矢量指令集，一是SVE 2(缩放矢量扩展第二版)，二是NEON(高级SIMD)。

它还支持LSE(大型系统扩展)，可提供低成本的原子操作，改进CPU通信吞吐。

NVIDIA声称，这种核心的能效，是如今服务器常见x86核心的2倍。

Grace CPU单颗集成72个核心，互相通过3.2TB/s超高带宽的NVIDIA缩放一致性Fabric总线互连，而二合一的超级芯片上就是144个核心。

每核心64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存，一颗超级芯片的所有核心共享234MB三级缓存。

内存整合封装了LPDDR5X，最大容量960GB，最高带宽1TB/s(每一颗500GB/s)，还支持ECC。

对比传统的八通道DDR5，这种设计不但带宽高出53％，单位功耗也只有1/8。

对比海量带宽的HBM2e，单位成本只有1/3，容量则可达8倍。

扩展支持八组PCIe 5.0 x16，总带宽1TB/s，还有用于管理的低速PCIe通道。

性能方面，一颗超级芯片的FP64双精度峰值浮点性能可达7.1TFlops(每秒7.1万亿次计算)，热设计功耗500W。

NVIDIA对比了AMD Zen3架构的霄龙7763 64核心，双路组成128核心，号称性能可领先1.5-2.5倍，能效可领先2.0-3.5倍！

当然，AMD已经有了Zen4架构、最多96核心的霄龙9004系列，NVIDIA Grace依然还没有商用。

NVIDIA 144核心超级CPU揭秘：3.5倍能效碾压AMD 128核心