英伟达Rubin芯片落地谷歌A5X实例，多站点集群规模扩展至近百万颗GPU-AI云资讯

（AI云资讯消息）谷歌与英伟达联手，为用户提供高达100万颗英伟达GPU的接入能力，为全新推出的A5X实例提供算力支持。此次发布是双方最新合作，旨在降低推理成本并提升token吞吐量。谷歌A5X系统依托英伟达的网络加速器，能够构建支持AI工作负载的单集群及多集群计算基础设施。

A5X实例是谷歌专为运行智能体类人工智能工作负载而设计的最新产品，属于谷歌AIHypercomputer产品组合的一部分，该组合也为谷歌的Gemini平台及其面向消费者和企业的AI产品提供算力支持。在最新发布的一系列公告中，谷歌宣布对Hypercomputer进行多项升级，包括由定制化Arm架构CPU驱动的新型虚拟机、第八代张量处理器、对PyTorch的原生TPU支持，以及A5X实例。

这些新功能专为智能体类AI工作负载而设计，此类负载依赖一组AI智能体，以分步协作的方式解决某个问题或完成任务。A5X实例是谷歌首批基于英伟达最新Vera Rubin AI GPU设计的产品。

根据披露的细节，A5X将采用英伟达ConnectX-9智能网卡，该网卡专为在以太网运行的云基础设施中加速AI工作负载而设计。这些网卡配合谷歌的Virgo平台，将使用户能够在单个集群中接入多达8万颗Rubin GPU，在多站点集群中接入多达96万颗GPU。

谷歌的Virgo平台能够将同一数据中心内的多颗AI芯片互联互通。该平台不仅兼容英伟达的RubinGPU，还支持谷歌自家的张量处理器（TPU）。Virgo可在单个数据中心内连接多达13.4万颗TPU，跨多个站点则可连接超过100万颗芯片。据英伟达称，与上一代产品相比，A5X实例能够将每token的推理成本降低10倍，并将每兆瓦的吞吐量提升10倍。

英伟达还简要提及了物理AI与工业AI领域，透露Cadence和Siemens等公司的产品由其基础设施提供支持，并已在Google Cloud上线。该公司补充说，谷歌的Gemini平台还能在网络安全等行业部署智能体模型和工作流。

英伟达Rubin芯片落地谷歌A5X实例，多站点集群规模扩展至近百万颗GPU

相关文章

AI企业

AI硬件

AI产业

AI技术