英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU

2026-04-28 05:58:12AI云资讯1785

(AI云资讯消息)谷歌与英伟达联手,为用户提供高达100万颗英伟达GPU的接入能力,为全新推出的A5X实例提供算力支持。此次发布是双方最新合作,旨在降低推理成本并提升token吞吐量。谷歌A5X系统依托英伟达的网络加速器,能够构建支持AI工作负载的单集群及多集群计算基础设施。

A5X实例是谷歌专为运行智能体类人工智能工作负载而设计的最新产品,属于谷歌AIHypercomputer产品组合的一部分,该组合也为谷歌的Gemini平台及其面向消费者和企业的AI产品提供算力支持。在最新发布的一系列公告中,谷歌宣布对Hypercomputer进行多项升级,包括由定制化Arm架构CPU驱动的新型虚拟机、第八代张量处理器、对PyTorch的原生TPU支持,以及A5X实例。

这些新功能专为智能体类AI工作负载而设计,此类负载依赖一组AI智能体,以分步协作的方式解决某个问题或完成任务。A5X实例是谷歌首批基于英伟达最新Vera Rubin AI GPU设计的产品。

根据披露的细节,A5X将采用英伟达ConnectX-9智能网卡,该网卡专为在以太网运行的云基础设施中加速AI工作负载而设计。这些网卡配合谷歌的Virgo平台,将使用户能够在单个集群中接入多达8万颗Rubin GPU,在多站点集群中接入多达96万颗GPU。

谷歌的Virgo平台能够将同一数据中心内的多颗AI芯片互联互通。该平台不仅兼容英伟达的RubinGPU,还支持谷歌自家的张量处理器(TPU)。Virgo可在单个数据中心内连接多达13.4万颗TPU,跨多个站点则可连接超过100万颗芯片。据英伟达称,与上一代产品相比,A5X实例能够将每token的推理成本降低10倍,并将每兆瓦的吞吐量提升10倍。

英伟达还简要提及了物理AI与工业AI领域,透露Cadence和Siemens等公司的产品由其基础设施提供支持,并已在Google Cloud上线。该公司补充说,谷歌的Gemini平台还能在网络安全等行业部署智能体模型和工作流。

相关文章

人工智能企业

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>

人工智能技术

更多>>
AI云资讯(爱云资讯)立足人工智能科技,打造有深度、有前瞻、有影响力的泛科技信息平台。
合作QQ:1211461360微信号:icloudnews