英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
2026-04-28 05:58:12AI云资讯1785

(AI云资讯消息)谷歌与英伟达联手,为用户提供高达100万颗英伟达GPU的接入能力,为全新推出的A5X实例提供算力支持。此次发布是双方最新合作,旨在降低推理成本并提升token吞吐量。谷歌A5X系统依托英伟达的网络加速器,能够构建支持AI工作负载的单集群及多集群计算基础设施。
A5X实例是谷歌专为运行智能体类人工智能工作负载而设计的最新产品,属于谷歌AIHypercomputer产品组合的一部分,该组合也为谷歌的Gemini平台及其面向消费者和企业的AI产品提供算力支持。在最新发布的一系列公告中,谷歌宣布对Hypercomputer进行多项升级,包括由定制化Arm架构CPU驱动的新型虚拟机、第八代张量处理器、对PyTorch的原生TPU支持,以及A5X实例。
这些新功能专为智能体类AI工作负载而设计,此类负载依赖一组AI智能体,以分步协作的方式解决某个问题或完成任务。A5X实例是谷歌首批基于英伟达最新Vera Rubin AI GPU设计的产品。

根据披露的细节,A5X将采用英伟达ConnectX-9智能网卡,该网卡专为在以太网运行的云基础设施中加速AI工作负载而设计。这些网卡配合谷歌的Virgo平台,将使用户能够在单个集群中接入多达8万颗Rubin GPU,在多站点集群中接入多达96万颗GPU。
谷歌的Virgo平台能够将同一数据中心内的多颗AI芯片互联互通。该平台不仅兼容英伟达的RubinGPU,还支持谷歌自家的张量处理器(TPU)。Virgo可在单个数据中心内连接多达13.4万颗TPU,跨多个站点则可连接超过100万颗芯片。据英伟达称,与上一代产品相比,A5X实例能够将每token的推理成本降低10倍,并将每兆瓦的吞吐量提升10倍。
英伟达还简要提及了物理AI与工业AI领域,透露Cadence和Siemens等公司的产品由其基础设施提供支持,并已在Google Cloud上线。该公司补充说,谷歌的Gemini平台还能在网络安全等行业部署智能体模型和工作流。相关文章
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 英伟达的真正实力在于基础设施,但投资融合的掌控力也不容忽视
- 美光为英伟达Vera Rubin平台量产36GB HBM4、28Gbps PCIe Gen6固态硬盘及192GB SOCAMM2内存
- 英伟达发布新一代超分辨率技术DLSS 5:神经渲染加持,颠覆性视觉提升
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
- 英特尔在英伟达GTC大会的完美时机亮相:智能体AI将CPU变为新瓶颈
- 英伟达CEO黄仁勋庆祝GeForce 3问世25周年:没有GeForce,就没有AI
- 英伟达发布Nemotron 3 Super开源智能体AI模型:或成为OpenClaw的理想选择
- 英伟达CEO黄仁勋将AI比作一个五层蛋糕,称其潜力尚未被完全发掘
- Teclab绕过英伟达RTX 50显存时钟限制,将RTX 5070 Ti超频至超过36Gbps
- 全力奔赴AI推理时代,英伟达/微美全息大举进军开启空前爆发盛宴!
- 英伟达将推出新款GeForce RTX 5050显卡,搭载9GB GDDR7显存
- 英伟达将向两家光子技术公司注资40亿美元,抢占AI竞争制高点
- OpenAI宣布获得亚马逊、英伟达和软银新融资1100亿美元
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









