英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
2026-04-28 05:58:12AI云资讯3114

(AI云资讯消息)谷歌与英伟达联手,为用户提供高达100万颗英伟达GPU的接入能力,为全新推出的A5X实例提供算力支持。此次发布是双方最新合作,旨在降低推理成本并提升token吞吐量。谷歌A5X系统依托英伟达的网络加速器,能够构建支持AI工作负载的单集群及多集群计算基础设施。
A5X实例是谷歌专为运行智能体类人工智能工作负载而设计的最新产品,属于谷歌AIHypercomputer产品组合的一部分,该组合也为谷歌的Gemini平台及其面向消费者和企业的AI产品提供算力支持。在最新发布的一系列公告中,谷歌宣布对Hypercomputer进行多项升级,包括由定制化Arm架构CPU驱动的新型虚拟机、第八代张量处理器、对PyTorch的原生TPU支持,以及A5X实例。
这些新功能专为智能体类AI工作负载而设计,此类负载依赖一组AI智能体,以分步协作的方式解决某个问题或完成任务。A5X实例是谷歌首批基于英伟达最新Vera Rubin AI GPU设计的产品。

根据披露的细节,A5X将采用英伟达ConnectX-9智能网卡,该网卡专为在以太网运行的云基础设施中加速AI工作负载而设计。这些网卡配合谷歌的Virgo平台,将使用户能够在单个集群中接入多达8万颗Rubin GPU,在多站点集群中接入多达96万颗GPU。
谷歌的Virgo平台能够将同一数据中心内的多颗AI芯片互联互通。该平台不仅兼容英伟达的RubinGPU,还支持谷歌自家的张量处理器(TPU)。Virgo可在单个数据中心内连接多达13.4万颗TPU,跨多个站点则可连接超过100万颗芯片。据英伟达称,与上一代产品相比,A5X实例能够将每token的推理成本降低10倍,并将每兆瓦的吞吐量提升10倍。
英伟达还简要提及了物理AI与工业AI领域,透露Cadence和Siemens等公司的产品由其基础设施提供支持,并已在Google Cloud上线。该公司补充说,谷歌的Gemini平台还能在网络安全等行业部署智能体模型和工作流。相关文章
- 英伟达发布RTX Spark芯片,高调杀入PC市场
- 维谛(Vertiv)将在COMPUTEX展示首个面向英伟达NVIDIA Omniverse DSX Blueprint的全融合物理基础设施数字孪生能力
- AI驱动量子计算风口已至!英伟达/微美全息抢占高地锁定量子生态席位!
- 英伟达首席财务官调侃竞争对手因存储芯片短缺措手不及
- SpaceXAI宣布将向Anthropic开放搭载22万张英伟达GPU的巨像一号超级计算机
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- Anthropic看中英国初创公司融合技术,以仅英伟达Groq十分之一的成本,实现百倍速度的AI推理
- 英伟达发布开源AI模型Neomotron 3 Nano Omni,性能提升高达9倍
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 英伟达的真正实力在于基础设施,但投资融合的掌控力也不容忽视
- 美光为英伟达Vera Rubin平台量产36GB HBM4、28Gbps PCIe Gen6固态硬盘及192GB SOCAMM2内存
- 英伟达发布新一代超分辨率技术DLSS 5:神经渲染加持,颠覆性视觉提升
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









