英伟达推出下一代AI超级芯片Blackwell Ultra GB300和Vera Rubin
2025-03-19 06:35:03AI云资讯49058

(AI云资讯消息)在人工智能大潮的推动下,英伟达现在每秒盈利2300美元。英伟达数据中心业务规模庞大,甚至其网络硬件的收入也超过了游戏GPU。3月18日,英伟达公司宣布了其希望扩大其领先优势的AI GPU:Blackwell Ultra GB300将于今年下半年上市,Vera Rubin将于2026年下半年推出,而Rubin Ultra则将在2027年下半年面推出。
今年的Blackwell Ultra并不是最初预期的那样,因为英伟达去年曾表示,将以每年一次的频率推出新的AI芯片,速度比以往任何时候都快,而Blackwell Ultra并非基于全新架构。在3月18日的GDC主题演讲中,英伟达很快便跳过了Blackwell Ultra,转而公布了下一个架构Vera Rubin,其整机架性能应是同等配置的 Blackwell Ultra的3.3 倍。

英伟达并未明确说明Blackwell Ultra比最初的Blackwell强多少。在与记者的预先简报中,英伟达透露,单颗Ultra芯片将提供与Blackwell相同的每秒20 千万亿次的人工智能性能,但内存从192GB的HBM3e增加到了288GB。与此同时,Blackwell Ultra DGX GB300 Superpod集群将提供与Blackwell版本相同的288个CPU、576个GPU和每秒11.5千万亿次的FP4计算能力,但内存从240TB增加到了300TB。
英伟达主要将其新推出的 Blackwell Ultra 与 2022 年的 H100 芯片进行了比较,H100 芯片助力英伟达在人工智能领域大获成功,而领先企业或许也正考虑对其进行升级:Blackwell Ultra在FP4推理性能上提升了1.5倍,并且能够显著加快人工智能推理速度,其NVL72集群能够运行交互式DeepSeek-R1 671B模型,只需10秒就能给出答案,而H100则需要1.5分钟。英伟达表示,这是因为Blackwell Ultra每秒能处理1000个token,是英伟达2022年芯片的10倍。

但一个引人关注的不同之处在于,一些公司将能够购买单颗Blackwell Ultra芯片:英伟达宣布了一款名为DGX Station的台式机,其搭载了单颗GB300 Blackwell Ultra芯片,拥有784GB的统一系统内存、内置800Gbps英伟达网络以及承诺的每秒20千万亿次的人工智能性能。华硕、戴尔和惠普将与Boxx、Lambda和超微一起销售这款台式机的不同版本。

英伟达还将推出一款名为GB300 NVL72的单机架产品,提供每秒1.1千万亿次的FP4算力、配备20TB的HBM内存、40TB的高速内存、每秒130TB的NVLink带宽以及每秒14.4TB的网络带宽。
但Vera Rubin和Rubin Ultra在2026年和2027年推出时,可能会大幅提升这一性能。Rubin的FP4算力为每秒50千万亿次,高于Blackwell的每秒20千万亿次。Rubin Ultra将采用一颗芯片,该芯片实际上将两块Vera Rubin的GPU连接在一起,FP4算力翻倍至每秒100千万亿次,几乎是Vera Rubin的两倍,内存容量接近四倍,达到1TB。
英伟达表示,完整的Rubin Ultra NVL576机架将提供每秒15亿亿次的FP4推理性能和每秒5亿亿次的FP8训练性能,这比今年推出的Blackwell Ultra架构的性能高出 14倍。
英伟达表示,其Blackwell架构芯片已创造了110亿美元的营收;仅前四大买家就在2025年购买了180万颗Blackwell芯片。
英伟达正在推动这些新芯片以及其所有人工智能芯片作为未来计算的核心,并试图在今天提出,企业将需要越来越多的计算能力。在今天的英伟达GPU技术大会上,创始人兼首席执行官黄仁勋表示,为了满足需求,整个行业所需的计算能力比去年此时我们预期的还要多100倍。
黄仁勋表示,英伟达在Vera Rubin之后的下一代架构将于2028年推出,命名为Feynman——可能是以著名理论物理学家理查德·费曼的名字命名。他还提到,先驱天文学家Vera Rubin的一些家人当天也在观众席中。
相关文章
- 英伟达抢建物理AI算力工厂,微美全息(WIMI.US)锚定芯片赛道掀起GPU热潮!
- 云工场科技加快多元智算布局,构建 AMD、沐曦、英伟达协同算力体系
- 数据中心耗电远超电网负荷,迫使英伟达与谷歌在2026年第三季度前启动800V直流电架构改造
- 苹果在新版Siri上作出妥协:依靠英伟达B200 GPU加密技术,防止谷歌窃取用户数据
- 英伟达发布RTX Spark芯片,高调杀入PC市场
- 维谛(Vertiv)将在COMPUTEX展示首个面向英伟达NVIDIA Omniverse DSX Blueprint的全融合物理基础设施数字孪生能力
- AI驱动量子计算风口已至!英伟达/微美全息抢占高地锁定量子生态席位!
- 英伟达首席财务官调侃竞争对手因存储芯片短缺措手不及
- SpaceXAI宣布将向Anthropic开放搭载22万张英伟达GPU的巨像一号超级计算机
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- Anthropic看中英国初创公司融合技术,以仅英伟达Groq十分之一的成本,实现百倍速度的AI推理
- 英伟达发布开源AI模型Neomotron 3 Nano Omni,性能提升高达9倍
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









