英伟达推出下一代AI超级芯片Blackwell Ultra GB300和Vera Rubin
2025-03-19 06:35:03AI云资讯48969

(AI云资讯消息)在人工智能大潮的推动下,英伟达现在每秒盈利2300美元。英伟达数据中心业务规模庞大,甚至其网络硬件的收入也超过了游戏GPU。3月18日,英伟达公司宣布了其希望扩大其领先优势的AI GPU:Blackwell Ultra GB300将于今年下半年上市,Vera Rubin将于2026年下半年推出,而Rubin Ultra则将在2027年下半年面推出。
今年的Blackwell Ultra并不是最初预期的那样,因为英伟达去年曾表示,将以每年一次的频率推出新的AI芯片,速度比以往任何时候都快,而Blackwell Ultra并非基于全新架构。在3月18日的GDC主题演讲中,英伟达很快便跳过了Blackwell Ultra,转而公布了下一个架构Vera Rubin,其整机架性能应是同等配置的 Blackwell Ultra的3.3 倍。

英伟达并未明确说明Blackwell Ultra比最初的Blackwell强多少。在与记者的预先简报中,英伟达透露,单颗Ultra芯片将提供与Blackwell相同的每秒20 千万亿次的人工智能性能,但内存从192GB的HBM3e增加到了288GB。与此同时,Blackwell Ultra DGX GB300 Superpod集群将提供与Blackwell版本相同的288个CPU、576个GPU和每秒11.5千万亿次的FP4计算能力,但内存从240TB增加到了300TB。
英伟达主要将其新推出的 Blackwell Ultra 与 2022 年的 H100 芯片进行了比较,H100 芯片助力英伟达在人工智能领域大获成功,而领先企业或许也正考虑对其进行升级:Blackwell Ultra在FP4推理性能上提升了1.5倍,并且能够显著加快人工智能推理速度,其NVL72集群能够运行交互式DeepSeek-R1 671B模型,只需10秒就能给出答案,而H100则需要1.5分钟。英伟达表示,这是因为Blackwell Ultra每秒能处理1000个token,是英伟达2022年芯片的10倍。

但一个引人关注的不同之处在于,一些公司将能够购买单颗Blackwell Ultra芯片:英伟达宣布了一款名为DGX Station的台式机,其搭载了单颗GB300 Blackwell Ultra芯片,拥有784GB的统一系统内存、内置800Gbps英伟达网络以及承诺的每秒20千万亿次的人工智能性能。华硕、戴尔和惠普将与Boxx、Lambda和超微一起销售这款台式机的不同版本。

英伟达还将推出一款名为GB300 NVL72的单机架产品,提供每秒1.1千万亿次的FP4算力、配备20TB的HBM内存、40TB的高速内存、每秒130TB的NVLink带宽以及每秒14.4TB的网络带宽。
但Vera Rubin和Rubin Ultra在2026年和2027年推出时,可能会大幅提升这一性能。Rubin的FP4算力为每秒50千万亿次,高于Blackwell的每秒20千万亿次。Rubin Ultra将采用一颗芯片,该芯片实际上将两块Vera Rubin的GPU连接在一起,FP4算力翻倍至每秒100千万亿次,几乎是Vera Rubin的两倍,内存容量接近四倍,达到1TB。
英伟达表示,完整的Rubin Ultra NVL576机架将提供每秒15亿亿次的FP4推理性能和每秒5亿亿次的FP8训练性能,这比今年推出的Blackwell Ultra架构的性能高出 14倍。
英伟达表示,其Blackwell架构芯片已创造了110亿美元的营收;仅前四大买家就在2025年购买了180万颗Blackwell芯片。
英伟达正在推动这些新芯片以及其所有人工智能芯片作为未来计算的核心,并试图在今天提出,企业将需要越来越多的计算能力。在今天的英伟达GPU技术大会上,创始人兼首席执行官黄仁勋表示,为了满足需求,整个行业所需的计算能力比去年此时我们预期的还要多100倍。
黄仁勋表示,英伟达在Vera Rubin之后的下一代架构将于2028年推出,命名为Feynman——可能是以著名理论物理学家理查德·费曼的名字命名。他还提到,先驱天文学家Vera Rubin的一些家人当天也在观众席中。
相关文章
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 英伟达的真正实力在于基础设施,但投资融合的掌控力也不容忽视
- 美光为英伟达Vera Rubin平台量产36GB HBM4、28Gbps PCIe Gen6固态硬盘及192GB SOCAMM2内存
- 英伟达发布新一代超分辨率技术DLSS 5:神经渲染加持,颠覆性视觉提升
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
- 英特尔在英伟达GTC大会的完美时机亮相:智能体AI将CPU变为新瓶颈
- 英伟达CEO黄仁勋庆祝GeForce 3问世25周年:没有GeForce,就没有AI
- 英伟达发布Nemotron 3 Super开源智能体AI模型:或成为OpenClaw的理想选择
- 英伟达CEO黄仁勋将AI比作一个五层蛋糕,称其潜力尚未被完全发掘
- Teclab绕过英伟达RTX 50显存时钟限制,将RTX 5070 Ti超频至超过36Gbps
- 全力奔赴AI推理时代,英伟达/微美全息大举进军开启空前爆发盛宴!
- 英伟达将推出新款GeForce RTX 5050显卡,搭载9GB GDDR7显存
- 英伟达将向两家光子技术公司注资40亿美元,抢占AI竞争制高点
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









