英伟达新一代Vera Rubin AI系统预计未来几年将消耗几百万TB的NAND闪存固态硬盘
2026-01-13 10:00:50AI云资讯2536

(AI云资讯消息)在智能体AI环境中,最大的瓶颈之一是查询处理会生成名为KV缓存的庞大临时内存日志以构建上下文,目前这些数据存储在高带宽内存(HBM)模块中。然而,考虑到AI集群数据需求的爆炸式增长,HBM已无法承载其容量,这正是英伟达在2026年国际消费电子展上宣布将Bluefield-4数据处理器连接至新型存储解决方案“推理内存上下文存储”(ICMS)的原因。这项技术将极大提升数据处理能力,但也可能引发类似内存短缺的供应链紧张。
花旗银行分析指出,英伟达单个Vera Rubin系统可为机架内每块GPU配置约16TB的NAND闪存,在NVL72架构下单机柜容量达1,152TB。据花旗预估,到2027年Vera Rubin系统出货量可能攀升至10万台。这意味着仅英伟达一家企业对NAND存储的需求就可能激增至1.152亿TB,相当于未来几年全球NAND预估总需求的9.3%。搭载ICMS存储方案的Vera Rubin系统,或将引发NAND产业尚未预见的供应链紧张。
可以说,在AI厂商持续追求卓越计算能力的背景下,NAND行业很可能面临与当前内存类似的供应紧张局面。对普通消费者而言,获取通用固态硬盘和存储设备或将面临新一轮挑战。
相关文章
- 英伟达发布RTX Spark芯片,高调杀入PC市场
- 维谛(Vertiv)将在COMPUTEX展示首个面向英伟达NVIDIA Omniverse DSX Blueprint的全融合物理基础设施数字孪生能力
- AI驱动量子计算风口已至!英伟达/微美全息抢占高地锁定量子生态席位!
- 英伟达首席财务官调侃竞争对手因存储芯片短缺措手不及
- SpaceXAI宣布将向Anthropic开放搭载22万张英伟达GPU的巨像一号超级计算机
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- Anthropic看中英国初创公司融合技术,以仅英伟达Groq十分之一的成本,实现百倍速度的AI推理
- 英伟达发布开源AI模型Neomotron 3 Nano Omni,性能提升高达9倍
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 英伟达的真正实力在于基础设施,但投资融合的掌控力也不容忽视
- 美光为英伟达Vera Rubin平台量产36GB HBM4、28Gbps PCIe Gen6固态硬盘及192GB SOCAMM2内存
- 英伟达发布新一代超分辨率技术DLSS 5:神经渲染加持,颠覆性视觉提升
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









