国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍

2026-01-19 15:46:04AI云资讯1617

2026年1月15日,北京—— 继英伟达CEO黄仁勋在CES 2026发布革命性“推理上下文内存存储平台”后,本土高性能存储厂商绿算技术(ForinnBase)今日宣布,其旗舰产品GP7000系列全闪存储平台已通过英伟达适配,成为全球首批、也是唯一支持G3级KV Cache分层存储的国产化解决方案,为下一代AI工厂建设提供了关键的基础设施支撑。

一、 背景:G3级存储——AI推理的“战略储备库”

黄仁勋在CES演讲中指出,随着大模型上下文窗口扩展至百万级Token,KV Cache容量呈爆炸式线性增长,仅靠GPU HBM和机架级缓存已无法满足大规模并发需求。

核心需求:G3级存储作为持久化溢出层,需通过NVMe-oF/RDMA网络为每个GPU提供16TB以上的扩展访问空间,同时保持<50μs的端到端延迟和200GB/s级带宽。

架构挑战:黄仁勋强调,“G3不是简单的数据落盘,而是需要与BlueField-4 DPU和Spectrum-X网络原生集成,实现毫秒级缓存预热和智能卸载。这要求存储系统必须采用存算分离架构,将元数据操作与数据路径完全解耦。”

二、 方案:GP7000——为G3级量身定制的存算分离架构平台

绿算技术GP7000系列采用以太网闪存簇(EBOF)设计,单系统配备24个PCIe 5.0 NVMe U.2盘位,通过双主控板实现冗余。其核心指标精准匹配G3层需求:

极致性能:单机提供6480万IOPS、288GB/s带宽与20μs级延迟,性能较传统存储服务器提升17倍。

超高能效:整机功耗<900W,每GB/s带宽功耗仅3.1W,满足AI工厂的5倍能效目标。

深度集成:原生支持BlueField-3/4 DPU与Spectrum-X交换机,通过NVMe-oF/RoCEv2/GDS协议实现GPU直连。

绿算技术产品总监孔维海透露:“GP7000采用DPU+ASIC+FPGA多元异构计算架构,将KV Cache的索引管理、数据压缩和网络协议栈完全硬件卸载,消除了CPU瓶颈。”其分布式KV Cache管理器可与英伟达Dynamo开源项目无缝衔接,实现跨机架的缓存一致性。

三、 验证:DGX GB300场景下的实测性能

在英伟达DGX GB300 SuperPOD测试环境中,GP7000作为G3存储池展现出显著优势:

吞吐量:当KV Cache溢出至G3层时,仍能保持5倍tokens/s的生成速度,符合性能目标。

延迟:通过GPU Direct Storage(GDS)技术,首Token时间仅增加3-5ms,远低于传统方案的50ms+损耗。

扩展性:单台DGX GB300节点可配置2个GP7000机柜,提供28PB级缓存容量,支撑万级并发长对话请求。

四、 意义:国产化替代与“虚拟GPU”效应

业内专家认为此举是国产存储参与全球AI基础设施尖端竞赛的关键一步。

某智算中心CTO评价:“GP7000已通过金融、通信等关键行业认证,在混合负载下实现99.9999%可用性,故障率较存算一体架构降低75%。”

某国家实验室负责人指出:“在当前技术背景下,通过存储层优化,可在同等算力下提升30%以上的推理吞吐量,这相当于获得了‘虚拟GPU’。”

五、 生态:从硬件到软件的深度适配

绿算技术白皮书披露,GP7000已完成广泛生态适配:

硬件:英伟达DGX H100/H200/GB300、AMD Instinct MI300、华为昇腾910B/C、沐曦曦云C系列等。

软件:英伟达Dynamo/vLLM/TensorRT-LLM、华为UCM、Kubernetes CSI等。

国产数据库:OceanBase、TiDB、GaussDB等。

在大模型推理场景中,GP7000可通过命名空间隔离与智能冷热分层技术,为每个推理实例分配独立的KV Cache分区,并将高频数据预加载至G2层,实现成本与效率的最优平衡。

六、 展望:2026年下半年规模化部署与未来演进

当前进展:GP7000已于2025年Q3量产,并获得了某头部云厂商数千节点订单。

未来规划:公司正在研发基于PCIe 6.0的下一代GP8000,目标是将G3级带宽提升至1TB/s。

正如黄仁勋所言,“AI工厂的存储革命才刚刚开始。”当KV Cache从GPU的“包袱”转变为可弹性扩展的“战略资源”,像GP7000这样的专业存储正从配角演进为决定AI服务成本与体验的核心胜负手。

七、关于绿算技术

绿算技术有限公司(ForinnBase)成立于2021年,专注于DPU驱动的高性能存储系统研发。其GroundPool系列产品已服务金融、科研、智算中心等领域,是全球首批支持G3级KV Cache分层存储的唯一国产化解决方案。

相关文章

人工智能企业

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>

人工智能技术

更多>>
AI云资讯(爱云资讯)立足人工智能科技,打造有深度、有前瞻、有影响力的泛科技信息平台。
合作QQ:1211461360微信号:icloudnews