国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍
2026-01-19 15:46:04AI云资讯1617
2026年1月15日,北京—— 继英伟达CEO黄仁勋在CES 2026发布革命性“推理上下文内存存储平台”后,本土高性能存储厂商绿算技术(ForinnBase)今日宣布,其旗舰产品GP7000系列全闪存储平台已通过英伟达适配,成为全球首批、也是唯一支持G3级KV Cache分层存储的国产化解决方案,为下一代AI工厂建设提供了关键的基础设施支撑。
一、 背景:G3级存储——AI推理的“战略储备库”
黄仁勋在CES演讲中指出,随着大模型上下文窗口扩展至百万级Token,KV Cache容量呈爆炸式线性增长,仅靠GPU HBM和机架级缓存已无法满足大规模并发需求。
核心需求:G3级存储作为持久化溢出层,需通过NVMe-oF/RDMA网络为每个GPU提供16TB以上的扩展访问空间,同时保持<50μs的端到端延迟和200GB/s级带宽。
架构挑战:黄仁勋强调,“G3不是简单的数据落盘,而是需要与BlueField-4 DPU和Spectrum-X网络原生集成,实现毫秒级缓存预热和智能卸载。这要求存储系统必须采用存算分离架构,将元数据操作与数据路径完全解耦。”
二、 方案:GP7000——为G3级量身定制的存算分离架构平台
绿算技术GP7000系列采用以太网闪存簇(EBOF)设计,单系统配备24个PCIe 5.0 NVMe U.2盘位,通过双主控板实现冗余。其核心指标精准匹配G3层需求:
极致性能:单机提供6480万IOPS、288GB/s带宽与20μs级延迟,性能较传统存储服务器提升17倍。
超高能效:整机功耗<900W,每GB/s带宽功耗仅3.1W,满足AI工厂的5倍能效目标。
深度集成:原生支持BlueField-3/4 DPU与Spectrum-X交换机,通过NVMe-oF/RoCEv2/GDS协议实现GPU直连。
绿算技术产品总监孔维海透露:“GP7000采用DPU+ASIC+FPGA多元异构计算架构,将KV Cache的索引管理、数据压缩和网络协议栈完全硬件卸载,消除了CPU瓶颈。”其分布式KV Cache管理器可与英伟达Dynamo开源项目无缝衔接,实现跨机架的缓存一致性。
三、 验证:DGX GB300场景下的实测性能
在英伟达DGX GB300 SuperPOD测试环境中,GP7000作为G3存储池展现出显著优势:
吞吐量:当KV Cache溢出至G3层时,仍能保持5倍tokens/s的生成速度,符合性能目标。
延迟:通过GPU Direct Storage(GDS)技术,首Token时间仅增加3-5ms,远低于传统方案的50ms+损耗。
扩展性:单台DGX GB300节点可配置2个GP7000机柜,提供28PB级缓存容量,支撑万级并发长对话请求。
四、 意义:国产化替代与“虚拟GPU”效应
业内专家认为此举是国产存储参与全球AI基础设施尖端竞赛的关键一步。
某智算中心CTO评价:“GP7000已通过金融、通信等关键行业认证,在混合负载下实现99.9999%可用性,故障率较存算一体架构降低75%。”
某国家实验室负责人指出:“在当前技术背景下,通过存储层优化,可在同等算力下提升30%以上的推理吞吐量,这相当于获得了‘虚拟GPU’。”
五、 生态:从硬件到软件的深度适配
绿算技术白皮书披露,GP7000已完成广泛生态适配:
硬件:英伟达DGX H100/H200/GB300、AMD Instinct MI300、华为昇腾910B/C、沐曦曦云C系列等。
软件:英伟达Dynamo/vLLM/TensorRT-LLM、华为UCM、Kubernetes CSI等。
国产数据库:OceanBase、TiDB、GaussDB等。
在大模型推理场景中,GP7000可通过命名空间隔离与智能冷热分层技术,为每个推理实例分配独立的KV Cache分区,并将高频数据预加载至G2层,实现成本与效率的最优平衡。
六、 展望:2026年下半年规模化部署与未来演进
当前进展:GP7000已于2025年Q3量产,并获得了某头部云厂商数千节点订单。
未来规划:公司正在研发基于PCIe 6.0的下一代GP8000,目标是将G3级带宽提升至1TB/s。
正如黄仁勋所言,“AI工厂的存储革命才刚刚开始。”当KV Cache从GPU的“包袱”转变为可弹性扩展的“战略资源”,像GP7000这样的专业存储正从配角演进为决定AI服务成本与体验的核心胜负手。
七、关于绿算技术
绿算技术有限公司(ForinnBase)成立于2021年,专注于DPU驱动的高性能存储系统研发。其GroundPool系列产品已服务金融、科研、智算中心等领域,是全球首批支持G3级KV Cache分层存储的唯一国产化解决方案。
相关文章
- iEi威强电:存储涨价时代,工业计算如何“算”得更精?
- 京东举办2026外置存储行业合作伙伴大会 共筑存储“用户无忧”护城河
- 算力澎湃,存储革新:佰维存储重磅亮相CES 2026!
- 受内存短缺涨价影响,存储芯片封装与测试企业也宣布提价30%
- 戴尔科技为现代化容器应用提供灵活可靠的存储方案
- 美光推出4TB固态硬盘:全球首批采用超紧凑规格的Gen5 QLC存储设备
- 从周期谷底到盈利拐点:长鑫科技如何穿越存储芯片的“死亡之谷”
- 华瑞指数云正式加入AMD生态联盟,加速存储产业协同创新
- 美光UFS4.1车规级存储方案以卓越性能与智能监控技术,保障智能汽车高效、安全的实时数据处理与交互体验
- 美光科技推出2600 NVMe SSD,以卓越性能与高性价比助力OEM厂商实现高效低功耗存储升级
- 从跟随到引领:长鑫以自主产能应对全球存储危机,IPO窗口期价值凸显
- 英特尔聚生态合力,共塑AI NAS新格局:驱动本地算力与存储创新
- 双十二焕新存储!雷克沙 SILVER PLUS micro SD 解锁创作自由
- 海康存储获评OpenCloudOS社区年度荣耀共创伙伴
- 高性能低功耗正在重塑AI内存格局:长鑫存储以LPDDR5X竞逐“能效时代”
- 九类危险品出海难?选对海外仓,锂电池也能安心存储、放心履约









