国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍
2026-01-19 15:46:04AI云资讯1947
2026年1月15日,北京—— 继英伟达CEO黄仁勋在CES 2026发布革命性“推理上下文内存存储平台”后,本土高性能存储厂商绿算技术(ForinnBase)今日宣布,其旗舰产品GP7000系列全闪存储平台已通过英伟达适配,成为全球首批、也是唯一支持G3级KV Cache分层存储的国产化解决方案,为下一代AI工厂建设提供了关键的基础设施支撑。
一、 背景:G3级存储——AI推理的“战略储备库”
黄仁勋在CES演讲中指出,随着大模型上下文窗口扩展至百万级Token,KV Cache容量呈爆炸式线性增长,仅靠GPU HBM和机架级缓存已无法满足大规模并发需求。
核心需求:G3级存储作为持久化溢出层,需通过NVMe-oF/RDMA网络为每个GPU提供16TB以上的扩展访问空间,同时保持<50μs的端到端延迟和200GB/s级带宽。
架构挑战:黄仁勋强调,“G3不是简单的数据落盘,而是需要与BlueField-4 DPU和Spectrum-X网络原生集成,实现毫秒级缓存预热和智能卸载。这要求存储系统必须采用存算分离架构,将元数据操作与数据路径完全解耦。”
二、 方案:GP7000——为G3级量身定制的存算分离架构平台
绿算技术GP7000系列采用以太网闪存簇(EBOF)设计,单系统配备24个PCIe 5.0 NVMe U.2盘位,通过双主控板实现冗余。其核心指标精准匹配G3层需求:
极致性能:单机提供6480万IOPS、288GB/s带宽与20μs级延迟,性能较传统存储服务器提升17倍。
超高能效:整机功耗<900W,每GB/s带宽功耗仅3.1W,满足AI工厂的5倍能效目标。
深度集成:原生支持BlueField-3/4 DPU与Spectrum-X交换机,通过NVMe-oF/RoCEv2/GDS协议实现GPU直连。
绿算技术产品总监孔维海透露:“GP7000采用DPU+ASIC+FPGA多元异构计算架构,将KV Cache的索引管理、数据压缩和网络协议栈完全硬件卸载,消除了CPU瓶颈。”其分布式KV Cache管理器可与英伟达Dynamo开源项目无缝衔接,实现跨机架的缓存一致性。
三、 验证:DGX GB300场景下的实测性能
在英伟达DGX GB300 SuperPOD测试环境中,GP7000作为G3存储池展现出显著优势:
吞吐量:当KV Cache溢出至G3层时,仍能保持5倍tokens/s的生成速度,符合性能目标。
延迟:通过GPU Direct Storage(GDS)技术,首Token时间仅增加3-5ms,远低于传统方案的50ms+损耗。
扩展性:单台DGX GB300节点可配置2个GP7000机柜,提供28PB级缓存容量,支撑万级并发长对话请求。
四、 意义:国产化替代与“虚拟GPU”效应
业内专家认为此举是国产存储参与全球AI基础设施尖端竞赛的关键一步。
某智算中心CTO评价:“GP7000已通过金融、通信等关键行业认证,在混合负载下实现99.9999%可用性,故障率较存算一体架构降低75%。”
某国家实验室负责人指出:“在当前技术背景下,通过存储层优化,可在同等算力下提升30%以上的推理吞吐量,这相当于获得了‘虚拟GPU’。”
五、 生态:从硬件到软件的深度适配
绿算技术白皮书披露,GP7000已完成广泛生态适配:
硬件:英伟达DGX H100/H200/GB300、AMD Instinct MI300、华为昇腾910B/C、沐曦曦云C系列等。
软件:英伟达Dynamo/vLLM/TensorRT-LLM、华为UCM、Kubernetes CSI等。
国产数据库:OceanBase、TiDB、GaussDB等。
在大模型推理场景中,GP7000可通过命名空间隔离与智能冷热分层技术,为每个推理实例分配独立的KV Cache分区,并将高频数据预加载至G2层,实现成本与效率的最优平衡。
六、 展望:2026年下半年规模化部署与未来演进
当前进展:GP7000已于2025年Q3量产,并获得了某头部云厂商数千节点订单。
未来规划:公司正在研发基于PCIe 6.0的下一代GP8000,目标是将G3级带宽提升至1TB/s。
正如黄仁勋所言,“AI工厂的存储革命才刚刚开始。”当KV Cache从GPU的“包袱”转变为可弹性扩展的“战略资源”,像GP7000这样的专业存储正从配角演进为决定AI服务成本与体验的核心胜负手。
七、关于绿算技术
绿算技术有限公司(ForinnBase)成立于2021年,专注于DPU驱动的高性能存储系统研发。其GroundPool系列产品已服务金融、科研、智算中心等领域,是全球首批支持G3级KV Cache分层存储的唯一国产化解决方案。
相关文章
- 博库致连AI文档管理一体机:定义AI存储新模式
- 协创数据2025年业绩预增超50%:存储算力双轮驱动 构筑AI基建核心竞争力
- 绿联科技联手腾讯游戏:打造“NAS+游戏”新生态,突破存储设备功能局限
- 京东携手佰维存储深化战略合作 三年之约助力存储产业稳健增长
- Dell PowerScale嵌入式元数据支持:让文件存储像对象存储一样智能
- 容声发布“大冰象”冰箱,以系统性创新重构家庭冷冻存储标准
- 忆联发布新款SATA SSD UM311d:以卓越性能与更低TCO,从容应对海量存储需求
- 硬科技突围:一颗中国芯片,如何破解AI算力的“存储墙”难题?
- 存储领域再迎突破!绿算发布FPGA NVMe RAID加速卡,重新定义高性能存储
- 国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍
- iEi威强电:存储涨价时代,工业计算如何“算”得更精?
- 京东举办2026外置存储行业合作伙伴大会 共筑存储“用户无忧”护城河
- 算力澎湃,存储革新:佰维存储重磅亮相CES 2026!
- 受内存短缺涨价影响,存储芯片封装与测试企业也宣布提价30%
- 戴尔科技为现代化容器应用提供灵活可靠的存储方案
- 美光推出4TB固态硬盘:全球首批采用超紧凑规格的Gen5 QLC存储设备
人工智能企业
更多>>人工智能硬件
更多>>- 中国联通携手合作伙伴发布云智AI眼镜
- 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能
- 讯飞翻译机登陆MWC 2026,同传级沟通体验,多语种交流无压力
- 普恩志引领:2026半导体与高端制造前瞻——核心备件如何驱动产业革新与市场机遇
- 超旗舰降噪,殿堂级音质 索尼双芯超旗舰真无线降噪耳机WF-1000XM6正式发售
- 当AI学会“隐身”,手机才真正智能:三星Galaxy S26系列开启AI哲学的降维打击
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 全球瞩目!荣耀携Robot Phone、Magic V6系列、荣耀MagicBook Pro 14 2026震撼亮相MWC 2026
人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









