DeepSeek开源3FS背后:软硬一体的专用AI存储系统
2025-03-13 15:49:29AI云资讯10919
近期,DeepSeek开源的3FS系统向全球科技圈力证,通过存储来优化AI推理工作负载,可有效提升大模型性能,同时大幅降低成本。

作为AI原生存储,3FS的链式复制机制、FFRecord格式优化等创新设计,不仅重新定义了AI存储的技术标准,更凸显了专用存储系统在支撑超大模型推理中的不可替代性。
从技术角度看,曙光存储ParaStor与3FS呈现出高度趋同性,二者通过相似的技术路径共同推动着AI基础设施的进化。
高性能数据存储为AI集群释放算力
曙光ParaStor和3FS都是典型的高性能并行文件系统,这类系统堪称是最适合AI的数据存储。
两者均以RDMA技术为核心传输协议,通过零拷贝机制将网络延迟降至微秒级,有效解决了传统TCP/IP协议栈在AI集群中产生的CPU资源争用问题,使200Gbps网卡利用率突破90%。在此基础上,两者创新性引入硬件卸载技术,将数据校验、协议解析等任务交由智能网卡处理。
实测显示,硬件卸载可使存储读响应时间缩短40%,同时释放30%以上CPU算力用于模型推理。
这种“存储即服务”的设计理念,彻底颠覆了传统存储依赖CPU资源的模式,为AI集群释放出更多算力空间。
AI专属优化:IO特征适配与智能缓存
针对AI训练特有的小文件高并发、数据访问局部性及混合负载特性,曙光存储ParaStor和3FS均构建了多层优化体系:
元数据分片技术:将百万量级小文件的元数据请求分散至多个控制节点,使查询吞吐量提升5倍以上,支撑万级客户端并发访问。
智能预取与缓存分层:通过分析训练任务的数据访问模式,提前将数据从HDD预加载至NVMe缓存,使ResNet-152单epoch训练时间缩短18%。
QoS感知调度引擎:动态分配带宽与IO优先级,确保模型训练关键路径的服务质量。
弹性进化:EB级存储的无缝扩展能力
为满足大模型训练对海量数据的需求,曙光存储ParaStor与3FS均采用去中心化架构:
全局命名空间:整合跨地域、跨介质存储资源,支持千亿文件统一管理。
无状态弹性扩展:节点可在线扩展至数千个,容量与性能随节点增加线性提升,在GPT-3级场景中实现超1TB/s聚合带宽。
自适应纠删码策略:对热数据采用多副本保障性能,温冷数据采用EC 8+3编码,使空间利用率突破85%。
软硬一体:构建自主可控的AI存储基座
3FS的技术突破与ParaStor的国产化创新,共同印证了一个行业共识:硬件加速、场景化优化与分布式架构的深度融合,是突破“存储墙”的必由之路。
在共性技术之外,曙光ParaStor依托国产硬件生态优势,实现了自研SSD控制器与智能网卡的协同优化,在国产AI芯片适配性上展现出独特价值。这种自主可控的技术路径,不仅提升了系统的稳定性与安全性,更为我国AI产业发展提供了坚实的基础设施保障。
相关文章
- 海柔闪攀机器人双深位升级方案中国首秀!为超密存储和更高效率护航
- IDC报告:又一家国产存储厂商进入加速期,英韧科技靠PCIe与SATA双线布局突围
- 落地全场景AI存力!佰维存储COMPUTEX 2026台北展圆满收官
- 致态618开门红开启:全系产品优惠来袭,存储好货放肆buy!
- WE来存力场 海康存储携NAS新品亮相东芝&神州数码生态大会
- 深耕 AI 存储领域 华瑞指数云发布 KV Cache 存储核心技术
- 英伟达首席财务官调侃竞争对手因存储芯片短缺措手不及
- 海康存储推出五盘位NAS新品MAGE50X千元级AI私有云新标杆
- 华龙奖最佳存储卡实力加身,阿根廷国家队联名出圈——雷克沙P&E展台“双喜临门”
- 高端存储迈入AI周期,中科曙光打开数据基础设施新空间
- 媒体观察:词元经济时代,存储该如何做好自己的主角?
- 软硬协同价值升维:aigo存储发布AP10,重塑“友好存储”新标杆
- AI 加持 + 专属存储模式,百奥 PD16LD 让大空间告别潮湿与损耗
- 忆联亮相2026移动云大会,以全场景AI存储方案共筑Token智能新生态
- 暴涨超40%!存储芯片领跑一季度工业增长,超级周期持续发酵
- 绿联携AI NAS参展英特尔峰会,定义智能存储新生态
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









