阿里云AI存储全面升级,CPFS 容量提升500%
2024-08-07 16:28:11AI云资讯17236
8月7日,阿里云面向AI推出全新升级的存储系统CPFS智算版,单文件系统容量提升500%达到6PB级别,在大规模训练场景中,可支持更大的数据量和更高性能。同时,CPFS全新升级系统智能引擎,冷热数据流动带宽提升20倍,可大幅降低存储成本,更好支撑大模型训练及推理。
随着大模型参数和数据集规模的迅速增长,包含更多数据量的多模态大模型也成为趋势,大模型训练对存储的要求更高,需要更快的数据读写、传输和更大的存储空间。阿里云CPFS是专为AI和高性能计算而设计的存储产品。CPFS通过创新的分布式并行存储架构设计,自研的高性能RoCE RDMA网络协议和虚拟存储通道技术,多级缓存的弹性客户端,最终实现高吞吐、低延迟、Serverless化的高性能存储能力。
为更好满足模型训练不断增长的数据量和计算密度需求,CPFS单文件系统容量从1PB提升至6PB,单计算节点可支持40个容器同时挂载。同时,通过智能数据流动引擎的升级,冷热数据可以100GB/s的高带宽实现流动:在训练前将数据从对象存储OSS中快速导入到CPFS,更好满足训练时数据高并发读取;在训练结束后,将生成的结果数据从CPFS导出到OSS,大幅降低存储成本。
针对大模型训练中的数据安全问题,CPFS通过高性能虚拟化存储通道保障数据访问安全,提供租户权限鉴权、数据隔离和性能隔离,增强端到端安全隔离和数据保护能力。CPFS集成日志服务SLS提供的日志审计能力和云备份CloudBackup自动挂载备份功能也即将上线。
复旦大学、小鹏汽车、零一万物、百川智能、元戎启行等公司和机构已经使用阿里云进行AI训练和应用,通过阿里云CPFS提供的高吞吐带宽和百亿级小文件的高性能访问,数据集的并发读取和checkpoint写效率大幅提升,为模型训练和推理提速。比如,元戎启行基于阿里云的灵骏智算和CPFS分布式存储,完成了高性能的智能驾驶训练,训练效率提升120%,并通过冷热数据的分层存储方案实现大幅成本节省。
Forrester全球AI基础设施解决方案最新报告指出,阿里云AI Infra综合产品力居全球第二。此次CPFS智算版的全新升级,是阿里云存储在面向多模态等AI发展趋势做出的新探索。在存储领域,阿里云曾获中国电子学会科学技术特等奖、世界互联网领先科技成果奖,盘古分布式存储技术还曾荣获中国发明专利金奖。
相关文章
- 阿里云与天猫启动“AI新品类联合计划” ,支持智能硬件规模化发展
- 阿里云与Omdia联合发布AI安全报告,引领构建全新AI安全范式
- 阿里云 2025首届「AI安全」全球挑战赛完美收官,展现大模型安全攻防新高度
- 模型即服务,应用即未来:阿里云助力中小企业AI应用规模化落地
- 叫叫与阿里云达成全栈AI战略合作 让教育更“懂孩子”
- Zenlayer 亮相 2025 云栖大会,荣获阿里云首批云网络产品能力认证伙伴
- 在阿里云上,跑出中小企业AI应用规模化的“加速度”
- 亚信科技、阿里云达成“能力中心”合作,联办大模型论坛
- 德明利亮相阿里云栖大会,首秀企业级存储产品及解决方案
- 英特尔助力阿里云推出多款云实例与存储方案,共筑AI时代云端算力基石
- 方直科技与阿里云达成AI全栈战略合作, 开启儿童智能陪伴新征程
- BetterYeah AI联手阿里云推出电商行业AI Agent解决方案
- 汉数科技携手阿里云,打造 AI 大模型时代的高质量数据云
- 德勤、SAP、阿里云联手发布“智企三百计划“
- 值得买科技携“海纳”MCP Server亮相阿里云栖大会,驱动AI应用生态协同创新发展
- 阿里云发布全新AI员工“万小智”,赋能中小微企业开启智能经营时代









