阿里云AI存储全面升级,CPFS 容量提升500%
2024-08-07 16:28:11AI云资讯17440
8月7日,阿里云面向AI推出全新升级的存储系统CPFS智算版,单文件系统容量提升500%达到6PB级别,在大规模训练场景中,可支持更大的数据量和更高性能。同时,CPFS全新升级系统智能引擎,冷热数据流动带宽提升20倍,可大幅降低存储成本,更好支撑大模型训练及推理。

随着大模型参数和数据集规模的迅速增长,包含更多数据量的多模态大模型也成为趋势,大模型训练对存储的要求更高,需要更快的数据读写、传输和更大的存储空间。阿里云CPFS是专为AI和高性能计算而设计的存储产品。CPFS通过创新的分布式并行存储架构设计,自研的高性能RoCE RDMA网络协议和虚拟存储通道技术,多级缓存的弹性客户端,最终实现高吞吐、低延迟、Serverless化的高性能存储能力。
为更好满足模型训练不断增长的数据量和计算密度需求,CPFS单文件系统容量从1PB提升至6PB,单计算节点可支持40个容器同时挂载。同时,通过智能数据流动引擎的升级,冷热数据可以100GB/s的高带宽实现流动:在训练前将数据从对象存储OSS中快速导入到CPFS,更好满足训练时数据高并发读取;在训练结束后,将生成的结果数据从CPFS导出到OSS,大幅降低存储成本。
针对大模型训练中的数据安全问题,CPFS通过高性能虚拟化存储通道保障数据访问安全,提供租户权限鉴权、数据隔离和性能隔离,增强端到端安全隔离和数据保护能力。CPFS集成日志服务SLS提供的日志审计能力和云备份CloudBackup自动挂载备份功能也即将上线。
复旦大学、小鹏汽车、零一万物、百川智能、元戎启行等公司和机构已经使用阿里云进行AI训练和应用,通过阿里云CPFS提供的高吞吐带宽和百亿级小文件的高性能访问,数据集的并发读取和checkpoint写效率大幅提升,为模型训练和推理提速。比如,元戎启行基于阿里云的灵骏智算和CPFS分布式存储,完成了高性能的智能驾驶训练,训练效率提升120%,并通过冷热数据的分层存储方案实现大幅成本节省。
Forrester全球AI基础设施解决方案最新报告指出,阿里云AI Infra综合产品力居全球第二。此次CPFS智算版的全新升级,是阿里云存储在面向多模态等AI发展趋势做出的新探索。在存储领域,阿里云曾获中国电子学会科学技术特等奖、世界互联网领先科技成果奖,盘古分布式存储技术还曾荣获中国发明专利金奖。
相关文章
- 生态共进:昆仑智云以阿里云认证伙伴身份,破解AI落地“最后一公里”
- 昆仑智云:以阿里云认证生态伙伴身份,破解企业AI“三无困境”
- 全来店亮相 2026 阿里云 PolarDB 开发者大会
- 阿里云支持鹰角3D新游《明日方舟:终末地》全球开服
- 风行在线携手阿里云通义大模型,AI漫剧创作平台“橙星梦工厂”,引领数字内容生产新范式!
- 阿里云AI火花大会:AI加速从单点创新迈向规模化落地
- 灵机一动亮相阿里云展:定义AI硬件的智能体操作平台
- 玻色量子计算云服务上线阿里云!面向全球开放,直面国际量子算力竞争!
- DFRobot亮相阿里云通义智能硬件展,软硬融合AI视觉方案获高度关注
- 定义AI时代隐私计算新标准,YoooTek联合阿里云无影发布 Glass-Box 架构
- 神眸携秋季新品亮相阿里云“秒物·智趣” 开启智能影像新纪元
- 阿里云AI Landing Zone正式发布,助力企业从“上好云”到“用好AI”的战略升级
- 爱诗科技与阿里云达成全栈AI合作 AI视频服务全球化再启航
- 快鹭科技新品入驻阿里云云市场:以AI赋能办公解决方案,开启企业智能协作新时代
- 融云与阿里云联手,共同按下“AI+通信云”生态加速键
- AI火花集|阿里云携手心智互动,为视障群体打开娱乐场景
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









