阿里巴巴开源深度学习训练框架EPL 可支持10万亿参数超大模型
2022-03-07 14:30:20AI云资讯1370
3月4日消息,阿里巴巴宣布完全开源支持10万亿模型的自研分布式深度学习训练框架EPL(Easy Parallel Library,原名whale),进一步完善深度学习生态。

EPL由阿里云机器学习平台PAI团队自主研发,PAI是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、编译优化、推理部署在内的AI开发全链路服务,内置140多种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
EPL是PAI团队一次面向大规模深度学习分布式自动化训练的探索,EPL希望能够简化深度学习模型从单机训练到分布式开发调试的流程。EPL通过对不同并行化策略进行统一抽象、封装,在一套分布式训练框架中支持多种并行策略,并进行显存、计算、通信等全方位优化来提供易用、高效的分布式训练框架。
EPL适合不同场景的模型,在阿里巴巴内部已经支持图像、推荐、语音、视频、自然语言、多模态等多样性的业务场景。同时,EPL也支持不同规模的模型,最大完成了10万亿规模的M6模型训练,相比之前发布的大模型GPT-3,M6实现同等参数规模能耗仅为其1%。最新测试结果显示,使用EPL的流水+数据并行对Bert Large模型进行优化,相比于数据并行,训练速度提升了66%。
阿里云资深技术专家九丰表示,“近些年,随着深度学习的火爆,模型的参数规模飞速增长,同时为训练框架带来更大挑战。为应对这个问题,我们研发了EPL,EPL功能也随着业务需求的迭代逐渐完善。未来,我们将在软硬件一体优化、全自动策略探索等几个探索性方向上持续投入精力。今天,我们将EPL完全开源,希望和深度学习训练框架的开发者或深度学习从业者之间有更多更好的交流和共建,持续完善深度学习生态。”
相关文章
- 全球首款结合深度学习与大语言模型的酒店房型匹配系统:途灵科技TourMind 正式推出MappingMind解决方案
- 深度学习、AI计算硬件要求高,大学生如何低门槛远程科研
- 融合深度学习与量子计算,微美全息探索Grover算法量子神经网络模型
- 微云全息引领深度融合技术革命, 自适应交互特征锐增法助力深度学习突破图像处理新境界
- MediaGo推出五大深度学习模型 精准作用营销全链路提升转化率
- 天冕科技再获专利—基于深度学习算法和图像分割技术的裸露图片检测方法!
- 神州鲲泰亮相WAVE SUMMIT深度学习开发者大会2024,以智能算力搭配大模型推动产业数智化变革
- 深度学习——制造业的未来已来
- 打造跨界交流与深度学习平台,腾讯南山学堂正式开班
- 微美全息推出基于无监督波场深度学习的声学全息图重建技术
- 微美全息构建基于深度学习的多视图混合推荐模型,提供精准和个性化服务
- 微美全息探索基于深度学习的多视图点云重建算法的技术创新与应用
- 微美全息布局基于深度学习的非线性全息图像修复技术,提升全息图像的可视化效果
- 数链科技应邀出席WAVE SUMMIT 2023深度学习开发者大会并做主题分享
- 微美全息开发基于深度学习SLAM算法技术,驶向数字时代的前沿探索
- 全息数字重建进入新纪元,微美全息开发基于深度学习的全息重建网络
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









