阿里云发布机器学习平台PAI v3.0
2019-03-22 13:53:25AI云资讯1386
阿里云机器学习平台是构建在阿里云 MaxCompute(原 ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。阿里云机器学习封装了阿里巴巴集团内成熟的算法,向机器学习用户提供了更简易的操作体验。
今日发布的 PAI 3.0 推出了全新的算法模型市场,涵盖电商、社交、广告、金融等多个行业,数十种场景的算法模型。同时还新增了流式算法组件、图神经网络、增强学习组件等平台工具。
作为机器学习平台的内核,PAI 的智能计算引擎进行了全面升级,通过编译技术优化通用计算引擎,训练性能提升 400%——PAI 团队研发了深度学习编译器 TAO(Tensor Accelerator and Optimizer),以通用化、平台化的方式有效解决上层 Workload 与底层硬件计算单元之间高效映射的问题。
此外,在深度学习优化分布式引擎方面,PAI 3.0可以实现单任务支持上千 worker 并发训练,并支持 5k+ 超大规模异构计算集群。
PAI 希望实现「用更少的硬件,支持更多业务更快完成业务迭代」。为了完成这个目标,团队有针对性地研发了 GPU 分时复用技术。整套技术实现遵循了数据驱动的思想,包括实时在线性能数据反馈通路、细粒度 GPU 资源复用、虚拟显存以及基于历史数据的资源预估策略这几个关键模块。
此外,PAI 3.0 还发布了大规模图神经网络,缓存机制效率提升 40%,算子速度提升 12 倍,系统端建图时间从数小时降至 5 分钟。
据了解,从 PAI1.0 开始,该机器学习平台已经在阿里巴巴内部使用了 2 年。基于该平台,在淘宝搜索中,搜索结果会基于商品和用户的特征进行排序。通过使用参数服务器,淘宝可以把百亿个特征的模型,分散到数十个乃至于上百个参数服务器上,打破了规模的瓶颈。
相关文章
- 阿里云与Omdia联合发布AI安全报告,引领构建全新AI安全范式
- 阿里云 2025首届「AI安全」全球挑战赛完美收官,展现大模型安全攻防新高度
- 模型即服务,应用即未来:阿里云助力中小企业AI应用规模化落地
- 叫叫与阿里云达成全栈AI战略合作 让教育更“懂孩子”
- Zenlayer 亮相 2025 云栖大会,荣获阿里云首批云网络产品能力认证伙伴
- 在阿里云上,跑出中小企业AI应用规模化的“加速度”
- 亚信科技、阿里云达成“能力中心”合作,联办大模型论坛
- 德明利亮相阿里云栖大会,首秀企业级存储产品及解决方案
- 英特尔助力阿里云推出多款云实例与存储方案,共筑AI时代云端算力基石
- 方直科技与阿里云达成AI全栈战略合作, 开启儿童智能陪伴新征程
- BetterYeah AI联手阿里云推出电商行业AI Agent解决方案
- 汉数科技携手阿里云,打造 AI 大模型时代的高质量数据云
- 德勤、SAP、阿里云联手发布“智企三百计划“
- 值得买科技携“海纳”MCP Server亮相阿里云栖大会,驱动AI应用生态协同创新发展
- 阿里云发布全新AI员工“万小智”,赋能中小微企业开启智能经营时代
- 科技向善 AI兴实 | 中兴通讯亮相2025云栖大会 携手阿里云共建云生态