昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%
2025-08-20 19:57:29AI云资讯2281
随着人工智能技术的飞速发展,大模型参数量激增。MoE 稀疏大模型因能在提升容量的同时保持训练计算量,成为了当下的研究热点,但推理时的性能瓶颈仍制约着其进一步发展。在此背景下,中国科学技术大学人工智能与数据科学学院执行院长张燕咏率领团队,在中国科学技术大学 鲲鹏昇腾科教创新卓越中心的算力支持下,成功研发出了基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。
该框架的研究致力于解决两大难题——专家负载不均及较大的计算通信开销,并通过“三步走”成功实现了推理性能的优化。为了让模型在并行推理时能更合理地分配资源,团队首先从专家选择的规律入手,通过分析相似 token 在 MoE 层选择专家的特征并归类,成功预测出token的专家选择路径偏好。
接着便是解决推理过程中的专家负载不均衡问题。团队依据token对专家选择偏好的预测结果,精准判断出专家动态访问的频率和重要性,通过复制高频专家、替换非重要专家的方式实现了负载平衡。其中昇腾推理引擎MindIE提供的性能分析工具可实现性能数据的可视化,在实时监测专家负载、统计访问频率等方面提供数据参考,发挥了重要作用。
降低分布式计算的通信时延是第三步。团队根据计算节点上的数据对专家选择的预测结果,将专家提前部署到对应的节点上,并联合需要紧密协作的专家放在同一计算单元,让数据与所需专家在物理位置上更接近,同时结合昇腾384超节点采用的高速总线互联技术,最终大幅降低了跨节点和跨计算单元的通信消耗。
在系列技术突破下,此次项目成果显著。基于该创新框架,在多尺寸、多结构的 MoE 模型中,推理时间、all2all 时间、MoE 层时间及负载不均分数较现有主流方案提升超 30%;多卡复杂场景里,前三项指标提升 30%,推理时间提升 20%。
本次项目的成果,为开发者借助昇腾技术优化 MoE 稀疏大模型推理性能提供了可贵借鉴,将加速其在各领域的落地应用。未来,中国科学技术大学 鲲鹏昇腾科教创新卓越中心将持续深化产学研协同创新,依托昇腾软硬件平台,在前沿AI模型优化领域持续突破,为自主创新人工智能战略与数字经济发展贡献力量。
相关文章
- 从代码生成到智能开发:北大发布基于昇腾平台软件开发解决方案
- 昇腾384超节点深圳首秀!光明实验室携手华为开启国产AI生态“新丝绸之路”
- AI时代“国之重器”:基于昇腾的国产AI生态主题特展亮相高交会
- 凝“芯”聚力,淬炼成“钢” | 昇腾“淬火行动”北京专场点燃伙伴开发者创新引擎
- 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路
- 国产算力部署推理新突破!联通元景万悟发布MinerU 昇腾方案,部署周期缩短1倍,推理性能提升50%!
- HC2025丨高校创新力量“花开”开发者日,鲲鹏昇腾使能科研创新
- 华为全联接大会2025首发《算力珠玑》十大实战案例助力开发者攻克鲲鹏、昇腾开发难关
- 昇腾联合伙伴发布多款 AI 硬件新品 硬件开放战略助力千行万业场景化智能化升级
- 云从科技获华为“昇腾生态最佳实践伙伴”奖 共创AI产业新生态
- 北京航空航天大学 鲲鹏昇腾科教创新孵化中心揭牌,推动中国自主计算生态建设
- 相聚上海,共赴智能之约!昇腾AI人工智能产业峰会三大亮点抢先看
- 科大讯飞联合华为联合推出iFlyCode编程一体机昇腾版,筑牢AI编程安全防线
- 与时代共昇腾 华为携手全爱科技上海AI分享会圆满举办 探智能转型新路径
- 哈尔滨工业大学鲲鹏昇腾科教创新孵化中心成立
- 伙伴协同创新×行业场景深耕:先进算力加速“下沉”的昇腾路径









