昇腾384超节点:业界最大规模高速总线互联超节点,突破AI算力互联瓶颈
2025-05-28 16:04:14爱云资讯1266
2025年5月23日,在备受瞩目的鲲鹏昇腾开发者大会2025—昇腾AI开发者峰会上,华为重磅推出昇腾超节点技术,成功实现业界最大规模的384卡高速总线互联,为人工智能领域带来全新变革,正式开启AI新纪元。
当前,大模型发展呈现参数与效率交替演进的态势。一方面,Scaling Law不断推动模型能力突破极限;另一方面,以DeepSeek为代表的创新架构与工程技术,正加速模型能力在千行万业的落地应用。在此背景下,MoE成为主流模型结构,其复杂的混合并行策略带来巨大挑战,TP、SP、EP单次通信量高达GB级且难以掩盖。随着并行规模持续扩大,传统服务器跨机带宽已成为训练的核心阻碍,亟需计算架构的创新升级以适配未来模型发展。
传统服务器依赖以太网络实现跨机互联,通信带宽较低。实践表明,当TP、SP或EP等分布式策略的混合并行域超过8卡时,跨机通信带宽便成为性能瓶颈,导致系统性能大幅下降。
华为昇腾超节点打破了以CPU为中心的冯诺依曼架构,创新提出了对等计算架构,凭借高速总线互联技术实现重大突破,把总线从服务器内部,扩展到整机柜、甚至跨机柜。在超节点范围内,用高速总线互联替代传统以太,通信带宽提升了15倍;单跳通信时延也从2微秒做到200纳秒,降低了10倍,使集群如同一台计算机般协同工作,有效突破系统性能限制。
此次推出的昇腾384超节点,由12个计算柜和4个总线柜构成,是目前业界规模最大的超节点。依托华为在ICT领域深厚的技术与工程经验,通过最佳负载均衡组网方案,该超节点可进一步扩展为包含数万卡的Atlas 900 SuperCluster超节点集群,为未来更大规模的模型演进提供有力支撑。
性能测试数据显示,在昇腾超节点集群上,LLaMA 3等千亿稠密模型性能相比传统集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模态、MoE模型上,性能提升可达3倍以上,较业界其他集群高出1.2倍,在行业中处于领先地位。
华为表示,未来将持续加大创新力度,携手全球开发者在昇腾社区共同构建智能时代高效算力底座,为千行万业的大模型创新提供强劲动力,推动人工智能技术在更多领域的深度应用与发展。
相关文章
- 云从科技亮相鲲鹏昇腾开发者大会2025 发布从容大模型智用一体机
- 神州鲲泰亮相鲲鹏昇腾开发者大会2025, 重磅发布教育行业一栈式智能开发平台
- 鲲鹏昇腾深度开放,加速创新者创新:鲲鹏昇腾开发者大会2025成功举办
- 华为云黄瑾:昇腾云CloudMatrix 384 超节点六大科技创新,定义下一代AI基础设施
- 东南大学鲲鹏昇腾科教创新孵化中心特训营(第一期)圆满举办
- 华为助力中国电信智算昇腾超节点正式商用启航 算力新引擎加速行业智能化
- 全球首个商用智算昇腾超节点在大湾区上线
- 华为开发者大会 2025 发布邀请函,盘古大模型、昇腾AI云服务新进展即将公布
- 北京邮电大学鲲鹏昇腾科教创新孵化中心成立 为ICT创新突破再“聚能赋力”
- 昇腾+DeepSeek,打造AI应用“江苏样本”
- 数字福州携手昇腾、DeepSeek,共绘 AI 产业发展新蓝图
- 华为昇腾AI云服务发布四大升级:搭载CloudMatrix 384超节点,性能业界领先
- 华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
- 北京大学鲲鹏昇腾科教创新卓越中心特训营圆满举办
- 上海交通大学鲲鹏昇腾科教创新卓越中心特训营DeepSeek专场圆满举办
- “浙”里启航 昇腾无限 | 2025昇腾AI开发者创享日浙江站成功举办