昇腾384超节点:业界最大规模高速总线互联超节点,突破AI算力互联瓶颈
2025-05-28 16:04:14AI云资讯1813
2025年5月23日,在备受瞩目的鲲鹏昇腾开发者大会2025—昇腾AI开发者峰会上,华为重磅推出昇腾超节点技术,成功实现业界最大规模的384卡高速总线互联,为人工智能领域带来全新变革,正式开启AI新纪元。

当前,大模型发展呈现参数与效率交替演进的态势。一方面,Scaling Law不断推动模型能力突破极限;另一方面,以DeepSeek为代表的创新架构与工程技术,正加速模型能力在千行万业的落地应用。在此背景下,MoE成为主流模型结构,其复杂的混合并行策略带来巨大挑战,TP、SP、EP单次通信量高达GB级且难以掩盖。随着并行规模持续扩大,传统服务器跨机带宽已成为训练的核心阻碍,亟需计算架构的创新升级以适配未来模型发展。
传统服务器依赖以太网络实现跨机互联,通信带宽较低。实践表明,当TP、SP或EP等分布式策略的混合并行域超过8卡时,跨机通信带宽便成为性能瓶颈,导致系统性能大幅下降。
华为昇腾超节点打破了以CPU为中心的冯诺依曼架构,创新提出了对等计算架构,凭借高速总线互联技术实现重大突破,把总线从服务器内部,扩展到整机柜、甚至跨机柜。在超节点范围内,用高速总线互联替代传统以太,通信带宽提升了15倍;单跳通信时延也从2微秒做到200纳秒,降低了10倍,使集群如同一台计算机般协同工作,有效突破系统性能限制。
此次推出的昇腾384超节点,由12个计算柜和4个总线柜构成,是目前业界规模最大的超节点。依托华为在ICT领域深厚的技术与工程经验,通过最佳负载均衡组网方案,该超节点可进一步扩展为包含数万卡的Atlas 900 SuperCluster超节点集群,为未来更大规模的模型演进提供有力支撑。
性能测试数据显示,在昇腾超节点集群上,LLaMA 3等千亿稠密模型性能相比传统集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模态、MoE模型上,性能提升可达3倍以上,较业界其他集群高出1.2倍,在行业中处于领先地位。
华为表示,未来将持续加大创新力度,携手全球开发者在昇腾社区共同构建智能时代高效算力底座,为千行万业的大模型创新提供强劲动力,推动人工智能技术在更多领域的深度应用与发展。
相关文章
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 睿思智联获昇腾 Atlas 800T/800I A3 认证:从 “能用” 到 “好用” 定义国产智算精细化管理新标准
- 昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
- 昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA
- 巅峰对决松山湖!鲲鹏昇腾创新大赛全国总决赛2025圆满落幕
- 以创新赴约,为未来赋能!鲲鹏昇腾创新大赛2025全国总决赛即将开赛
- 中国电信TeleStudio:深度适配华为昇腾算力底座,开启AIGC普惠新时代
- 助力打造“数智龙华”AI CITY先锋城区,“鸿蒙+昇腾”双生态数字孪生平台成功落地
- 昇腾生态硬核赋能!上交大攻克超长上下文推理难题,性能大幅跃升
- 从代码生成到智能开发:北大发布基于昇腾平台软件开发解决方案
- 昇腾384超节点深圳首秀!光明实验室携手华为开启国产AI生态“新丝绸之路”
- AI时代“国之重器”:基于昇腾的国产AI生态主题特展亮相高交会
- 凝“芯”聚力,淬炼成“钢” | 昇腾“淬火行动”北京专场点燃伙伴开发者创新引擎
- 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路
- 国产算力部署推理新突破!联通元景万悟发布MinerU 昇腾方案,部署周期缩短1倍,推理性能提升50%!
- HC2025丨高校创新力量“花开”开发者日,鲲鹏昇腾使能科研创新
人工智能企业
更多>>人工智能硬件
更多>>- 鲲鹏 为更先进的数智世界而计算——李义在鲲鹏伙伴峰会2026上的主题发言
- 拥抱赋能OpenClaw智能生态,此芯科技CIX ClawCore螯芯系列芯片震撼首发
- 机械革命硬核新品京东首发 耀世18Pro巨幕旗舰、无界14轻薄本开启预约
- 无折痕折叠旗舰引爆市场:OPPO Find N6首销日湖南门店现抢购热潮
- AMD锐龙 AI MAX+ 392 移动处理器加持 华硕天选Air 2026 锐龙 AI Max版开启高效学习
- 聚焦 COSP 户外展:BleeqUp 超影擎如何用 AI 眼镜重新定义户外运动交互?
- 一加 15T 搭载 LUMO 凝光影像系统,3.5 倍潜望长焦加持拍人拍景更出彩
- 技嘉 32 英寸 240Hz QD-OLED 电竞显示器 MO32U24 正式上市









