华为云基于CloudMatrix384的昇腾AI云服务全面上线
2025-06-21 17:36:14AI云资讯1471
在6月20日举行的华为开发者大会2025(HDC 2025)上,华为常务董事、华为云计算 CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力。

随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。华为云新一代昇腾AI云服务基于CloudMatrix384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300Tokens/s。超节点架构能更好地支持混合专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率。同时,超节点还可以支持“一卡一算力任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。
对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将432个超节点级联成最高16万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如“日推夜训”,训推算力可灵活分配,帮助客户资源使用最优。
张平安表示,昇腾AI云服务得到了全球客户、伙伴和开发者的支持。正是因为他们对华为的坚定信任,才有机会让昇腾构筑起一个比肩巅峰,开创未来的AI算力底座!
新浪与华为云深度合作,基于CloudMatrix384昇腾AI云服务,为“智慧小浪”智能服务体系构建了统一的推理平台,底层由昇腾AI算力提供支持。推理的交付效率提升了超过 50%,模型上线速度成倍加快;通过软硬协同调优,NPU利用率提升超过40%,每一份资源都得到更高效的使用。
硅基流动正在使用CloudMatrix384超节点,为数百万用户高效提供DeepSeekV3、R1的推理服务。面壁智能使用CloudMatrix384超节点,让他们的小钢炮模型的推理业务性能得到了2.7倍提升。
在科研领域,中科院基于CloudMatrix384超节点打造了自己的模型训练框架,快速构建了中科院AI forScience科研大模型,摆脱了对国外高性能AI算力平台的依赖。
在互联网领域,360打造的纳米AI搜索,为用户提供超级AI搜索服务,对AI算力有极大需求,也已开启了CloudMatrix384超节点的测试。
当前,昇腾AI云服务已经成为AI基础设施的最优选择,为超过1300家客户提供澎湃的AI算力,加速千行万业智能化升级。
相关文章
- 华为云创想者大会剧透:计划6月重磅发布AI全系产品
- 抓AI机遇,助伙伴增长——2026华为云核心生态伙伴共创研讨会在沪举行
- 华为云发布“加速智能化·企业快成长行动2026”,助力中小企业跨越AI鸿沟
- 华为畅享90系列支持室内定位,华为云空间守护设备安全
- 极致性价比!华为云柔性智算FlexNPU让算力不再“摸鱼”
- 华为云AI战略升级:以行业智能体为中心,打造企业级AI创新“黑土地”
- 华为云陈林:只有深入了解行业、用好“数据+AI”,才能真正解决问题、创造价值
- 华为云TaurusDB数据库智胜开年季,为高并发业务打造“既稳又弹”的数据引擎
- “政策+产品+激励”三箭齐发,华为云开年采购季动员会吹响开门红冲锋号
- 华为云码道(CodeArts)代码智能体公测版正式发布,开启智能体编码新实践
- 华为云核心网开启体验经营新纪元
- 华为云完成智谱GLM-5适配,多款产品已接入可在线体验
- 华为云黄瑾:做难而正确的事,用AI解行业难题
- 高并发业务如何兼顾稳定与弹性?华为云TaurusDB给出“存算分离”新解
- 华为云安全“铁三角”,筑牢企业数智化安全底座
- 华为云发布2026年全球销售伙伴政策,与合作伙伴共赢AI时代
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









