中国移动首发智算推理集群“运营黄金标准”
2025-12-30 11:33:31AI云资讯2252
近日,中国移动联合合作伙伴在智算运营领域取得重要突破,在行业首创“智算推理集群运营黄金标准”。该标准以用户体验为导向,构建了一套可量化、可评估、可复用的集群运营指标体系,首次实现了对人工智能推理算力服务质量的系统化、标准化度量。这一创新标志着AI推理算力发展范式正从“规模扩张”转向“质量跃迁”,推动行业进入精细化运营与高质量发展的新阶段。

当前,人工智能发展正从集中式的“模型训练”(练兵)阶段加速迈向大规模“推理部署”(实战)阶段,推理应用已在政务、金融、制造、医疗等多场景深度落地,智能体生态蓬勃发展,驱动算力需求结构发生深刻变革——推理算力占比持续攀升,并已成为智算基础设施的核心负载。然而,面对用户对更高性能、更优体验与更低成本的复合诉求,行业仍面临突出矛盾。因此,如何在保障服务质量的前提下,动态平衡“降本”与“优服”,实现推理系统的高效、稳定与经济运行,已成为当前智算基础设施建设与运营亟待破解的核心挑战。
针对这一挑战,中国移动基于大量理论分析与实测验证,创新提出“智算推理集群运营黄金标准”。该标准以“度量破局”为核心理念,系统构建涵盖用户体验、系统并发能力、系统可用性及硬件利用率四大维度的集群效能评估体系。通过实时监控推理集群运行状态,该体系在保障关键体验指标达标的前提下,精准识别最先触达性能瓶颈的硬件资源指标,并将其确立为当前场景下的“黄金指标”。这一指标不仅反映系统性能的临界约束条件,还可作为判断集群是否高效运行、是否需要扩容或优化的重要决策依据。

为验证“黄金标准”的有效性,中国移动组织开展试点工作,系统评估了多种典型模型在不同业务负载下的运行表现,包括以DeepSeek-R1为代表的MoE(混合专家)稀疏大语言模型、以Qwen3-32B为代表的稠密大语言模型、以Qwen2.5-VL-72B为代表的多模态理解模型、以StableDiffusion为代表的多模态生成模型。测试结果显示,在不同推理负载下,四项硬件指标(算力利用率、显存利用率、显存带宽利用率和KVCache利用率)的增长速率存在显著差异,且各场景中最先触达性能瓶颈的指标各不相同。
依托“黄金指标”的实时监控,企业能够在高并发与负载波动等复杂场景下,精准洞察集群运行状态,实现精细化运营。即当指标显示资源利用率较低时,可主动引入负载提升资源效能;当指标逼近扩容阈值时,则触发弹性扩容机制。实践表明,该方法可实现扩容决策准确率接近100%。

面向未来,中国移动将深入贯彻落实国家“人工智能+”战略,把握历史机遇,锚定“人工智能供给者、汇聚者、运营者”三位一体定位,全面升级“AI+”行动计划,发挥央企引领作用。公司将持续夯实智算基础设施底座,创新体系化运营模式,推动算力供给向普惠易用、经济高效、绿色智能方向演进;同时,广泛开放应用场景,加速AI技术在企业内外千行百业的深度渗透与规模化落地,全面赋能经济社会数字化转型。
相关文章
- 中国移动联合华为打造的“AI+Network”运维转型解决方案荣获GSMA GLOMO“最佳AI使能网络解决方案奖”
- 中国移动自智网络创新成果斩获2026年 GSMA GLOMO大奖
- MWC 26|亚信科技携手中国移动斩获 GTI Awards-最佳移动AI应用奖
- 中国移动副总经理张冬:智启新纪元,联创新未来,绘就具身智能产业新图景
- 重塑蜂窝边界,赋能6G网络——中兴通讯携手中国移动在MWC26巴塞罗那联合发布GigaMIMO创新成果
- 中国移动研究院展示智能体通信网络(ACN)原型并首发意图感知白皮书
- 中国移动研究院发布智能体互联网 开放网络协议AONP框架及智能体网关
- 中国移动发布原创智算互联技术及全球首台百T级智算互联设备样机
- 中国移动副总经理李慧镝:AN L4驱动众智启新时代
- 直击MWC 2026,见证中国移动如何引领科技创新浪潮
- GSMA 、中国移动、中国电信、中国联通发起Mobile AI Innovation 倡议
- 硬核科技实力出圈!中国移动精彩亮相MWC 2026
- 中国移动自智网络项目荣获国际标准贡献奖
- 当春节都在卷情怀,中国移动携王耀庆爆笑上演《“移”个好网》
- 中国移动数据分析类智能体“九天AlphaData”获国际权威评测认可
- 中兴通讯联合中国移动斩获TM Forum “杰出资产贡献奖”:通信大模型赋能行业智能运维
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









