中国移动发布MoMA平台:一站式调用超300款模型,单位Token成本压降30%以上
2026-05-08 12:04:40AI云资讯1784
5月8日,在2026移动云大会主论坛上,中国移动发布移动模型服务平台MoMA。平台接入超300款业界主流AI模型,模型丰富度行业领先,首创Token集约化运营模式,推动AI像水和电一样“随时可得、随处可用”,让人工智能真正走进千家万户、服务千行百业。

开放普惠,让AI触手可及
MoMA构建了“一次接入、智能优选、普惠可用、安全可信” 的一站式模型服务体系,着力降低AI应用门槛。
提供统一API网关,用户一次接入即可调用平台全部模型资源。目前,MoMA已接入中国移动自研“九天”基座大模型,以及DeepSeek、通义千问、豆包、Kimi、GLM等业界优质模型,覆盖文本生成、语音处理、多模态理解等多项能力,满足政务、金融、工业、医疗、教育等多场景应用需求。
首创智能路由引擎,自动分析用户需求,灵活切换“成本优先”“效果优先”“均衡优先”等三种策略,为用户动态匹配最适合的模型。当模型出现超时、限流或故障时,平台可自动实现秒级切换,确保业务连续不中断。
降低模型使用成本,MoMA平台基于国产算力部署自研推理引擎,结合智能路由对长尾模型资源调度,实现单位Token成本压降约30%,降低资源占用率50%以上。此外,智能缓存、上下文复用、Token压缩等相关技术手段运用进一步降低了使用成本。平台的中立路由原则,为用户在业务效果与算力成本之间找到了最优平衡。
服务保障安全可信,MoMA推出“机密模型”服务,将模型部署在机密容器中,基于硬件隔离技术保障计算过程的数据安全,做到“可用不可见”。这一能力覆盖从芯片到应用的全链路机密计算,为政务、金融等数据安全要求较高的场景提供了可靠支撑。
集约运营,助力Token高效调用
开放普惠主要解决“用得起、用得上”的问题,集约化运营则聚焦“用得好、管得住”难点。MoMA围绕Token全生命周期,构建了从精准计量、风险管控到经营分析的完整运营闭环体系,实现算力资源的清晰记录、高效流转与安全管控,推动算力资源规范、集约化利用。
实时精准计量,用多少、算多少。平台实施流式实时计费,用户使用Token计费端到端时延不超过1分钟,实现“即用即付”,有效破解传统按包计费模式的资源浪费以及账单消费缺乏透明度的问题。
运用专属风控,可追溯、可闭环。MoMA搭建了专属风控机制,保证Token计费全流程可追溯、可审计、可闭环,从根源上杜绝资源挤占、费用超支以及服务中断的风险,确保每一笔 Token消耗清晰透明。
提供链路观测,有支撑、有依据。平台提供全链路可观测能力,实时采集时延、吞吐量、Token消耗、GPU资源等关键指标,将监控、预警、诊断整合为一体化运营指标体系,覆盖客户、订购、使用、收入等多维度数据。AI投入与产出一目了然,为用户经营决策提供了具体依据。

下一步,中国移动将不断提升移动模型服务平台MoMA服务质效,携手产业伙伴,共同释放算力新动能、拓展智能新空间,推动人工智能更加广泛、高效、安全地服务经济社会发展。
相关文章
- 中国移动与工联院签署全国装备制造业数字供应链平台合作协议
- 数智领跑!首个5G-A服务升级活动落地,中国移动河南公司四大新品焕新中原生活
- 中国移动:聚智向新,实干造“福”
- 速率超1G的中国移动5G-A超级上行网络来了
- 中国移动5G-A超级上行启航大会成功举办
- 中国移动发布系列安全技术创新成果
- 浩鲸科技受邀参加2026年中国移动中资出海数智赋能合作会议
- 中国移动:自智网络产品赋能5G专网智惠千行百业
- 中国移动举办2026年中资出海数智赋能合作会议
- 中国移动6G网络化协作通感成果入选2026央企原创技术策源地十大标志性成果
- 中国移动联合主办2026中关村论坛“量子科技与人工智能融合发展”平行论坛
- 中国移动2025年营收为10502亿元 同比增长0.9%
- 荣耀YOYO智能体携手中国移动灵犀智能体 打造全场景智能服务新范式
- 香港单体规模最大智算中心——中国移动环球智算中心开幕
- 中国移动与北京科技大学签署战略合作协议
- 央地协同!中国移动产业生态孵化中心·长三角算力网络创新基地启动
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









