信通院栗蔚:大模型推理应用重塑云智算技术体系
2025-04-16 10:35:55AI云资讯2178
2025年4月10日-11日期间,由中国移动主办的“2025中国移动云智算大会——由云向智,共绘算网新生态”在江苏苏州举行。中国信息通信研究院云计算与大数据研究所副所长栗蔚出席大会,并发表“大模型推理应用重塑云智算技术体系”主题演讲。
大模型推理应用正重塑云智算技术体系,成为推动智能化转型的核心引擎。从算力需求的结构性转换到技术架构的深度重构,再到大模型推理服务质量的场景化演进,云智算技术正迈向从“算力供给”到“智能赋能”的新范式,为数字经济的高效、普惠与可持续发展提供坚实技术支撑。
“人工智能+算力+云”融合,加速我国数字经济蓬勃发展。
栗蔚指出,大模型推理性能驱动算力结构转型,从以训练为主转向以推理为核心,从当前70%以上用于集中式训练到未来70%以上用于分布式推理。全球云计算市场规模持续增长。2024年全球云计算市场规模达7,022亿美元,增速19.7%。国内市场云计算市场规模总计8,378亿元,较2023年增长35.9%,其中以中国移动为代表的运营商占三分之一以上份额,走在全球运营商前列。数字产业化市场来看,以大模型为主线的人工智能技术创新活跃,显著促进我国全要素生产率提升,对经济增长的整体贡献达到22.5%。
破局与重构:大模型推理加速的云智算技术突破
栗蔚指出,从数字化时代向智能化时代的演进中,云智算技术正聚焦于大模型推理场景与应用,呈现“1+3”的破局与重构趋势。商业模式破局,随大模型产业从预训练竞赛转向推理服务效能优化,商业模式逐步由单纯的技术竞赛过渡到价值共享与产业落地,强调高效推理技术与垂直应用场景结合以实现商业闭环;“云+算力互联”重构,一纵一横推动了云计算与分散算力资源的有效整合,催生了MaaS、AaaS等新型服务模式,并构建了“一点接入、全算贯通”的算力互联网架构,赋能全域大模型推理调度;“云+大模型”重构,芯片、框架和模型三位一体的协同优化进一步提升了异构推理性能;算力部署演进,政企大模型部署经历了从云原生到私有化场景的一体机方案,直至未来迈向云边端协同的发展路径。
可用性与性能是衡量大模型推理云服务质量的关键
栗蔚指出,随着云智算技术架构的深度重构,可用性与性能是衡量大模型推理云服务质量的关键。可用性方面,DeepSeek官网服务的频繁繁忙现象,折射出大模型推理服务接入后的首要挑战——如何保障服务的稳定性和连续性。性能方面,以TTFT、TPOT、延迟、单卡吞吐量和上下文长度为代表的“快、稳、密、异”四大指标是客户端关注推理性能的焦点。通用基线场景中,各云厂商通过优化整合“云+算力互联+大模型”,在昇腾910B、H20等芯片上的适配优化提升推理表现。行业应用场景中,因输入输出特性的差异,定制化需求显著,需依赖硬件互联效率与容错机制的协同进化来突破分布式推理性能瓶颈,而算力互联调度则是提高资源利用率的核心基石。
中国信息通信研究院工作开展
未来,中国信通院将不断深化大模型推理领域的研究探索,推动AI Cloud与算力互通体系建设,持续开展大模型推理云服务性能测试,强化产业协同与合作,提升各行业智能化水平,构建一个开放、合作、共赢的人工智能、算力和云计算深度融合的生态,为企业数智化转型注入活力。
相关文章
- 中国信通院标准所联合发布《基于智能IP广域网(AI WAN)的存算分离与云边协同训推技术研究报告(2025年)》
- 三重认可丨悠易GEO智能体荣登信通院「铸基计划」全景图,蝉联AI营销赛道代表厂商
- 国内首批最高等级!中兴通讯兴云数科通过中国信通院可信AI软件开发智能体能力认证
- 加和科技尹子杰出席信通院铸基计划年中会议,DataMax荣获多项权威认证
- 权威认定!慧博云通入选信通院铸基计划《高质量数字化转型产品及服务全景图》
- 亚信科技通过中国信通院首批“大模型应用交付总体能力”评估
- 权威认可!方向标FangMail连续入选中国信通院数安能力全景图及“磐安”优秀案例
- 信通院刘泰:人形机器人走近“智慧觉醒”奇点
- 嘉为蓝鲸参编信通院行业报告,为央国企数智化转型注入强劲动能!
- 青云科技与信通院、焱融启动 AI 推理场景高性能存储技术推进计划
- 引领普惠算力新征程 九章云极DataCanvas首批首家通过中国信通院“普惠算力”能力测试
- 容联云携手信通院,启动“智能体服务生态共创计划”
- 青云携手珠海华发入选信通院 2025 可信云用户典型实践
- 青云科技入选信通院 2025 可信云技术典型实践
- 信通院曹峰:AI技术演进诠释“化繁为简”产业逻辑
- 星火大模型内容安全防护平台通过中国信通院“云上大模型内容安全防护产品能力评估”