北京电信打造高品质智算广域网,百公里无损联算服务首都新发展
2024-12-25 09:31:17爱云资讯592
【中国,北京,2024年12月23日】在由中国信息通信研究院主办的智算IP广域网产业交流会上,中国电信股份有限公司北京分公司(以下简称“北京电信”)云网发展部规划总监姚凌分享了“打造高品质智算广域网,百公里无损联算服务首都新发展”的演讲。姚凌表示北京电信通过智算广域网将京津冀三地算力中心资源整合,探索多算力中心协同完成超大模型训练的多点共算新模式。采用新型流级拥塞控制,无损调度和深度负载均衡智算广域网技术,保证网络传输吞吐率95%以上,从而实现跨智算中心算效不下降,高效服务人工智能产业发展需求。
算力需求每年增长10倍,运营商规划构建万卡集群,协同完成超大模型训练。受供电、机房环境等因素限制,单智算中心物理环境不满足万卡集群的建设需求。通过广域网络联接跨几百到上千公里的异地算力中心,会面临两个关键技术点挑战: 一是跨DC大模型训练极端情况流量瞬时并发达上千Tbps,需要考虑收敛比和训练效率之间平衡最优比。二是RDMA长距传输对于丢包十分敏感,千分之一丢包会导致网络吞吐率下降,影响算卡效率并造成资源浪费。
北京电信通过新一代智算路由器打造智算广域网,采用新型流级拥塞控制技术,可精准快速识别网络发生拥塞或故障,并基于流进行拥塞控制,确保拥塞不扩散到全网。同时采用路由器广域无损调度和负载均衡技术,避免数据丢包导致算卡计算效率下降,现网实际验证跨100公里长距算效仅降1%。
姚凌表示北京电信后续将持续探索多DC协同技术研究,目前正在联合云公司开展智算拉远四阶段验证。基于息壤慧聚智能模型服务平台,验证百川等真实客户模型拉远效果,逐步推进智算拉远方案走向商用。
相关文章
- “算网筑基,智赋百业”上海电信打造业界首个400GE IP弹性无损智算广域网络
- 星河AI智算广域网解决方案,助力行业数智化发展
- 信息通信研究院高巍:AI时代下智算广域网发展思考
- 北京电信打造高品质智算广域网,百公里无损联算服务首都新发展
- 算网筑基,智赋百业,上海电信联合华为打造业界首个400GE IP弹性无损智算广域网络
- HNS 2023亚太站|华为广域网络夯实数字基座,开拓创新高地
- 华为发布《广域网络服务化白皮书》,首提广域网络服务化理念
- 新华三出席2021中国SD-WAN峰会,共话智能广域网新方向
- 思科推出新的广域网边缘平台,助力企业快速安全地采用云计算
- 华为发布CloudWAN 2.0,以智能重塑广域网络
- 新华三出席“SD-WAN产业发展论坛”,助力智能广域网再升级