腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%
2024-07-03 09:08:30AI云资讯70723
7月1日,腾讯宣布其自研星脉高性能计算网络升级至2.0版本,星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%,定位从天级降低至分钟级。
腾讯自研交换机从 25.6T 升级到 51.2T,容量提升一倍;自研硅光模块从 200G 升级到 400G,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2T,为业界最高。
腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。
腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信,实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。
TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。
腾讯云副总裁王亚晨这样比喻,AI大模型就像是一场F1比赛,腾讯云专门设计了星脉高性能算力网络“赛道”,并自研了TiTa和TCCL网络协议作为“赛事指挥中心与专业车队”,共同让“腾讯云高性能计算集群HCC的GPU服务器”这台F1赛车发挥最大的算力性能。
相关文章
- 腾讯云吴永坚:「CB联动」,打造智能体时代“能力基座”
- 腾讯云吴运声:构建实用好用的企业级智能体,让AI人人可用
- 跨维智能与腾讯云达成战略合作,以生成式世界模型驱动具身智能高效落地
- TVU Networks与腾讯云联合发布集成式云制播解决方案
- 腾讯云黄世飞:全面升级Data+AI能力,构建企业智能化数据基座
- 合同AI从可用到好用,腾讯电子签发布智能化合同解决方案
- 让知识触手可及!腾讯乐享发布更懂企业的AI知识库
- 腾讯云TDSQL自研产品家族扩容,数据库AI服务正式发布
- 腾讯开源框架 Kuikly 再升级!率先适配 “液态玻璃”,原生体验更极致
- 腾讯地图张治东:AI驱动战略进阶,打造智能增长新引擎
- 腾讯集团副总裁钟翔平:三大关键词,定义腾讯地图产业新图景
- 智慧星光与腾讯云深化战略合作,推进AI在认知智能与决策智能领域服务
- 腾讯云高级副总裁徐翊鸣:AI已成为金融机构提升生产力的“战略杠杆”
- 腾讯全球数字生态大会:《国产数字化升级标杆实践报告》重磅发布
- 腾讯云面向全球发布智能体开发平台 3.0
- 2025腾讯云国际出海峰会:国际业务高双位数增长,海外客户规模同比增长翻倍