腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%
2024-07-03 09:08:30爱云资讯70643
7月1日,腾讯宣布其自研星脉高性能计算网络升级至2.0版本,星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%,定位从天级降低至分钟级。
腾讯自研交换机从 25.6T 升级到 51.2T,容量提升一倍;自研硅光模块从 200G 升级到 400G,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2T,为业界最高。
腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。
腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信,实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。
TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。
腾讯云副总裁王亚晨这样比喻,AI大模型就像是一场F1比赛,腾讯云专门设计了星脉高性能算力网络“赛道”,并自研了TiTa和TCCL网络协议作为“赛事指挥中心与专业车队”,共同让“腾讯云高性能计算集群HCC的GPU服务器”这台F1赛车发挥最大的算力性能。
相关文章
- AI智能加速,腾讯云天御构建全流程、多场景金融风控安全防线
- 腾讯系超50款鸿蒙应用上架:更新加速度,功能完备度飙升!
- 索尼起诉腾讯旗下《荒野起源》涉嫌抄袭《地平线》系列 指控腾讯亦步亦趋克隆游戏设计
- “金融智能体创造营”启航,赞同科技携手腾讯云共绘金融AI生态新图景
- 2025WAIC:腾讯地图上线旅游规划Agent,打造一站式智能出行新体验
- 2025WAIC丨腾讯AI应用全景图亮相:1+3+N,加速打造「好用的AI」
- 2025 WAIC丨腾讯云副总裁吴运声:把AI变成全新生产力
- 腾讯云TencentOS提交Swap Table补丁系列 Linux内核内存交换性能提升20%~30%
- 拿下SOTA!腾讯优图联合厦门大学提出AIGI生成图像检测新方法
- 腾讯云GooseFS团队与厦门大学合作成果 AC-Cache入选 PPOPP
- 腾讯云TencentOS Server V4 全面支持安全启动,引导程序获微软签名
- 腾讯云携手IEEE发布全球首个金融风控大模型标准,推动金融风控范式创新
- 腾讯游戏陈冬:数字游戏技术助力世界文化遗产保护
- 腾讯云x泡泡玛特:全方位云上守护,让潮玩回归热爱
- 中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请
- 腾讯云 TVP 走进苏州名城,探寻云 + AI 驱动文旅产业智能化跃迁