腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%
2024-07-03 09:08:30AI云资讯70938
7月1日,腾讯宣布其自研星脉高性能计算网络升级至2.0版本,星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%,定位从天级降低至分钟级。

腾讯自研交换机从 25.6T 升级到 51.2T,容量提升一倍;自研硅光模块从 200G 升级到 400G,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2T,为业界最高。
腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。
腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信,实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。
TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。
腾讯云副总裁王亚晨这样比喻,AI大模型就像是一场F1比赛,腾讯云专门设计了星脉高性能算力网络“赛道”,并自研了TiTa和TCCL网络协议作为“赛事指挥中心与专业车队”,共同让“腾讯云高性能计算集群HCC的GPU服务器”这台F1赛车发挥最大的算力性能。
相关文章
- 腾讯云吴运声:构建实用、可靠、易管的企业级Agent平台,让AI人人可用
- 腾讯乐享AI知识库能力升级,Agent模式让知识成为生产力
- 腾讯云与宇泛智能战略合作 推动机器狗“大小脑”模型优化
- 腾讯云与特看科技战略合作 携手共探AI漫剧等领域内容生产新范式
- 腾讯云与Zilliz战略合作 加速向量数据库产业落地
- 腾讯云与闪铸战略合作 混元3D大模型助力3D打印产业场景落地
- 腾讯云与MiniMax战略合作 共同打造AI智能体基础设施行业标杆
- 腾讯云与艾欧智能达成战略合作 共推具身智能产业规模化落地
- GAS 2026引领“声态+AI”变革 腾讯音乐臻品全景声3.0荣获技术创新优秀案例
- 中国信通院与腾讯云联合发布“云上养虾安全七条”
- 腾讯最新财报 AI 投入加码,QQ 解锁 AI 社交新技能
- 腾讯加码AI,微信生态核心服务商微盟有望率先承接生态红利
- 腾讯云 x MiniMax:平稳运行百万级Agent RL沙箱
- 极客未来与腾讯云战略合作 探索备课授课系统等AI教育场景
- 腾讯云ADP Claw升级五大防护,打造安全可用的企业级OpenClaw解决方案
- 腾讯出行服务解锁无人驾驶,一键呼叫文远知行Robotaxi









