腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%
2024-07-03 09:08:30爱云资讯70561
7月1日,腾讯宣布其自研星脉高性能计算网络升级至2.0版本,星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%,定位从天级降低至分钟级。
腾讯自研交换机从 25.6T 升级到 51.2T,容量提升一倍;自研硅光模块从 200G 升级到 400G,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2T,为业界最高。
腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。
腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信,实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。
TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。
腾讯云副总裁王亚晨这样比喻,AI大模型就像是一场F1比赛,腾讯云专门设计了星脉高性能算力网络“赛道”,并自研了TiTa和TCCL网络协议作为“赛事指挥中心与专业车队”,共同让“腾讯云高性能计算集群HCC的GPU服务器”这台F1赛车发挥最大的算力性能。
相关文章
- 腾讯钟翔平:汽车市场规则走向“快鱼吃慢鱼”,AI创新进化能力决定竞争力
- 腾讯智慧出行技术开放日:升级全栈AI能力,助力汽车产业大模型应用
- 中国游戏出海迎来新机遇,腾讯游戏安全ACE助力应对安全挑战
- 腾讯“物种之眼”AI全新升级 高效识别数千物种
- 从业务上云到出海护航,腾讯云助力工业和能源企业重塑增长
- 腾讯云李力:构建稳定安全的基础设施,助力大模型应用落地
- 腾讯云大模型知识引擎已率先接入MCP!拓展AI应用边界
- 奇点星宇与腾讯云达成合作,助力LiblibAI构建AI时代创意基础设施
- 腾讯云王麒:大模型+知识库,是企业落地AI的最佳路径
- 腾讯云TVP走进三一集团,揭秘 AI+DeepSeek 工业智造新未来
- Flat Ads正式官宣成为腾讯云国际官方代理 携手共建企业云端生态
- IDC报告:腾讯游戏云持续领跑市场,收入增速连续两年第一
- 长安汽车与腾讯合作再深化,共建智能驾驶数据闭环
- 腾讯云TVP AI与安全高峰论坛圆满落幕,共探大模型时代的安全破局之道
- 腾讯发布2024年度ESG报告:以前沿技术持续创造社会价值
- 腾讯推出“给乡亲们的第一堂AI工具课”,将“元宝”实用指南送达田间地头