腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%
2024-07-03 09:08:30爱云资讯70593
7月1日,腾讯宣布其自研星脉高性能计算网络升级至2.0版本,星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%,定位从天级降低至分钟级。
腾讯自研交换机从 25.6T 升级到 51.2T,容量提升一倍;自研硅光模块从 200G 升级到 400G,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2T,为业界最高。
腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。
腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信,实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。
TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。
腾讯云副总裁王亚晨这样比喻,AI大模型就像是一场F1比赛,腾讯云专门设计了星脉高性能算力网络“赛道”,并自研了TiTa和TCCL网络协议作为“赛事指挥中心与专业车队”,共同让“腾讯云高性能计算集群HCC的GPU服务器”这台F1赛车发挥最大的算力性能。
相关文章
- 超越ControlNet!腾讯优图实验室联合复旦大学提出AI生图新框架,解决多条件生成难题
- 腾讯云推出云开发AI Toolkit,国内首个面向智能编程的后端服务
- 腾讯云安全发布云上红蓝对抗防护神器,破解重保盲区与溯源难题
- 腾讯AI数字人AvaMo落地商用,百度/微美全息加速虚拟人生态闭环构建
- 腾讯云天御发布海外交易风控解决方案,AI+情报双擎护航企业全球化安全
- 腾讯云TVP走进泸州老窖,解码AI数智未来
- 腾讯云入选Gartner®《如何建设实施网络检测与响应》报告全球代表厂商
- 印象笔记与腾讯云战略合作升级,推动AI普惠,拓展全球布局
- 海亮科技集团与腾讯云达成战略合作 共筑AI教育新生态
- 2天开发一款复杂应用,腾讯云代码助手推动软件工程进入AI驱动时代
- 腾讯云智算全新升级,相关技术能力刚获DeepSeek公开点赞
- 腾讯云吴运声:加速AI原生应用落地,让技术创新转化为实际生产力
- 腾讯云副总裁李学朝:智能体驱动“AI+营销”迈入全链路智能时代
- 腾讯汤道生:加速AI大模型、智能体、知识库和基础设施建设
- 腾讯大模型加速迭代:混元TurboS跻身全球前八
- 零代码配置多Agent,腾讯云正式发布“智能体开发平台”