以“存算传一体化”架构,打破I/O瓶颈

2026-03-16 11:25:41AI云资讯1925

3月12日,中科曙光发布首款全栈自研400G无损高速网络——scaleFabric,实现国产高端原生RDMA技术的重要突破。该产品从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%自主研发,填补了国内数据中心高速网络领域的空白。

高速网络突破的背后,是中科曙光以全栈芯片级国产化能力,构筑的“存算传一体化”紧耦合架构。通过将“超级隧道”技术与自研RDMA网络深度结合,为超大规模智算集群提供高效、安全、稳定的数据供给。

存算传一体化,打通数据高速通道

在AI训练和推理场景中,海量数据需要在计算节点与存储系统之间持续流动,若存储与网络适配不足,极易出现网络拥塞或资源竞争,拖累算力利用效率。

中科曙光通过“超级隧道”技术构建专属数据通道,并与自研RDMA高速网络深度适配、协同工作。系统在硬件层面为各数据域配置独享的RDMA网络连接和PCIe通道,并通过NUMA亲和性优化资源分配;在软件层面实现线程、内存与存储资源的绑定调度。通过软硬件协同优化设计,有效减少网络拥堵和资源竞争,让数据沿最优路径高速流动,持续为AI计算提供稳定的数据负载支撑。

全栈国产化,筑牢数据安全屏障

随着人工智能应用深入关键行业,数据平台的安全性与自主可控能力日益重要。曙光分布式存储构建了从芯片到系统软件的全栈存储国产化体系。

在硬件层面,系统基于国产CPU、国产IO控制器和国产全闪存介质构建,并结合高速互联网络形成完整架构;在软件层面,存储系统拥有完整源代码,实现基础架构与软件栈的全面自主可控。这一体系不仅保障数据安全,更为软硬件协同优化提供基础,使存储系统能够更好地适配AI负载需求。

绿色实践,赋能存算升级

当超大规模智算集群成为发展趋势,数据中心散热与能耗压力剧增。曙光以全栈液冷技术,将曙光液冷存储、曙光液冷计算子系统与曙光自研液冷IB交换机深度融合、协同联动,构建起覆盖计算、存储与网络的全栈液冷体系,以更高散热效率、更优稳定性,支撑高密度算力持续稳定运行,真正实现“全组件液冷覆盖、全链路协同优化”。

目前,曙光分布式存储已在国家超大规模算力平台中得到验证。在国家超算互联网核心节点部署运行的3套scaleX万卡超集群,可提供超过3万卡国产AI算力。其中,存储、计算与高速网络协同运行,显著提升整体算力利用效率,为国产智算基础设施规模化应用提供了宝贵实践。

随着AI应用不断深入,数据正成为算力体系中最关键的资源之一。以“存算传强协同”为核心的新型架构,也将为未来智算中心构建更加高效、稳定的数据基础。

相关文章

人工智能企业

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>

人工智能技术

更多>>
AI云资讯(爱云资讯)立足人工智能科技,打造有深度、有前瞻、有影响力的泛科技信息平台。
合作QQ:1211461360微信号:icloudnews