以“存算传一体化”架构，打破I/O瓶颈-AI云资讯

3月12日，中科曙光发布首款全栈自研400G无损高速网络——scaleFabric，实现国产高端原生RDMA技术的重要突破。该产品从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%自主研发，填补了国内数据中心高速网络领域的空白。

高速网络突破的背后，是中科曙光以全栈芯片级国产化能力，构筑的“存算传一体化”紧耦合架构。通过将“超级隧道”技术与自研RDMA网络深度结合，为超大规模智算集群提供高效、安全、稳定的数据供给。

存算传一体化，打通数据高速通道

在AI训练和推理场景中，海量数据需要在计算节点与存储系统之间持续流动，若存储与网络适配不足，极易出现网络拥塞或资源竞争，拖累算力利用效率。

中科曙光通过“超级隧道”技术构建专属数据通道，并与自研RDMA高速网络深度适配、协同工作。系统在硬件层面为各数据域配置独享的RDMA网络连接和PCIe通道，并通过NUMA亲和性优化资源分配；在软件层面实现线程、内存与存储资源的绑定调度。通过软硬件协同优化设计，有效减少网络拥堵和资源竞争，让数据沿最优路径高速流动，持续为AI计算提供稳定的数据负载支撑。

全栈国产化，筑牢数据安全屏障

随着人工智能应用深入关键行业，数据平台的安全性与自主可控能力日益重要。曙光分布式存储构建了从芯片到系统软件的全栈存储国产化体系。

在硬件层面，系统基于国产CPU、国产IO控制器和国产全闪存介质构建，并结合高速互联网络形成完整架构；在软件层面，存储系统拥有完整源代码，实现基础架构与软件栈的全面自主可控。这一体系不仅保障数据安全，更为软硬件协同优化提供基础，使存储系统能够更好地适配AI负载需求。

绿色实践，赋能存算升级

当超大规模智算集群成为发展趋势，数据中心散热与能耗压力剧增。曙光以全栈液冷技术，将曙光液冷存储、曙光液冷计算子系统与曙光自研液冷IB交换机深度融合、协同联动，构建起覆盖计算、存储与网络的全栈液冷体系，以更高散热效率、更优稳定性，支撑高密度算力持续稳定运行，真正实现“全组件液冷覆盖、全链路协同优化”。

目前，曙光分布式存储已在国家超大规模算力平台中得到验证。在国家超算互联网核心节点部署运行的3套scaleX万卡超集群，可提供超过3万卡国产AI算力。其中，存储、计算与高速网络协同运行，显著提升整体算力利用效率，为国产智算基础设施规模化应用提供了宝贵实践。

随着AI应用不断深入，数据正成为算力体系中最关键的资源之一。以“存算传强协同”为核心的新型架构，也将为未来智算中心构建更加高效、稳定的数据基础。

以“存算传一体化”架构，打破I/O瓶颈

相关文章

人工智能企业

人工智能硬件

人工智能产业

人工智能技术