依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率
2025-11-30 09:35:16AI云资讯2498
从电路模拟的复杂推演到量子化学的微观分析,大规模稀疏线性方程组的高效求解是科学计算领域的核心需求。但传统稀疏直接求解器因数据非零元分布稀疏且不规则,导致运算低效、算力浪费等问题。近日,中国科学技术大学计算机科学与技术学院特任副研究员陈俊仕团队,在鲲鹏昇腾科教创新卓越中心的算力支持下,创新研发出面向鲲鹏处理器矩阵算力基于密集kernel的LU直接求解器,以密集运算方式实现了稀疏计算的高效求解,成功突破传统运算瓶颈。

该研究创新构建了一种面向稀疏矩阵计算的密集计算范式,系统化解构了传统稀疏直接求解器的性能瓶颈。团队通过将分散的非零元整合为更加规整的密集数据块,将不规则稀疏矩阵映射为统一稠密的大块结构,进而采用基于稠密矩阵运算的数值分解算法,取代传统稀疏运算中聚合非零小分块的碎片化计算模式,显著降低了由不规则内存访问引发的计算与调度开销,最终实现了计算效率与硬件利用率的协同优化。
该方案的顺利落地,深度依赖于鲲鹏平台的计算特性。硬件层面,鲲鹏920新型号集成专用矩阵运算单元,原生具备高密度数值分解运算的高效承载能力,可精准匹配密集数据块的集中化处理需求;其多核架构为大规模密集数据块的并行运算提供了坚实基础,避免算力闲置或过载。软件层面,鲲鹏 KML 数学库针对密集型矩阵运算进行深度优化,通过底层算法与硬件架构的协同,进一步放大了密集运算模式的性能潜力。经 70 余个跨领域测试集验证,该方案性能较SuperLU 求解器平均加速32.2倍,在基础硬件配置下实现了平均 9.6 倍性能加速,大幅压缩了科学计算的时间成本。
目前,相关研究成果已发表于 CCF B 类国际会议 Euro-Par 2025,其核心技术已申请中国发明专利并获得授权。此次成果是鲲鹏平台在科学计算领域的典型实践,该方法对于现代高性能处理器上稀疏计算问题的高效求解、充分地发挥处理器上的矩阵运算单元具有很好的应用价值。未来,随着鲲鹏生态的持续完善,其在高性能计算领域的赋能作用将进一步凸显,助力更多科研团队突破技术难关,推动科研成果加速落地转化。
相关文章
- 鲲鹏昇腾开发者大会2026:携手开发者共筑Agentic AI时代算力底座
- 软硬一体,全栈赋能,慧博云通与宝德计算精彩亮相鲲鹏昇腾开发者大会2026
- 招投标垂直AI软件「云境标书AI」荣获华为鲲鹏双项技术认证
- 心怀挚爱,共绽光芒——鲲鹏昇腾开发者大会2026即将启幕
- 鲲鹏聚力 智造新生|摩尔元数工业软件标杆亮相2026数字中国峰会
- 鲲鹏筑基 智领低空|“福智巡”亮相 2026 数字中国峰会,打造国产化治理标杆
- 破解Agent场景落地难题!拓维信息旗下湘江鲲鹏重磅推出OpenClaw部署新范式
- 鲲鹏+凌川科技SL200,用极致算力为互联网视频产业带来质变
- 鲲鹏 为更先进的数智世界而计算——李义在鲲鹏伙伴峰会2026上的主题发言
- 华为马海旭:鲲鹏携手伙伴,启航Agentic AI新纪元
- TGO 鲲鹏会入选杭州 AI “五小凤”,科技领导者社区获官方认可
- 浦发银行近1.6亿鲲鹏芯片服务器项目落定,神州鲲泰品牌产品中标!
- 京东广告、京东云与华为鲲鹏达成深度技术合作 共谱广告模型性能优化新篇章
- 巅峰对决松山湖!鲲鹏昇腾创新大赛全国总决赛2025圆满落幕
- 以创新赴约,为未来赋能!鲲鹏昇腾创新大赛2025全国总决赛即将开赛
- 依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









