海光DCU完成与GLM-5.2极速适配,长程任务国产底座就绪

2026-06-17 19:24:32AI云资讯1356

智谱新一代开源大模型GLM-5.2发布之际,海光DCU同步完成全流程适配与性能验证,实现“发布即支持”。
此次适配的核心在于对GLM-5.2 Solid 1M无损上下文的深度优化。长上下文模型在实际部署中普遍面临算力带宽与显存管理的瓶颈,导致性能随序列长度增加而衰减。海光DCU通过内存调度机制优化与IndexShare架构适配,将1M上下文下单位Token的运算消耗显著降低,使模型在处理88万tokens级别的长程任务时保持稳定输出。
双方后续将持续推进深度适配,围绕长程任务与代码能力展开更多场景化验证,进一步降低大模型在国产算力平台上的部署门槛。

相关文章

人工智能企业

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>

人工智能技术

更多>>
AI云资讯(爱云资讯)立足人工智能科技,打造有深度、有前瞻、有影响力的泛科技信息平台。
合作QQ:1211461360微信号:icloudnews