海光DCU完成与GLM-5.2极速适配,长程任务国产底座就绪
2026-06-17 19:24:32AI云资讯1356
智谱新一代开源大模型GLM-5.2发布之际,海光DCU同步完成全流程适配与性能验证,实现“发布即支持”。
此次适配的核心在于对GLM-5.2 Solid 1M无损上下文的深度优化。长上下文模型在实际部署中普遍面临算力带宽与显存管理的瓶颈,导致性能随序列长度增加而衰减。海光DCU通过内存调度机制优化与IndexShare架构适配,将1M上下文下单位Token的运算消耗显著降低,使模型在处理88万tokens级别的长程任务时保持稳定输出。
双方后续将持续推进深度适配,围绕长程任务与代码能力展开更多场景化验证,进一步降低大模型在国产算力平台上的部署门槛。
此次适配的核心在于对GLM-5.2 Solid 1M无损上下文的深度优化。长上下文模型在实际部署中普遍面临算力带宽与显存管理的瓶颈,导致性能随序列长度增加而衰减。海光DCU通过内存调度机制优化与IndexShare架构适配,将1M上下文下单位Token的运算消耗显著降低,使模型在处理88万tokens级别的长程任务时保持稳定输出。
双方后续将持续推进深度适配,围绕长程任务与代码能力展开更多场景化验证,进一步降低大模型在国产算力平台上的部署门槛。
相关文章
- AI硅光互连公司:海光芯正即将登陆港股
- 稀缺全栈硅光标的来袭!海光芯正冲刺港股IPO
- AI角逐重安全,海光自研C86筑牢机密算力
- 数字地球迈向智能时代 海光信息释放国产算力新价值
- AI内卷拼安全,海光自研C86锁死机密算力
- 电科金仓携手四川省人民医院、海光信息、新华三、曙光云共建医疗人工智能应用创新中心
- 智源FlagOS×海光信息完成 MiniCPM5 Day0适配,效率追平NVIDIA原生
- 2026内生安全技术论坛:海光信息携手多方构建AI“天生安全”
- 海光DCU完成腾讯混元Hy3 preview适配
- 海光DCU全面适配腾讯混元Hy3 preview!
- 海光信息亮相数字中国峰会 以硬件内生安全构筑AI算力防护体系
- 海光DCU首批完成商汤SenseNova U1极速适配
- 亮相第 87 届教装展 ,海光 C86 点亮 “AI+教育” 新生态
- 全链协同 一体交付:海光服务器以一体化交付模式,重新定义国产算力交付速度
- 净利润飙涨74.86%!海光多项业绩指标暗藏利好
- 海光信息参编《超节点技术体系白皮书》,以“全对等互联+总线型协议”赋能算力生态
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









