智源FlagOS×海光信息完成 MiniCPM5 Day0适配,效率追平NVIDIA原生
2026-05-27 14:49:51AI云资讯1942
近日,面壁智能正式发布并开源新一代端侧文本基座大模型MiniCPM5-1B。海光信息联合智源研究院众智FlagOS社区,依托FlagOS统一多芯片软件栈,第一时间完成该模型的适配与推理部署,实现“发布即支持”。海光DCU在所有测试场景下首Token延迟(TTFT)全面低于NVIDIA H20原生基线,用极致效率达成从云到端的国产算力生态覆盖。

MiniCPM5-1B以仅1B参数规模,在AA-Index权威榜单上取得17.9的高分,超越Qwen3.5-2B(16.3)等全部 4B 以下开源基座模型,展现出端侧模型少有的语言理解与推理能力。众智FlagOS社区基于vLLM-plugin-FL推理插件和底层算子库 FlagGems,快速打通MiniCPM5-1B在多款AI芯片上的推理链路。海光DCU依托FlagOS统一软件栈,无需修改业务代码即完成推理优化,真正做到了模型开源的当天同步可用。
首Token响应全面领先,交互体验突破
TTFT是衡量大模型交互响应速度的核心指标,数值越低,用户获得首次反馈的等待时间越短。经实测,海光DCU在多种并发、上下文长度等严苛场景下,TTFT全面低于NVIDIAH20原生部署基线。这意味着在智能客服、实时翻译、端侧助理等对响应速度敏感的应用中,海光平台可为用户带来更流畅、即时的智能体验,效率追平甚至超越业界主流。
此前,海光DCU已成功支撑DeepSeek系列等千亿级云端大模型的高效推理,如今又实现对1B级端侧模型的Day0适配。这一“云+端”全场景覆盖能力,证明了海光DCU与FlagOS统一软件栈的灵活性与可扩展性,无论大规模数据中心还是轻量化边缘设备,都能获得一致的开发体验与高能效算力。
极简部署,生态开放
开发者现可通过FlagOS社区获取相关推理插件与模型镜像,以极低迁移成本在海光平台上快速部署MiniCPM5-1B。底层优化自动生效,完全兼容原生接口及工具链,大幅缩短从开发到上线的周期。
本次MiniCPM5-1B的闪电适配,是海光信息、众智FlagOS社区与面壁智能紧密协作的又一成果,标志着国产AI芯片在端侧大模型领域已具备与国际主流产品同台竞技的能力。海光将持续参与异构算力协同建设,以高效、安全、可控的算力底座,加速大模型在千行百业的规模化落地。
相关文章
- 智源FlagOS×海光信息完成 MiniCPM5 Day0适配,效率追平NVIDIA原生
- 2026内生安全技术论坛:海光信息携手多方构建AI“天生安全”
- 海光信息亮相数字中国峰会 以硬件内生安全构筑AI算力防护体系
- 海光信息参编《超节点技术体系白皮书》,以“全对等互联+总线型协议”赋能算力生态
- 湖南电信与海光信息全面深化数智生态合作
- 同济大学 × 海光信息:筑牢高校大模型安全运行底座
- 天翼云携手海光信息正式推出新一代国产化机密计算云主机
- 信安世纪联合海光信息成立AI密算联合实验室,以“密码+算力”融合夯实AI安全底座
- 海光信息吴宗友:下一个十年将在开放产业生态上下苦功夫
- 十年铸芯,海光信息高质量发展获多项殊荣
- 2024世界计算大会召开,海光信息赋能“芯”质生产力
- 海光信息注重创新驱动,加大研发投入力度
- 海光信息在技术研发方面进展如何?
- 安恒信息携手海光信息联合推出安全岛隐私计算一体机
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









