Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验
2025-06-03 16:37:55AI云资讯1752
Arm KleidiAI与ONNX Runtime的集成,为Windows和安卓操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而加速应用体验。
联合作者:Arm终端事业部产品管理总监Ronan Naughton
微软AI框架首席软件工程经理George Wu
随着人工智能(AI)成为当今个人电脑(PC)和移动设备使用体验(从聊天机器人到生产力提升)中不可或缺的一部分,这些设备对CPU高效、可扩展的推理需求也在持续增长。Arm与微软正携手合作以满足这一需求,在从高端台式电脑和笔记本电脑到旗舰级和入门级智能手机等各类广泛的消费类电子设备上,为用户带来加速的AI体验。
Arm和微软共同将Arm KleidiAI进一步扩展到ONNX Runtime(业界广泛使用的开源AI运行时之一)中。KleidiAI是一款面向AI框架开发者的轻量级内核库,它能够在无可比拟的规模下,为广泛的技术市场以及各类基于Arm架构的设备,提供AI模型和工作负载的无缝性能优化。鉴于KleidiAI已成功集成到其他领先的AI框架上,这次的合作是在此成功基础上的又一重要进展。
加速边缘设备上的AI体验
Windows on Arm生态系统在过去几年实现了显著的增长。包括Adobe Photoshop、Google Chrome、Spotify和Zoom等广受欢迎的应用程序,都纷纷推出了Arm原生版本,以充分发挥其性能和能效优势。通过将KleidiAI集成到ONNX Runtime中,广大的应用程序开发者无需额外投入工程时间,就能获得PC和移动设备的AI性能提升。ONNX Runtime为微软诸多产品的AI工作负载提供支持,包括Microsoft 365套件以及Microsoft Copilot等,并为Copilot+PC打造卓越的AI体验。
KleidiAI与ONNX Runtime的集成优化了包含Phi-3 Mini等一系列模型在内的AI工作负载。Phi-3 Mini是一个拥有38亿参数的小型语言模型,专为边缘设备的先进AI体验量身定制。这些AI体验包括实时聊天机器人、虚拟助手、智能文本补全以及生产力工具的功能增强等,所有这些功能均可在设备本地实现。通过将Phi-3 Mini紧凑的结构与KleidiAI高效的CPU执行提供程序(Execution Provider)集成配对,开发者无需依赖云端连接,即可在设备上快速实现智能功能。
提升PC和移动设备上的实际AI性能
在PC和移动平台上,该集成已为终端用户带来了切实的益处。它显著加快了AI的响应速度,使设备能够直接实现更智能、更快速的交互,且无需开发者进行架构改动或后端重写。
根据Arm的基准测试显示,在KleidiAI集成到ONNX Runtime后,系统性能得到了显著的提升,包括在基于Armv9平台的Windows设备上运行Phi-3模型时,提示处理吞吐量提升了2.4倍,词元(token)生成速度加快了12%。这些性能改进使聊天机器人等AI应用能够给出更加自然流畅的回应。同样地,在搭载最新Armv9 CPU的vivo X200 Pro旗舰智能手机上运行相同Phi-3模型的参考安卓应用中,提示处理速度加快了2.6倍。
由于KleidiAI的集成运行在全球应用广泛的Arm CPU架构上,这使得AI应用与工作负载能够在不同的生态系统及芯片组之间无缝移植。KleidiAI的设计旨在与当前的Arm架构特性,如Neon、可伸缩矢量扩展(SVE2)及可伸缩矩阵扩展(SME),展开协同工作。这些面向未来的功能确保开发者能够构建当下的AI增强体验,并使其随着未来的硬件创新而扩展。KleidiAI与ONNX Runtime的集成已在ONNX RT V1.22中发布。
推动AI规模化落地
Arm与微软的合作为开发者普及优化AI迈出了变革性的一步。该合作简化了在各类PC和移动设备上部署智能功能的流程,无需增加成本或开发工作量,同时为终端用户带来加速的AI体验。随着AI的持续演进,这些优化工作将确保开发者、OEM厂商和操作系统提供商拥有出色的性能、灵活性和广泛的覆盖范围,为更多用户带来更优质、更智能的体验。
访问以下学习路径,了解KleidiAI与ONNX Runtime集成的更多信息:
·在基于Arm的Windows设备上,通过ONNX Runtime运行Phi-3模型
·使用ONNX Runtime API构建安卓聊天应用
+++
相关文章
- 强强联手!安谋科技Arm China与香港科技大学合作,加码AI前沿技术
- 从视频创作到分屏效率,HarmonyOS 6新版本再聚焦核心场景升级
- 钉钉开源HarmonyOS图片编辑组件:四大核心功能直击图片编辑痛点
- HarmonyOS 6多屏协同:把手机和电脑“在一起用”,是真的香
- 携手鸿蒙生态深度共创!高德推出出行行业首个HarmonyOS司乘同显司机端SDK
- HarmonyOS SDK携手Remy让普通手机即可完成专业级3D空间重建
- 共筑HarmonyOS人才基座 数千布道师按下培养“加速键”
- 搭载HarmonyOS 6.0,开启新篇章:HUAWEI WATCH 十周年款正式发布
- 联合珐玛Pharma United 洁净门产品介绍
- 联合珐玛(Pharma United)提供GMP 模块化洁净室解决方案
- 鸿蒙“朋友圈”上新!这些应用在HarmonyOS 6上玩出了新花样
- 锚定AI+半导体,安谋科技Arm China在港首个芯片IP研发中心2026年落地
- 无感支付、便捷出行,云闪付携手HarmonyOS 6带来独家惊喜
- 告别“静止”桌面!HarmonyOS 6互动卡片:会动、会玩、会破框的桌面伙伴
- 华为擎云成功举办HarmonyOS 6 MDM交流会,加速鸿蒙生态商用布局
- 华为Mate 80系列首发搭载HarmonyOS 6,店铺级定位让设备找寻更高效
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









