Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验
2025-06-03 16:37:55AI云资讯1968
Arm KleidiAI与ONNX Runtime的集成,为Windows和安卓操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而加速应用体验。
联合作者:Arm终端事业部产品管理总监Ronan Naughton
微软AI框架首席软件工程经理George Wu
随着人工智能(AI)成为当今个人电脑(PC)和移动设备使用体验(从聊天机器人到生产力提升)中不可或缺的一部分,这些设备对CPU高效、可扩展的推理需求也在持续增长。Arm与微软正携手合作以满足这一需求,在从高端台式电脑和笔记本电脑到旗舰级和入门级智能手机等各类广泛的消费类电子设备上,为用户带来加速的AI体验。
Arm和微软共同将Arm KleidiAI进一步扩展到ONNX Runtime(业界广泛使用的开源AI运行时之一)中。KleidiAI是一款面向AI框架开发者的轻量级内核库,它能够在无可比拟的规模下,为广泛的技术市场以及各类基于Arm架构的设备,提供AI模型和工作负载的无缝性能优化。鉴于KleidiAI已成功集成到其他领先的AI框架上,这次的合作是在此成功基础上的又一重要进展。
加速边缘设备上的AI体验
Windows on Arm生态系统在过去几年实现了显著的增长。包括Adobe Photoshop、Google Chrome、Spotify和Zoom等广受欢迎的应用程序,都纷纷推出了Arm原生版本,以充分发挥其性能和能效优势。通过将KleidiAI集成到ONNX Runtime中,广大的应用程序开发者无需额外投入工程时间,就能获得PC和移动设备的AI性能提升。ONNX Runtime为微软诸多产品的AI工作负载提供支持,包括Microsoft 365套件以及Microsoft Copilot等,并为Copilot+PC打造卓越的AI体验。
KleidiAI与ONNX Runtime的集成优化了包含Phi-3 Mini等一系列模型在内的AI工作负载。Phi-3 Mini是一个拥有38亿参数的小型语言模型,专为边缘设备的先进AI体验量身定制。这些AI体验包括实时聊天机器人、虚拟助手、智能文本补全以及生产力工具的功能增强等,所有这些功能均可在设备本地实现。通过将Phi-3 Mini紧凑的结构与KleidiAI高效的CPU执行提供程序(Execution Provider)集成配对,开发者无需依赖云端连接,即可在设备上快速实现智能功能。
提升PC和移动设备上的实际AI性能
在PC和移动平台上,该集成已为终端用户带来了切实的益处。它显著加快了AI的响应速度,使设备能够直接实现更智能、更快速的交互,且无需开发者进行架构改动或后端重写。
根据Arm的基准测试显示,在KleidiAI集成到ONNX Runtime后,系统性能得到了显著的提升,包括在基于Armv9平台的Windows设备上运行Phi-3模型时,提示处理吞吐量提升了2.4倍,词元(token)生成速度加快了12%。这些性能改进使聊天机器人等AI应用能够给出更加自然流畅的回应。同样地,在搭载最新Armv9 CPU的vivo X200 Pro旗舰智能手机上运行相同Phi-3模型的参考安卓应用中,提示处理速度加快了2.6倍。
由于KleidiAI的集成运行在全球应用广泛的Arm CPU架构上,这使得AI应用与工作负载能够在不同的生态系统及芯片组之间无缝移植。KleidiAI的设计旨在与当前的Arm架构特性,如Neon、可伸缩矢量扩展(SVE2)及可伸缩矩阵扩展(SME),展开协同工作。这些面向未来的功能确保开发者能够构建当下的AI增强体验,并使其随着未来的硬件创新而扩展。KleidiAI与ONNX Runtime的集成已在ONNX RT V1.22中发布。
推动AI规模化落地
Arm与微软的合作为开发者普及优化AI迈出了变革性的一步。该合作简化了在各类PC和移动设备上部署智能功能的流程,无需增加成本或开发工作量,同时为终端用户带来加速的AI体验。随着AI的持续演进,这些优化工作将确保开发者、OEM厂商和操作系统提供商拥有出色的性能、灵活性和广泛的覆盖范围,为更多用户带来更优质、更智能的体验。
访问以下学习路径,了解KleidiAI与ONNX Runtime集成的更多信息:
·在基于Arm的Windows设备上,通过ONNX Runtime运行Phi-3模型
·使用ONNX Runtime API构建安卓聊天应用
+++
相关文章
- Arm宣布推出Performix,为开发者带来AI时代必备的可扩展性能
- OpenHarmony亮相数字中国建设峰会展区 生态创新成果引关注
- 鸿蒙生态亮相数字中国峰会 全域使能推动OpenHarmony生态全面提速
- HarmonyOS 6.1适配机型全面公布 鸿蒙生态迈入好用易用新阶段
- 华为Pura双旗舰登场,首发HarmonyOS 6.1与伴随式AI,鸿蒙越用越爱用
- 百余名开发者齐聚2026首场HDD,共探HarmonyOS全场景互联新路径
- 玲珑·视界 | 安谋科技Arm China “玲珑”VPU IP新品科技大秀闪耀沪上
- 华为畅享90系列发布,首次搭载HarmonyOS 6,鸿蒙完成全机型覆盖
- 高德地图携手HarmonyOS SDK首发鸿蒙AR实景步导
- 授权费延后支付、无限次流片权益,Arm Flexible Access的“经济账”怎么算?
- 强强联手!安谋科技Arm China与香港科技大学合作,加码AI前沿技术
- 从视频创作到分屏效率,HarmonyOS 6新版本再聚焦核心场景升级
- 钉钉开源HarmonyOS图片编辑组件:四大核心功能直击图片编辑痛点
- HarmonyOS 6多屏协同:把手机和电脑“在一起用”,是真的香
- 携手鸿蒙生态深度共创!高德推出出行行业首个HarmonyOS司乘同显司机端SDK
- HarmonyOS SDK携手Remy让普通手机即可完成专业级3D空间重建
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









