企业级AI的未来:IBM实现通用型企业级AI智能体的重大突破

2025-07-21 15:39:40爱云资讯1538

在AI发展日新月异的今天,AI智能体无疑正处在技术前沿。近日,IBM发布了通用型企业级AI智能体(IBM Computer Using Generalist Agent,此后简称IBM CUGA)的重要突破,引发业界广泛关注。继 Think 2025大会上发布AI 智能体平台watsonx Orchestrate后,IBM研究院在企业级智能体领域再次迈出了实质性的一大步。

如今,IBM CUGA不仅在模拟企业场景中经受住了严苛测试,更在最新(2025年7月)的AppWorld Benchmark中荣登第一(注:AppWorld Benchmark 是一个由多个研究机构和学者共同创建、用于评估交互式编程智能体的基准测试环境)。在不久的未来,我们或许能看到AI 智能体逐步从“实验室玩具”迈向“企业核心助手”。

通用型企业级AI智能体是什么?为何重要?

传统AI智能体在企业应用中多是“单一功能专家”——比如处理发票、生成邮件、跟踪销售进度等。这些功能虽然实用,但面对跨流程、跨系统、跨业务的复杂场景时,往往会显得力不从心。

IBM CUGA 正是为复杂业务场景而生。它是一种能够跨多个业务场景、整合多种工具、执行复杂任务的通用型智能体,可以像资深员工一样理解用户意图、规划任务、调用工具、协调多个系统,并不断学习和适应新的挑战。

荣耀背后,是技术进阶和厚积薄发

IBM CUGA的出现并不是一蹴而就的,它是架构进化、方法创新和工具集成的系统性成果:

·架构演进:从最初简单的“计划-执行-观察”模型(完成率15%),进化到如今能协调多个子智能体、感知网页环境、处理复杂任务的多层级系统,任务完成率提升到 61.7% 甚至更高

·工具赋能

·实时性能仪表盘,掌握每一个智能体动作的效果;

·轨迹可视化工具,直观诊断失败原因;

·并行执行框架,将评估速度从数天压缩到数分钟。

·多智能体协作:一个任务由多个“子任务智能体”协同完成。比如,规划、执行、信息提取各司其职,让智能体能像团队一样作战。

·环境感知增强:结合网页截图和可访问性树,智能体看得更清、操作更准,还能识别弹窗等障碍进行规避。

安全、可信、可控的智能体平台,打造适配业务需求的AI智能体

IBM不仅关注智能体的“聪明程度”,更重视它的“企业适配能力”。借助最新发布的企业级AI 智能体平台watsonx Orchestrate,客户有望实现:

·全生命周期可观测性,兼顾性能监控、模型优化、安全防护;

·无代码与专业工具并存,既支持业务人员快速部署,也支持开发者深度定制;

·兼容超过80种企业级系统,与Adobe、SAP、Salesforce、ServiceNow等生态无缝集成;

·治理与合规,为隐私、安全、成本可控提供保障,帮助企业实现AI治理与合规。

真正的“企业AI助手正在加速来到

除了在AppWorld基准测试夺魁,IBM CUGA还在WebArena等真实浏览器任务中展现强大能力。通过“智能采样”、“反馈反射”、“知识注入”等一系列创新方法,CUGA每一次迭代都更接近企业级实用标准

IBM CUGA不是实验室的“炫技”,而是指向未来企业运营方式的变革。在准确率达到更高门槛后,CUGA有望成为企业内部的通用调度平台——不再是被动响应用户指令,而是主动协助完成复杂的工作任务,例如跨系统的数据整合、文档生成、流程管理等。

团队心声

“CUGA的成功,不是因为某一个神奇的模型,而是靠IBM团队对创新的执着、对真实企业需求的深刻理解。感谢每一位参与其中的工程师、研究员和产品经理。”(作者:吴敏达,IBM科技事业部数据与人工智能资深技术专家)

作者简介:吴敏达是 The Open Group 卓越级技术专家(Distinguished Technical Specialist),同时拥有计算机技术与软件专业系统架构设计师技术资格。他现在是 IBM 科技事业部数据与人工智能资深技术专家,拥有 20 多年数据分析软件相关技术经验,是 IBM 认证的大数据架构师和 Watson 开发者,专长是大数据、人工智能等领域。他是 IBM Developer 的大师级作者,已经发表了 40 余篇技术文章和教程。现从事大数据、人工智能相关技术支持和架构设计工作。

相关文章

人工智能技术

更多>>

人工智能公司

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>
关于我们|联系我们|免责声明|会展频道

冀ICP备2022007386号-1 冀公网安备 13108202000871号

爱云资讯 Copyright©2018-2024