OpenAI上线首款AI智能体Operator: 能操控电脑,像人类一样浏览网页
2025-01-24 10:50:54AI云资讯247901
(AI云资讯消息)OpenAI 发布了一款名为Operator的AI智能体的研究预览版。OpenAI 表示,“它能够上网自动为用户执行任务,它使用自己的浏览器,可以查看网页,并通过打字、点击和滚动与网页进行交互。”该服务首先在美国推出,面向OpenAI每月200美元的ChatGPT Pro订阅用户。
据OpenAI介绍,Operator依赖于一个使用计算机的代理模型,该模型结合了GPT-4o的视觉能力与通过强化学习实现的高级推理,使其能够与图形用户界面(GUI)进行交互。OpenAI还表示,“Operator可以看见(通过截屏)和互动(使用鼠标和键盘允许的所有动作)浏览器,使其能够在没有自定义API集成的情况下,在网络上执行操作。”
Operator能够使用推理进行自我纠正,如果它遇到困难,将会把控制权交给用户。当网站要求输入敏感信息如登录凭证时,它也会请求用户接管,并且在执行发送电子邮件等操作前请求用户批准。OpenAI还表示,Operator被设计为能够拒绝有害请求并阻止不允许的内容。
OpenAI表示,他们正在与DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber等公司合作,以确保Operator在尊重既定规范的同时满足现实世界的需求。但OpenAI也提醒道,并非所有功能都能如预期那样工作;目前该工具在处理如创建幻灯片或管理日历等复杂界面时仍存在问题。
未来,OpenAI计划将Operator带给Plus、Team和Enterprise用户,并把这些功能集成到ChatGPT中。
相关文章
- 微软与OpenAI达成新协议,或为OpenAI上市铺平道路
- 甲骨文与OpenAI达成3000亿美元“星际之门”项目协议 或将重塑云计算与人工智能未来
- OpenAI携AI动画电影《Critterz》进军好莱坞
- 声网兄弟公司 Agora与OpenAI 携手 助力多模态 AI 智能体实现实时交互
- OpenAI或于2026年推出自研AI芯片
- 马斯克起诉OpenAI和苹果公司,指控ChatGPT和苹果应用商店非法垄断
- OpenAI对盈利模式持开放态度 ChatGPT负责人称不排除未来加入广告
- OpenAI奥尔特曼支持脑机接口公司MergeLabs,致力于实现人机智能融合
- OpenAI现场演示翻车?GPT-5发布会现神图,奥尔特曼自嘲:图表重大失误
- OpenAI推出GPT-5,奥尔特曼盛赞为写作、编程及人类级推理的最佳模型
- OpenAI发布开放权重人工智能模型:采用Apache 2.0开源协议,支持本地运行
- 生鲜电商Instacart首席执行官将于8月18日正式开始执掌OpenAI核心业务
- 耗资5000亿美元的星际之门项目因OpenAI与软银内部分歧而陷入僵局
- 领先OpenAI三个月,百度文库GenFlow支持自主调用数百Agent、多模内容并行生成,2.0版本8月上线
- OpenAI推出新款ChatGPT智能体可以操控整台电脑并完成任务
- 被Meta高薪挖角后,OpenAI拟重审薪酬体系