OpenAI上线首款AI智能体Operator: 能操控电脑,像人类一样浏览网页
2025-01-24 10:50:54爱云资讯82762
(爱云资讯消息)OpenAI 发布了一款名为Operator的AI智能体的研究预览版。OpenAI 表示,“它能够上网自动为用户执行任务,它使用自己的浏览器,可以查看网页,并通过打字、点击和滚动与网页进行交互。”该服务首先在美国推出,面向OpenAI每月200美元的ChatGPT Pro订阅用户。
据OpenAI介绍,Operator依赖于一个使用计算机的代理模型,该模型结合了GPT-4o的视觉能力与通过强化学习实现的高级推理,使其能够与图形用户界面(GUI)进行交互。OpenAI还表示,“Operator可以看见(通过截屏)和互动(使用鼠标和键盘允许的所有动作)浏览器,使其能够在没有自定义API集成的情况下,在网络上执行操作。”
Operator能够使用推理进行自我纠正,如果它遇到困难,将会把控制权交给用户。当网站要求输入敏感信息如登录凭证时,它也会请求用户接管,并且在执行发送电子邮件等操作前请求用户批准。OpenAI还表示,Operator被设计为能够拒绝有害请求并阻止不允许的内容。
OpenAI表示,他们正在与DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber等公司合作,以确保Operator在尊重既定规范的同时满足现实世界的需求。但OpenAI也提醒道,并非所有功能都能如预期那样工作;目前该工具在处理如创建幻灯片或管理日历等复杂界面时仍存在问题。
未来,OpenAI计划将Operator带给Plus、Team和Enterprise用户,并把这些功能集成到ChatGPT中。
相关文章
- OpenAI上线首款AI智能体Operator: 能操控电脑,像人类一样浏览网页
- AI大模型群雄争霸白热化,OpenAI/英伟达/微美全息商业化战略日渐明朗
- OpenAI宣布桌面版ChatGPT推出应用协作功能,编程能力得到增强
- OpenAI将通过API向特定的开发者发布完整的o1推理模型
- OpenAI宣布向所有用户开放ChatGPT人工智能搜索功能
- 抢先OpenAI Sora谷歌新推Veo模型,亚马逊/微美全息加入AI视频生成竞赛引关注
- OpenAI正式推出AI视频生成模型Sora 可生成长达20秒的视频
- OpenAI CEO:2025年将看到首个AGI案例 颠覆性将远超预期
- OpenAI发布o1模型完整版和“顶配版”ChatGPT Pro
- OpenAI启动为期12天shipmas活动,期间将上线Sora和新的推理模型
- OpenAI与国防技术公司Anduril合作,将AI技术集成到反无人机系统中
- OpenAI计划于2025年1月推出新型智能体Operator
- OpenAI正式推出ChatGPT搜索功能,微美全息乘AI浪潮培育生产力驱动业务革新
- OpenAI重启机器人团队 增强现实眼镜前负责人将加盟
- 模型能力比肩OpenAI-o1 夸克全新“AI搜题”让新题、难题都有解
- ChaGPT网页搜索引擎上线 OpenAI挑战谷歌