OpenAI上线首款AI智能体Operator: 能操控电脑,像人类一样浏览网页
2025-01-24 10:50:54AI云资讯248433

(AI云资讯消息)OpenAI 发布了一款名为Operator的AI智能体的研究预览版。OpenAI 表示,“它能够上网自动为用户执行任务,它使用自己的浏览器,可以查看网页,并通过打字、点击和滚动与网页进行交互。”该服务首先在美国推出,面向OpenAI每月200美元的ChatGPT Pro订阅用户。

据OpenAI介绍,Operator依赖于一个使用计算机的代理模型,该模型结合了GPT-4o的视觉能力与通过强化学习实现的高级推理,使其能够与图形用户界面(GUI)进行交互。OpenAI还表示,“Operator可以看见(通过截屏)和互动(使用鼠标和键盘允许的所有动作)浏览器,使其能够在没有自定义API集成的情况下,在网络上执行操作。”

Operator能够使用推理进行自我纠正,如果它遇到困难,将会把控制权交给用户。当网站要求输入敏感信息如登录凭证时,它也会请求用户接管,并且在执行发送电子邮件等操作前请求用户批准。OpenAI还表示,Operator被设计为能够拒绝有害请求并阻止不允许的内容。

OpenAI表示,他们正在与DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber等公司合作,以确保Operator在尊重既定规范的同时满足现实世界的需求。但OpenAI也提醒道,并非所有功能都能如预期那样工作;目前该工具在处理如创建幻灯片或管理日历等复杂界面时仍存在问题。
未来,OpenAI计划将Operator带给Plus、Team和Enterprise用户,并把这些功能集成到ChatGPT中。
相关文章
- OpenAI的Codex已集成到ChatGPT移动应用程序中
- 奥尔特曼称,马斯克离开OpenAI提振了公司的士气
- OpenAI 新模型密集更新,Meta/微美全息强化布局AI核心需求迎爆发增长!
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- ChatGPT下载量放缓,或将影响OpenAI的首次公开募股
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- OpenAI正式发布GPT-5.5模型,编程能力大幅增强
- OpenAI Sora团队负责人比尔·皮布尔斯即将离职
- OpenAI对Codex进行大更新,直接瞄准了Claude Code
- OpenAI疲于应对公众争议、战略调整以及日益激烈的竞争的局面
- OpenAI收购科技播客节目TBPN,进入媒体赛道
- 大英百科全书起诉OpenAI,指控ChatGPT输出的内容与其几乎完全相同
- OpenAI新模型发布,Meta/微美全息以AI芯片+模型布局加速行业创新进程
- OpenAI发布GPT-5.4模型:具备原生计算机使用能力,能够在各类应用中执行任务
- OpenAI宣布获得亚马逊、英伟达和软银新融资1100亿美元
- OpenAI首次采用Cerebras的AI芯片运行Codex模型,成功实现了每秒1000次事务处理量
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









