谷歌DeepMind的新型AI模型可通过网络搜索帮助机器人完成任务
2025-09-26 05:59:11AI云资讯1497
(AI云资讯消息)谷歌DeepMind表示,其升级后的人工智能模型使机器人能够完成更复杂的任务,甚至能借助互联网寻求帮助。谷歌DeepMind机器人技术负责人卡罗莱娜·帕拉达(Carolina Parada)表示,该公司的新AI模型可协同工作,让机器人在物理世界采取行动前能够提前规划多个步骤。
该系统由新发布的Gemini Robotics 1.5及具身推理模型Gemini Robotics-ER 1.5驱动,这些是谷歌DeepMind 3月份推出的AI模型的升级版本。如今机器人不仅能完成折纸或拉开包链的单一任务,还能实现按深浅色分类洗衣、根据伦敦实时天气整理行李箱、甚至通过针对当地规定的网络搜索来协助人们分类垃圾、堆肥物和可回收物等复杂操作。
帕拉达表示:"此前发布的模型能够以非常通用的方式,每次精准执行单一指令。而通过此次升级,我们正从单一指令执行迈向对实体任务的真正理解与问题解决。"
首先,机器人利用升级后的Gemini Robotics-ER 1.5模型感知周围环境,并通过谷歌搜索等数字工具获取更多信息。随后,Gemini Robotics-ER 1.5会将检索结果转化为自然语言指令传递给Gemini Robotics 1.5模型,使机器人能够借助该模型的视觉与语言理解能力逐步执行任务。
此外,谷歌DeepMind宣布,Gemini Robotics 1.5能帮助不同配置的机器人实现相互学习。研究发现,面向ALOHA2双机械臂机器人训练的任务,可直接应用于双臂Franka机器人及Apptronik的人形机器人Apollo。谷歌DeepMind软件工程师卡尼什卡·拉奥(Kanishka Rao)在发布会上表示:"我们实现了两大突破:一是能用单一模型控制包括人形机器人在内的多种机器人;二是某台机器人习得的技能现在可以迁移至其他机器人。"
谷歌DeepMind已通过Google AI Studio中的Gemini API向开发者开放Gemini Robotics-ER 1.5模型,而Gemini Robotics 1.5目前仅限特定合作伙伴访问。
相关文章
- 谷歌新款Windows桌面应用为PC端带来类苹果Spotlight搜索栏
- 谷歌Waymo获准在旧金山提供机场接送服务
- 谷歌公布Gemini使用权限
- 苹果为Siri开发的AI搜索工具或将利用谷歌的Gemini AI模型来汇总网络信息
- 谷歌已完成AI眼镜开发,或由HTC代工量产
- 告别短信验证码:谷歌测试二维码验证技术,让短信更安全
- 苹果与谷歌洽谈使用Gemini AI模型改造Siri
- 谷歌Gemini人工智能推出全新引导学习模式
- 谷歌搜索的AI模式升级,新增作业识别功能
- 谷歌CEO桑达尔·皮查伊表示,人工智能对谷歌每个领域的业务都产生了积极影响
- 谷歌持续加码人工智能领域导致碳排放量再次攀升 较2019年激增51%
- 谷歌发布新一代AR眼镜 立讯精密深度赋能
- “5G核心网络即服务”时代来临:爱立信携手谷歌云共谱AI新篇章
- 云从科技超越谷歌、OpenAI问鼎全球多模态榜单 中国自研AI实现历史性突破
- 谷歌与大朋VR 聚焦AI 眼镜赛道,技术布局凸显行业新方向
- 苹果推进智能眼镜暗战谷歌,Meta/微美全息深耕AR赛道抢占XR市场新机遇