谷歌DeepMind的新型AI模型可通过网络搜索帮助机器人完成任务
2025-09-26 05:59:11AI云资讯3913

(AI云资讯消息)谷歌DeepMind表示,其升级后的人工智能模型使机器人能够完成更复杂的任务,甚至能借助互联网寻求帮助。谷歌DeepMind机器人技术负责人卡罗莱娜·帕拉达(Carolina Parada)表示,该公司的新AI模型可协同工作,让机器人在物理世界采取行动前能够提前规划多个步骤。
该系统由新发布的Gemini Robotics 1.5及具身推理模型Gemini Robotics-ER 1.5驱动,这些是谷歌DeepMind 3月份推出的AI模型的升级版本。如今机器人不仅能完成折纸或拉开包链的单一任务,还能实现按深浅色分类洗衣、根据伦敦实时天气整理行李箱、甚至通过针对当地规定的网络搜索来协助人们分类垃圾、堆肥物和可回收物等复杂操作。
帕拉达表示:"此前发布的模型能够以非常通用的方式,每次精准执行单一指令。而通过此次升级,我们正从单一指令执行迈向对实体任务的真正理解与问题解决。"
首先,机器人利用升级后的Gemini Robotics-ER 1.5模型感知周围环境,并通过谷歌搜索等数字工具获取更多信息。随后,Gemini Robotics-ER 1.5会将检索结果转化为自然语言指令传递给Gemini Robotics 1.5模型,使机器人能够借助该模型的视觉与语言理解能力逐步执行任务。

此外,谷歌DeepMind宣布,Gemini Robotics 1.5能帮助不同配置的机器人实现相互学习。研究发现,面向ALOHA2双机械臂机器人训练的任务,可直接应用于双臂Franka机器人及Apptronik的人形机器人Apollo。谷歌DeepMind软件工程师卡尼什卡·拉奥(Kanishka Rao)在发布会上表示:"我们实现了两大突破:一是能用单一模型控制包括人形机器人在内的多种机器人;二是某台机器人习得的技能现在可以迁移至其他机器人。"
谷歌DeepMind已通过Google AI Studio中的Gemini API向开发者开放Gemini Robotics-ER 1.5模型,而Gemini Robotics 1.5目前仅限特定合作伙伴访问。
相关文章
- 谷歌云客户业务负责人重返微软,出任安全主管
- 谷歌年度营收首次突破4000亿美元
- 谷歌权威发布!2026 AI Agent智能体趋势,九科信息一文带你深入解读!
- 谷歌在Chrome浏览器中新增Gemini AI驱动的自动浏览功能
- 小水智能出席谷歌创业先锋闭门会 携手Gemini构建全球化儿童AI生态
- 苹果Siri搭载Gemini技术,或为谷歌创造高达50亿美元的价值
- 苹果用谷歌Gemini AI模型推动Siri重大升级
- 谷歌母公司Alphabet旗下Wing无人机提供送货服务的沃尔玛门店将新增150家
- OpenAI狂揽软银2800亿融资,谷歌/微美全息领衔AI军备竞赛重塑大模型格局
- 高通与谷歌深化合作 拓展骁龙数字底盘与Android系统融合生态
- 火山引擎中国第一、全球第三,Tokens调用量逼近谷歌!
- 谷歌发布Gemini 3 Flash加速AI搜索并增强图像生成能力
- 易海创腾受邀出席谷歌2026代理商大会,共话出海新生态
- 谷歌“打样”智能眼镜新范式,中国厂商凭供应链强势突围
- 谷歌将在AI模式下增加信息来源索引范围
- OpenAI宣布进入“红色警报”状态,谷歌在人工智能领域加速追赶









