谷歌DeepMind的新型AI模型可通过网络搜索帮助机器人完成任务
2025-09-26 05:59:11AI云资讯4217

(AI云资讯消息)谷歌DeepMind表示,其升级后的人工智能模型使机器人能够完成更复杂的任务,甚至能借助互联网寻求帮助。谷歌DeepMind机器人技术负责人卡罗莱娜·帕拉达(Carolina Parada)表示,该公司的新AI模型可协同工作,让机器人在物理世界采取行动前能够提前规划多个步骤。
该系统由新发布的Gemini Robotics 1.5及具身推理模型Gemini Robotics-ER 1.5驱动,这些是谷歌DeepMind 3月份推出的AI模型的升级版本。如今机器人不仅能完成折纸或拉开包链的单一任务,还能实现按深浅色分类洗衣、根据伦敦实时天气整理行李箱、甚至通过针对当地规定的网络搜索来协助人们分类垃圾、堆肥物和可回收物等复杂操作。
帕拉达表示:"此前发布的模型能够以非常通用的方式,每次精准执行单一指令。而通过此次升级,我们正从单一指令执行迈向对实体任务的真正理解与问题解决。"
首先,机器人利用升级后的Gemini Robotics-ER 1.5模型感知周围环境,并通过谷歌搜索等数字工具获取更多信息。随后,Gemini Robotics-ER 1.5会将检索结果转化为自然语言指令传递给Gemini Robotics 1.5模型,使机器人能够借助该模型的视觉与语言理解能力逐步执行任务。

此外,谷歌DeepMind宣布,Gemini Robotics 1.5能帮助不同配置的机器人实现相互学习。研究发现,面向ALOHA2双机械臂机器人训练的任务,可直接应用于双臂Franka机器人及Apptronik的人形机器人Apollo。谷歌DeepMind软件工程师卡尼什卡·拉奥(Kanishka Rao)在发布会上表示:"我们实现了两大突破:一是能用单一模型控制包括人形机器人在内的多种机器人;二是某台机器人习得的技能现在可以迁移至其他机器人。"
谷歌DeepMind已通过Google AI Studio中的Gemini API向开发者开放Gemini Robotics-ER 1.5模型,而Gemini Robotics 1.5目前仅限特定合作伙伴访问。
相关文章
- 苹果在新版Siri上作出妥协:依靠英伟达B200 GPU加密技术,防止谷歌窃取用户数据
- 谷歌Beam抢滩多人会议全息赛道,微美全息以AI+5G解锁虚实融合视觉新想象
- Google I/O 2026亮点回顾:晶晨股份携手谷歌共拓端侧AI新生态
- 谷歌搜索的人工智能进化包含更多广告
- 谷歌的未来是一个无所不能的搜索框
- Google I/O 2026:Gemini 将成为谷歌年度开发者大会的主角
- 2026智能眼镜“百镜争鸣”,谷歌/阿里/微美全息引领AR/XR产业全面升级
- 谷歌发布 Chromebook 后继产品——Googlebook
- 谷歌称其首次发现并阻止了一个利用AI开发的零日漏洞
- 谷歌首款AI眼镜即将呼之欲出,微美全息(WIMI.US)扎实推进AI+AR生态落地
- 谷歌母公司发布2026年一季度财报,搜索查询量创下历史新高
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Siri悄然接入Gemini大模型,苹果反成谷歌云2026 Next大会主角
- 联合谷歌共建:戴盟发布数百万小时触觉具身数据集
- 谷歌将Marvell纳入双芯片TPU计划,ASIC AI推理格局或将重塑
- 谷歌推出Mac版Gemini人工智能应用
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









