谷歌DeepMind的新型AI模型可通过网络搜索帮助机器人完成任务-AI云资讯

（AI云资讯消息）谷歌DeepMind表示，其升级后的人工智能模型使机器人能够完成更复杂的任务，甚至能借助互联网寻求帮助。谷歌DeepMind机器人技术负责人卡罗莱娜·帕拉达（Carolina Parada）表示，该公司的新AI模型可协同工作，让机器人在物理世界采取行动前能够提前规划多个步骤。

该系统由新发布的Gemini Robotics 1.5及具身推理模型Gemini Robotics-ER 1.5驱动，这些是谷歌DeepMind 3月份推出的AI模型的升级版本。如今机器人不仅能完成折纸或拉开包链的单一任务，还能实现按深浅色分类洗衣、根据伦敦实时天气整理行李箱、甚至通过针对当地规定的网络搜索来协助人们分类垃圾、堆肥物和可回收物等复杂操作。

帕拉达表示："此前发布的模型能够以非常通用的方式，每次精准执行单一指令。而通过此次升级，我们正从单一指令执行迈向对实体任务的真正理解与问题解决。"

首先，机器人利用升级后的Gemini Robotics-ER 1.5模型感知周围环境，并通过谷歌搜索等数字工具获取更多信息。随后，Gemini Robotics-ER 1.5会将检索结果转化为自然语言指令传递给Gemini Robotics 1.5模型，使机器人能够借助该模型的视觉与语言理解能力逐步执行任务。

此外，谷歌DeepMind宣布，Gemini Robotics 1.5能帮助不同配置的机器人实现相互学习。研究发现，面向ALOHA2双机械臂机器人训练的任务，可直接应用于双臂Franka机器人及Apptronik的人形机器人Apollo。谷歌DeepMind软件工程师卡尼什卡·拉奥（Kanishka Rao）在发布会上表示："我们实现了两大突破：一是能用单一模型控制包括人形机器人在内的多种机器人；二是某台机器人习得的技能现在可以迁移至其他机器人。"

谷歌DeepMind已通过Google AI Studio中的Gemini API向开发者开放Gemini Robotics-ER 1.5模型，而Gemini Robotics 1.5目前仅限特定合作伙伴访问。

谷歌DeepMind的新型AI模型可通过网络搜索帮助机器人完成任务

相关文章

人工智能企业

人工智能硬件

人工智能产业

人工智能技术