谷歌提供新框架 帮助机器人规划路线自主“远程出行”
2019-03-05 14:49:23AI云资讯1469

在某种程度上,通过使用强化学习(RL)可以做到这一点,这是一种人工智能训练技术,它利用奖励来驱动个体朝着目标前进。福斯特、弗朗西斯和他的同事们将强化学习与长距离规划路线结合起来,编出能够安全穿越短距离(约15米)且不会撞上移动障碍物的程序。他们利用AutoRL,一个自动搜索强化学习奖励和神经网络架构的工具,在模拟环境中进行训练,再使用经过训练的程序构建路线图,或由节点(位置)和边组成图。
使用传统RL方法的训练,仍存在许多问题,比如它需要花费时间迭代和手工调整奖励,并在人工智能架构方面不够明智,更不用说减轻遗忘,这种现象是指人工智能系统在学习新信息时,突然忘记了以前学过的信息。
AutoRL试图通过两个阶段来解决这个问题,奖励搜索和神经网络架构搜索。在第一阶段, 每个奖励功能略有不同,在这个阶段的最后,通常会选择将带到其目的地的奖励。神经网络架构搜索阶段本质上是第一阶段的重复,但使用选定的奖励来优化网络,并对累积奖励进行优化。
这个自动化的训练过程,可以减轻模型的遗忘情况,并且与现有技术相比,由此产生的策略的质量更高(导航任务的质量提高了26%),它们甚至足够强大,可以在非结构化环境中引导机器人。
AutoRL制定的策略,对本地导航很有帮助,但远程导航就需要用到概率路线图了,它们是基于采样的规划器的一个子类,对机器人的姿态进行采样,创建符合机器人特性的路线图。
福斯特和弗朗西斯解释说:“首先,我们在一个通用的模拟训练环境中对机器人进行训练,训练一个本地规划策略。再根据该策略构建一个PRM,称为PRM-rl,它位于部署环境的平铺图之上,相同的平面图可以用于任何机器人。”
为了评估PRM-RL,谷歌的研究人员使用比培训环境大200倍的办公室楼层地图构建了一个路线图,在20次试验中,成功率达90%以上。
相关文章
- 苹果在新版Siri上作出妥协:依靠英伟达B200 GPU加密技术,防止谷歌窃取用户数据
- 谷歌Beam抢滩多人会议全息赛道,微美全息以AI+5G解锁虚实融合视觉新想象
- Google I/O 2026亮点回顾:晶晨股份携手谷歌共拓端侧AI新生态
- 谷歌搜索的人工智能进化包含更多广告
- 谷歌的未来是一个无所不能的搜索框
- Google I/O 2026:Gemini 将成为谷歌年度开发者大会的主角
- 2026智能眼镜“百镜争鸣”,谷歌/阿里/微美全息引领AR/XR产业全面升级
- 谷歌发布 Chromebook 后继产品——Googlebook
- 谷歌称其首次发现并阻止了一个利用AI开发的零日漏洞
- 谷歌首款AI眼镜即将呼之欲出,微美全息(WIMI.US)扎实推进AI+AR生态落地
- 谷歌母公司发布2026年一季度财报,搜索查询量创下历史新高
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Siri悄然接入Gemini大模型,苹果反成谷歌云2026 Next大会主角
- 联合谷歌共建:戴盟发布数百万小时触觉具身数据集
- 谷歌将Marvell纳入双芯片TPU计划,ASIC AI推理格局或将重塑
- 谷歌推出Mac版Gemini人工智能应用
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









