谷歌提供新框架 帮助机器人规划路线自主“远程出行”
2019-03-05 14:49:23爱云资讯
在某种程度上,通过使用强化学习(RL)可以做到这一点,这是一种人工智能训练技术,它利用奖励来驱动个体朝着目标前进。福斯特、弗朗西斯和他的同事们将强化学习与长距离规划路线结合起来,编出能够安全穿越短距离(约15米)且不会撞上移动障碍物的程序。他们利用AutoRL,一个自动搜索强化学习奖励和神经网络架构的工具,在模拟环境中进行训练,再使用经过训练的程序构建路线图,或由节点(位置)和边组成图。
使用传统RL方法的训练,仍存在许多问题,比如它需要花费时间迭代和手工调整奖励,并在人工智能架构方面不够明智,更不用说减轻遗忘,这种现象是指人工智能系统在学习新信息时,突然忘记了以前学过的信息。
AutoRL试图通过两个阶段来解决这个问题,奖励搜索和神经网络架构搜索。在第一阶段, 每个奖励功能略有不同,在这个阶段的最后,通常会选择将带到其目的地的奖励。神经网络架构搜索阶段本质上是第一阶段的重复,但使用选定的奖励来优化网络,并对累积奖励进行优化。
这个自动化的训练过程,可以减轻模型的遗忘情况,并且与现有技术相比,由此产生的策略的质量更高(导航任务的质量提高了26%),它们甚至足够强大,可以在非结构化环境中引导机器人。
AutoRL制定的策略,对本地导航很有帮助,但远程导航就需要用到概率路线图了,它们是基于采样的规划器的一个子类,对机器人的姿态进行采样,创建符合机器人特性的路线图。
福斯特和弗朗西斯解释说:“首先,我们在一个通用的模拟训练环境中对机器人进行训练,训练一个本地规划策略。再根据该策略构建一个PRM,称为PRM-rl,它位于部署环境的平铺图之上,相同的平面图可以用于任何机器人。”
为了评估PRM-RL,谷歌的研究人员使用比培训环境大200倍的办公室楼层地图构建了一个路线图,在20次试验中,成功率达90%以上。
- 多模态成新“时尚” 谷歌OpenAI万兴科技等出奇招探索多模态能力及应用
- 谷歌将探索AI写作,小美AI城惊艳亮相:AI世界中挑战与机遇并存
- 妙鸭相机海外同款火了 万兴科技旗下“Pixpic”登陆谷歌商店
- 谷歌开发者大会带来升级版Starline,微美全息推进3D显示+全息技术引领新高潮
- TalentOrg携手谷歌、爱点击,共探全球化发展策略
- 谷歌翻译现支持翻译图片内文字
- 谷歌折叠手机Pixel Fold首次在街头被发现
- 中国版“ChatGPT”真的来了,百度、微软、谷歌谁能突围?
- 谷歌Pixel Fold最新外观细节曝光:内外屏参数变化 相机模组造型熟悉
- 传音与谷歌建立全球战略合作伙伴关系,共推新兴市场数字化发展
- Poly博诣多款产品获谷歌及微软认证 加持混合办公生态
- 谷歌明年推8Gbps宽带服务 上行也不限速
- 谷歌Pixel 6a全球定价公布 新晋中端机7月21日开始发货
- Android 13亮相谷歌I/O大会,OPPO首批推出开发者预览版
- 谷歌收购数据科学公司Kaggle增强机器学习和AI业务
- 谷歌 Pixel 6 拆解,FD-SOI首次被用于5G毫米波