谷歌开发强化学习框架以培训人工智能模型
2018-08-29 17:07:51爱云资讯
谷歌正在开发一个用于项目的强化学习框架来培训人工智能模型。
强化学习已经被应用于迄今为止最令人印象深刻的人工智能演示,包括那些在Alpha Go和Dota 2中击败了人类职业玩家的演示。谷歌子公司DeepMind将其用于其Deep Q-Network(DQN)。
建立一个强化学习框架需要时间和大量的资源。为了使人工智能充分发挥其潜力,它需要变得更容易获取。
从今天开始,谷歌正在开发一个基于TensorFlow的开源强化框架——它的机器学习库——可以在GitHub上找到。
谷歌大脑研究人员Pablo Samuel Castro和Marc G. Bellemare在一篇博客文章中写道:
“灵感来自于大脑中奖赏激励行为的一个主要组成部分,反映了神经科学与强化学习研究之间的强烈历史联系,这个平台的目的是为了促成一种能够推动重大发现的投机性研究。”
“这个版本还会说明如何使用我们的框架。”
谷歌的框架设计有三个重点:灵活性、稳定性和再现性。
该公司为学习环境提供了15个代码示例——一个使用视频游戏来评估人工智能技术性能的平台——以及四个不同的机器学习模型:C51、前面提到的DQN、隐式量子网络和彩虹代理。
强化学习是最有效的训练方法之一。如果你在训练一只狗,把它作为对你想要的行为的奖励,这是在实践中积极强化的一个关键例子。
培训一台机器是一个类似的概念,奖励被保留为1和0,而不是商品或薪水。
“我们希望,我们的框架的灵活性和易用性将使研究人员能够尝试新的想法,无论是渐进的还是激进的,”Bellemare和Castro写道。“我们已经在积极地将它用于我们的研究,并发现它给了我们快速迭代许多想法的灵活性。”相关文章
- 多模态成新“时尚” 谷歌OpenAI万兴科技等出奇招探索多模态能力及应用
- 谷歌将探索AI写作,小美AI城惊艳亮相:AI世界中挑战与机遇并存
- 妙鸭相机海外同款火了 万兴科技旗下“Pixpic”登陆谷歌商店
- 谷歌开发者大会带来升级版Starline,微美全息推进3D显示+全息技术引领新高潮
- TalentOrg携手谷歌、爱点击,共探全球化发展策略
- 谷歌翻译现支持翻译图片内文字
- 谷歌折叠手机Pixel Fold首次在街头被发现
- 中国版“ChatGPT”真的来了,百度、微软、谷歌谁能突围?
- 谷歌Pixel Fold最新外观细节曝光:内外屏参数变化 相机模组造型熟悉
- 传音与谷歌建立全球战略合作伙伴关系,共推新兴市场数字化发展
- Poly博诣多款产品获谷歌及微软认证 加持混合办公生态
- 谷歌明年推8Gbps宽带服务 上行也不限速
- 谷歌Pixel 6a全球定价公布 新晋中端机7月21日开始发货
- Android 13亮相谷歌I/O大会,OPPO首批推出开发者预览版
- 谷歌收购数据科学公司Kaggle增强机器学习和AI业务
- 谷歌 Pixel 6 拆解,FD-SOI首次被用于5G毫米波
热门文章
头条文章
重点文章
推荐文章
热点文章