谷歌开发强化学习框架以培训人工智能模型-爱云资讯

谷歌正在开发一个用于项目的强化学习框架来培训人工智能模型。

强化学习已经被应用于迄今为止最令人印象深刻的人工智能演示，包括那些在Alpha Go和Dota 2中击败了人类职业玩家的演示。谷歌子公司DeepMind将其用于其Deep Q-Network(DQN)。

建立一个强化学习框架需要时间和大量的资源。为了使人工智能充分发挥其潜力，它需要变得更容易获取。

从今天开始，谷歌正在开发一个基于TensorFlow的开源强化框架——它的机器学习库——可以在GitHub上找到。

谷歌大脑研究人员Pablo Samuel Castro和Marc G. Bellemare在一篇博客文章中写道：

“灵感来自于大脑中奖赏激励行为的一个主要组成部分，反映了神经科学与强化学习研究之间的强烈历史联系，这个平台的目的是为了促成一种能够推动重大发现的投机性研究。”

“这个版本还会说明如何使用我们的框架。”

谷歌的框架设计有三个重点：灵活性、稳定性和再现性。

该公司为学习环境提供了15个代码示例——一个使用视频游戏来评估人工智能技术性能的平台——以及四个不同的机器学习模型：C51、前面提到的DQN、隐式量子网络和彩虹代理。

强化学习是最有效的训练方法之一。如果你在训练一只狗，把它作为对你想要的行为的奖励，这是在实践中积极强化的一个关键例子。

培训一台机器是一个类似的概念，奖励被保留为1和0，而不是商品或薪水。

“我们希望，我们的框架的灵活性和易用性将使研究人员能够尝试新的想法，无论是渐进的还是激进的，”Bellemare和Castro写道。“我们已经在积极地将它用于我们的研究，并发现它给了我们快速迭代许多想法的灵活性。”

谷歌开发强化学习框架以培训人工智能模型