Google发布开源强化学习框架
2018-08-28 18:10:41AI云资讯557
据VentureBeat报道,强化学习是一种人工智能(AI)技术,它利用奖赏(或惩罚)来驱动代理朝着特定的目标前进。DeepMind就是利用这种学习方式AlphaGo。但是强化学习框架存在一些问题,比如需要花很多时间来掌握一个目标,而且总是不灵活,也不稳定。

针对真个问题,Google提出一个替代方案:基于其机器学习库TensorFlow的开源强化学习框架。该强化学习框架基于灵活性、稳定性和重现性三个基本原则开发,目前已发布在GitHub上。
除了该开源框架外,Google还推出了一个网站,允许开发人员能快速将针对多个代理的培训运行进行可视化。它还提供经过训练的模型、原始统计日志和TensorFlow事件文件,用于与TensorBoard一起绘图,TensorBoard是Google开发的用于TensorFlow程序的可视化工具套件。相关文章
- Google发布AI领域新进展:涉及抗灾、生成式AI和语言模型
- Google Pixel Fold显示屏规格曝光
- Aqara绿米亮相Google I/O大会,支持Matter协议助力智能家居互通互联
- Google发布搭载Tensor处理器的Pixel 6a 售价449美元
- Google正在使用人工智能“更准确地检测更广泛的个人危机搜索”
- 飞书深诺荣膺三项Google 2021年优秀合作伙伴大奖,在出海营销机构中独占鳌头
- 神州数码旗下GoPomelo荣获Google Cloud年度合作伙伴大奖
- Google推出第四代定制AI芯片TPU v4
- Google AI再曝黑人女员工离职,这是所有科技公司都将面对的问题
- Google实验允许“听到颜色的声音”
- 谷歌开发的双击手势操作 可触发Google Assistant
- VR/AR大战或一触即发,苹果/Google/微美全息等布局5G商用的竞速赛
- 取代Android TV!谷歌或在3月推出全新的Google TV
- 诺基亚与Google签约以构建基于云的5G网络
- Google和苹果,为什么都想让你安装新系统
- Google最新的AR化妆功能曝光,微美全息AR+AI人脸识别精确解锁
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









