多巴胺:谷歌开源新型增强学习框架
https://mp.weixin.qq.com/s/KRyr0y84k6vkezuuM408lw
Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。
Dopamine 的功能亮点
易用性
-
清晰性和简洁性是该框架设计中的两个关键考虑因素。Google 提供的代码非常紧凑(约 15 个 Python 文件)且文档完善,Google 希望这种简单性能使研究人员更轻松地理解代理的内部运作并快速尝试新的想法。
复用性
-
Google 非常看重可复用性在强化学习研究中的重要性。为此,他们为代码提供完整的测试覆盖率;,并遵循 Machado 等学者给出的建议,使用街机学习环境(Arcade Learning Environment)标准化经验评估。
基准测试
-
对于新的研究人员而言,能够根据已有方法快速对自己的想法进行基准测试是非常重要的。因此,Google 提供四个 agent 的完整训练数据,包括Arcade Learning Environment 支持的 60 个游戏,格式为 Python pickle 文件(对于使用谷歌框架训练的智能体)和 JSON 数据文件(用于对比其他框架训练的智能体)。Google 还额外提供一个网站,可在上面快速查看所有 60 款游戏的 agent 可视化训练运行情况。
更多细节根据相关链接进行查阅。
相关链接
-
Dopamine 的详细介绍
https://ai.googleblog.com/2018/08/introducing-new-framework-for-flexible.html
-
Dopamine 的Github 地址
https://github.com/google/dopamine
相关文章
- FPGA学习网站、开源网站和论坛网站汇总
- 我是怎样完成开源系统中的验证码的功能的?
- UGUI的优点新UI系统四 开源
- vue开源项目库汇总
- macOS App开源UI汇总
- Qt编写调试日志输出类带网络转发(开源)
- 开源大语言模型(LLM)汇总(持续更新中)
- AT&T拥抱开源,软件开源程度或将达到50%
- ETL学习笔记之四:开源项目 Kettle
- 开创学习的四核时代-iTOP-4412开发板开源硬件平台
- 【历史上的今天】3 月 16 日:开源精神奠基人诞生;技术先驱为女儿发明拍照手机;Minix 开发者出生
- 开源 SPL 打破数据库计算的封闭性
- c语言开源项目--SQLite学习资料总结
- iOS - 开源框架、项目和学习资料汇总(网络篇)
- iOS - 开源框架、项目和学习资料汇总(动画篇)
- 学习Coding-iOS开源项目日志(三)
- 开源框架 Java 管理系统