【转载】 固定随机种子比较强化学习算法——pytorch框架
2023-09-11 14:19:19 时间
原文地址:
https://www.cnblogs.com/lucifer1997/p/13801102.html
===================================================
random.seed(seed) np.random.seed(seed) torch.manual_seed(seed) torch.cuda.manual_seed(seed) torch.cuda.manual_seed_all(seed) torch.backends.cudnn.benchmark = False torch.backends.cudnn.deterministic = True env = gym.make(env_name).unwrapped env.seed(seed)
==========================================
补充说明:
在深度强化学习中如果使用Nvidia显卡作为运算器那么本文上面的设置只能尽可能小的减少实验过程随机性的不可复现性,因为即使如本文这样设置后Nvida显卡上的随机操作也是不可以复现的(这是由于硬件设计所决定的)
如果想完全意义上的进行实验的可复现性就不能使用Nvidia显卡作为计算设备而只能采用CPU作为计算设备。
==============================================
相关文章
- 机器学习流程,常规算法,降维方法
- pytorch使用google UIS-RNN算法识别出每个人的声音(以92%的准确率 google/uis-rnn)
- 【算法】【字符串模块】替换字符串中连续出现的指定字符串
- (《机器学习》完整版系列)第4章 线性模型——4.5 决策树算法中涉及的准则(叶子、划分、剪枝)
- 基于STC8H8K64U声音信标采集和处理算法
- Stanford大学机器学习公开课(三):局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法
- 爱奇艺面试——深度学习算法岗面试
- 【图像修复】基于深度学习的图像修复算法的MATLAB仿真
- C#,图像二值化(09)——全局阈值的最大熵算法(Maximum Entropy Algorithm)与源程序
- C#,码海拾贝(16)——求行列式值的全选主元高斯消去法,《C#数值计算算法编程》源代码升级改进版
- DBoW2算法原理介绍
- 《模式识别》学习笔记(七)聚类算法:动态聚类算法之C均值聚类
- 强化学习代码实战-06 DQN算法(单模型-平衡车)
- 【数据结构】二叉树的顺序结构及实现,堆,向上调整算法,向下调整算法,数组建堆算法,堆排序
- python动态规划算法的使用过程
- 深度强化学习算法(深度强化学习框架)为考虑可以快速适用多种深度学习框架建议采用弱耦合的软件设计方法——快速适用于多种深度学习计算框架的深度强化学习框架设计方案
- 亲测可用的 Linux(Ubuntu18.04下)可运行的俄罗斯方块游戏的仿真环境—————————可用于强化学习算法的游戏模拟器环境
- 洛谷 P3805 【模板】manacher算法
- Andrew Ng机器学习笔记+Weka相关算法实现(四)SVM和原始对偶问题
- 机器学习常用算法
- 分布式选举算法
- php与java通用AES加密解密算法
- JVM:这是一份全面 & 详细的 垃圾收集算法(GC) 学习指南
- 【AI理论学习】机器学习算法的分类