您现在的位置是：首页 > Java

当前栏目

补发一篇tensorflow下MADDPG环境搭建配置

2023-02-18 16:37:17 时间

【一】MADDPG-单智能体|多智能体总结（理论、算法）

【二】MADDPG多智能体算法实现(parl)【追逐游戏复现】

之前用的都是paddle，现在补一下tf的。

github上openAI已经给出了maddpg的环境配置https://github.com/openai/maddpg以及https://github.com/openai/multiagent-particle-envs，

1.环境配置

首先确保gym的版本为0.10.5,tensorflow是1.x版本，我的tensorflow是1.14.0,可以运行成功。

打开终端，将路径cd到multiagent-particle-envs文件夹下（即含有setup.py文件的文件夹下）

执行

pip install -e .

multiagent环境安装完成。

同样的，将路径再cd到maddpg文件夹下（即含有setup.py文件的文件夹下），执行

pip install -e .

maddpg安装完成。将路径加入到path中：打开~/.bashrc，将multiagent-particle-envs下的bin的路径添加到path里面（可有可无）

2.代码的运行

训练数据 cd到/maddpg/experiments文件夹下，运行train.py文件，默认环境为simple，若想修改环境，则运行以下代码： python train.py --scenario +环境的名称例如：

python train.py --scenario simple_tag

注：

如果训练完之后报错：

FileNotFoundError: [Errno 2] No such file or directory: ‘./learning_curves/_rewards.pkl’

那么就在跟experiments同级目录下，手动创建一个learning_curves文件夹，当然也可以注释掉这几行数据保存的代码，毕竟不影响训练的结果

Traceback (most recent call last): File “train.py”, line 193, in train(arglist) File “train.py”, line 182, in train rew_file_name = arglist.plots_dir + arglist.exp_name + ‘_rewards.pkl’ TypeError: can only concatenate str (not “NoneType”) to str

直接修改下格式就好：修改train.py第182行为

rew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) +'_rewards.pkl'

第185行为

agrew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) +'_agrewards.pkl'

显示可视化界面

训练完数据后，进行可视化，只需运行代码:python train.py --scenario +环境的名称 --display即可。例如：

python train.py --scenario simple_tag --display

猜你喜欢

linux curl命令的重要用法：发送GET/POST请求，获取网页内容
linux wget命令的重要用法：下载文件并保存，后台下载
linux cd命令的重要用法：cd -，cd ~
linux ls命令的重要用法:按照文件大小排序和按照时间排序
Linux中默认的shell如何切换为其他类型的shell
centos 7网卡配置文件详解（ifcfg-ens33）
linux分区规划
linux查询操作系统信息，CPU物理个数，CPU核心数，逻辑CPU数，内存信息查询，硬盘信息查询
MySQL所有的安装部署方式
MySQL所有的主从同步架构搭建方式
内网服务器离线编译安装mysql5.7并调优
Acrobat最经典的版本：PDF编辑器Acrobat 2021经典版，下载
Adobe Acrobat Pro DC 2019（PDF）软件下载安装包教程(附下载方法)
Adobe Acrobat Pro DC 2018（PDF）软件下载安装包教程(附下载方法)
仅需1% Embedding参数，硬件成本降低十倍，开源方案单GPU训练超大推荐模型
文件更小，质量更高，大火的Stable Diffusion还能压缩图像？
何以为猫？可解释AI从语义层面理解CNN的识别机制
没用Pandas快捷方法，硬核编程的我面试被拒
11分钟充电70%，华人教授在锂电池中加镍箔登上Nature
移动端部署推荐系统：快手获数据挖掘顶会CIKM 2022最佳论文

zl程序教程

当前栏目

补发一篇tensorflow下MADDPG环境搭建配置

1.环境配置

2.代码的运行

相关文章