您现在的位置是：首页 > 后端

当前栏目

baselines算法库common/wrapper.py模块分析

算法模块分析 py Common Wrapper

2023-09-11 14:19:19 时间

common/wrapper.py模块：

import gym

class TimeLimit(gym.Wrapper):
    def __init__(self, env, max_episode_steps=None):
        super(TimeLimit, self).__init__(env)
        self._max_episode_steps = max_episode_steps
        self._elapsed_steps = 0

    def step(self, ac):
        observation, reward, done, info = self.env.step(ac)
        self._elapsed_steps += 1
        if self._elapsed_steps >= self._max_episode_steps:
            done = True
            info['TimeLimit.truncated'] = True
        return observation, reward, done, info

    def reset(self, **kwargs):
        self._elapsed_steps = 0
        return self.env.reset(**kwargs)

class ClipActionsWrapper(gym.Wrapper):
    def step(self, action):
        import numpy as np
        action = np.nan_to_num(action)
        action = np.clip(action, self.action_space.low, self.action_space.high)
        return self.env.step(action)

    def reset(self, **kwargs):
        return self.env.reset(**kwargs)

两个对gym环境类的包装类，TimeLimit限制环境类env的最大step数，如果到达最大step数后游戏还没有终止则强制返回终止状态done=True，并设置返回信息：info['TimeLimit.truncated'] = True 。

类ClipActionsWrapper对输入给gym环境的动作进行包装，如果输入的action（action为numpy向量）中含有np.nan则置为0，

如果action中的数值大小超过action_space.low和action_space.high则进行clip操作。

============================================

猜你喜欢

上传图片时获取到上传图片的长和宽
ABP源码分析三十一：ABP.AutoMapper
Cocos2d-x
php获取文件名和后缀名
如何查看 ToggleStatusComponent 是否是 SAP Spartacus public API 一部分
kubernetes
C# 快速排序
Python采集最新MV内容, 粉丝评论并实现词云分析
大数据与传统数据的区别_数据分析师
stm32f429 hal库工程创建
超详细VS2008+Wince6.0环境搭建及连接（Win10系统）
【原创】遇到一个 rabbitmqctl 无法退出的问题
Selenium基础 — 键盘操作
java实现第六届蓝桥杯三角形面积
〖Python 数据库开发实战 - MongoDB篇②〗- Mac环境下的MongoDB数据库安装
编写高质量代码:改善Java程序的151个建议 --[117~128]
Java实现图片上传
DynaSLAM-2 DynaSLAM中Mask R-CNN部分源码解析（Ⅰ）
3.13 以类取代类型码
log4net配置文件

相关主题

算法-排序算法
vue的diff算法
OJ算法题
路由算法
限流算法
pca算法
DBSCAN 算法
算法-贪心算法
卷积等算法
数据结构与算法--链表
机器学习优化算法
C语言100个经典的算法
算法 - KMP算法
算法_贪心算法
算法提高 P0102
kmeans算法
算法（1）
推荐算法
排序算法-算法
算法-递归算法

zl程序教程

当前栏目

baselines算法库common/wrapper.py模块分析

相关文章