您现在的位置是：首页 > 其它

当前栏目

CS294(285) Actor Critic之Critic

Actor

2023-09-27 14:26:47 时间

CS294(285) Actor Critic系列

CS294(285) Actor Critic之agents（https://duanzhihua.blog.csdn.net/article/details/103106090）

构建基类BaseCritic

class BaseCritic(object):
    def __init__(self,**kwargs):
        pass

    def update(self,ob_no,next_ob_no,re_n,terminal_n):
        raise  NotImplementedError

BootstrappedContinuousCritic子类继承BaseCritic

注意标记表示:
符号变量的前缀是sy_u，以区别于数值变量

前缀和后缀:
ob - 观测值 observation
ac - 动作 action
_no - 批处理数据大小 n, 观测维度 observation dim
_na - 批处理数据大

猜你喜欢

自动化测试用例(概述）
一篇好文档，请Thymeleaf Layout Dialect
对MySql查询缓存及SQL Server过程缓存的理解及总结
【路由】设置二级路由器
【美赛】2023年ICM问题Z:奥运会的未来（思路、代码）
ASP.NET开发，简化与封装
TCP/IP详解--TCP连接中TIME_WAIT状态过多
msfvenom生成linux后门
IBM“绿色地平线”为中网加油大数据技术助力全民健身
[译] 再谈 CSS 中的代码味道
十道简单算法题
Codeforces Round #575 (Div. 3) E. Connected Component on a Chessboard
【数据结构】详解队列和循环队列
element ui框架（嵌套路由）

相关主题

167 Scala Actor
13、Actor

zl程序教程

当前栏目

CS294(285) Actor Critic之Critic

相关文章