您现在的位置是：首页 > 其他

当前栏目

【pytorch】bn

2023-04-18 13:06:28 时间

bn接口定义：

 torch.nn.BatchNorm2d：
 def init(self,
 num_features,
 eps=1e-5,
 momentum=0.1,
 affine=True,
 track_running_stats=True)

args：

momentum：
- 默认为 0.1 。
- 要freeze的时候就设置为0.0（和 tf 里面是反着来的，tf是设置为1.0才能freeze）。
rack_running_stats：
- 计算running_mean和running_var（即moving_mean和moving_var）。
- 默认为True。
- 当设置为True时：
  - train 的时候用当前batch的mean和var，并更新running_mean和running_var。
  - eval 的时候用存储的running_mean和running_var，不会更新running_mean和running_var。
- 当设置为False时：
  - train 的时候用当前batch的mean和var，不会更新running_mean和running_var。
  - eval 的时候用当前batch的mean和var，不会更新running_mean和running_var。
  - 此时所有的 xx.xx.bn.running_mean、xx.xx.bn.running_var 和 xx.xx.bn.num_batches_tracked 都会被从 model.state_dict() 里面移除。（这三类缺失值可以从其他state_dict导入来补充）
- 具体参见《Pytorch的BatchNorm层使用中容易出现的问题》。
affine：
- 是否要“乘上缩放矩阵，加上平移向量”（也就是仿射矩阵）的开关。
- 默认为True。

Note：

即使对bn设置了 requires_grad = False ，一旦 model.train() ，bn还是会偷偷开启update（ model.eval()模式下就又停止update ）。

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程

当前栏目

【pytorch】bn

相关文章