您现在的位置是：首页 > 其它

当前栏目

为什么batchnormalize 有效

为什么有效

2023-09-14 09:09:29 时间

The popular belief is that this effectiveness stems from controlling the change of the layers’ input distributions during training to reduce the so-called“internal covariate shift”. In this work, we demonstrate that such distributionalstability of layer inputs has little to do with the success of BatchNorm. Instead,we uncover a more fundamental impact of BatchNorm on the training process: it makes the optimization landscape significantly smoother. This smoothness inducesa more predictive and stable behavior of the gradients, allowing for faster training.

普遍的看法是，这种有效性源于在训练期间控制层输入分布的变化以减少所谓的“内部协方差偏移”。在这项工作中，我们证明了这种分布式层输入的稳定性与 BatchNorm 的成功无关。
我们发现了 BatchNorm 对训练过程的一个更根本的影响：它使优化环境更加顺畅。这种平滑性导致梯度的更具预测性和稳定性的行为，允许更快的训练。

猜你喜欢

权限Linux SVN权限控制：管理文件安全（linuxsvn文件）
给伙伴们介绍一个办公神奇udppLAN
刷题：数的翻转
Python面向对象编程-类和对象-抽象类
探索Oracle中的累加函数（oracle 中累加函数）
Linux：探索主目录的奥秘（linux主目录）
SQL Server环境下的黑客安全防护（sqlserver黑底）
Linux下构建稳健的文件系统（linux建文件系统）
这是一份很全很全的IO基础知识与概念
au音频时间锁定设置方法-Adobe Audition安装包
Substance Painter 2020 for mac(3D绘画软件)
MySQL双表查询如何在两个表中检索数据（mysql中两表查询）
Linux 探索日志之旅（linux日志目录）
将json对象转换为字符串的方法

相关主题

为什么写博客
1024为什么是程序员日
为什么 Google 会很强？
为什么
java中为什么
为什么学习差
1+1为什么等于2

zl程序教程

当前栏目

为什么batchnormalize 有效

普遍的看法是，这种有效性源于在训练期间控制层输入分布的变化以减少所谓的“内部协方差偏移”。在这项工作中，我们证明了这种分布式层输入的稳定性与 BatchNorm 的成功无关。

我们发现了 BatchNorm 对训练过程的一个更根本的影响：它使优化环境更加顺畅。这种平滑性导致梯度的更具预测性和稳定性的行为，允许更快的训练。

相关文章

当前栏目

为什么batchnormalize 有效

普遍的看法是，这种有效性源于在训练期间控制层输入分布的变化以减少所谓的“内部协方差偏移”。 在这项工作中，我们证明了这种分布式层输入的稳定性与 BatchNorm 的成功无关。

我们发现了 BatchNorm 对训练过程的一个更根本的影响：它使优化环境更加顺畅。 这种平滑性导致梯度的更具预测性和稳定性的行为，允许更快的训练。

相关文章

普遍的看法是，这种有效性源于在训练期间控制层输入分布的变化以减少所谓的“内部协方差偏移”。在这项工作中，我们证明了这种分布式层输入的稳定性与 BatchNorm 的成功无关。

我们发现了 BatchNorm 对训练过程的一个更根本的影响：它使优化环境更加顺畅。这种平滑性导致梯度的更具预测性和稳定性的行为，允许更快的训练。