您现在的位置是：首页 > IT要闻

当前栏目

【机器学习每日一问07】Batch Normalization

网络学习数据

2023-04-18 14:49:20 时间

目的：

解决internal covariate shift。internal covariate shift会带来什么问题

1. 网络需要不停调整来适应输入数据分布的变化，导致网络学习速度的降低。每一次参数迭代更新后，上一层网络的输出数据经过这一层网络计算后，数据的分布会发生变化，为下一层网络的学习带来困难（神经网络本来就是要学习数据的分布，要是分布一直在变，学习就很难了）

2. 网络的训练过程容易陷入梯度饱和区，减缓网络收敛速度。例如sigmoid，tanh激活函数，很容易使得模型训练陷入梯度饱和区。

算法流程：

对于神经网络的第 l 层，每个mini-batch有m 个样本

Normalization操作我们虽然缓解了ICS问题，让每一层网络的输入数据分布都变得稳定。但是使得底层网络学习到的参数信息丢失，所以转变为学习参数

和

优点：

1. BN使得网络中每层输入数据的分布相对稳定，加速模型学习速度，更快收敛

2. 允许网络使用饱和性激活函数（例如sigmoid，tanh等），缓解梯度消失问题

3. BN使得模型对网络中的参数不那么敏感，简化调参过程，使得网络学习更加稳定

猜你喜欢

中国信通院：2020年1月手机出货量下降38.9% 5G手机出货546.5万部
2020年你必须了解的移动应用开发趋势
2020年Android最新保活实现原理揭秘
iOS 14 来了！6月发布这些功能向安卓看齐
从安卓之父到摇滚之声，那些高开低走的手机品牌为什么会失败？
看看苹果设想中的全面环绕屏iPhone
欧盟要求所有手机统一充电接口这对苹果意味着什么
折叠手机要做出这五大改变才能被大众接受
谷歌今年的安卓11抄袭iOS不少安全隐私功能
新的苹果地图来了，又有三个城市能「3D 看街景」
2020版iPhone：有关iPhone 12系列的七大传闻
苹果新iPhone命名再起争议：发布在即板上钉钉！
Microsoft Office iOS 版本现已上架 App Store
OPPO造芯：Top5边缘的远虑和近忧
谷歌下架近600款安卓应用，它们的安装次数超45亿
微信被限制登录该怎么办？官方最详细教程来了
中国手机厂商唯“芯”论可以休矣
iOS 14曝光：苹果有望允许用户修改默认浏览器
QQ重大更新：腾讯求小学生五星一次付清
5nm制程即将上线，会是iPhone 12杀手锏吗？

zl程序教程

当前栏目

【机器学习每日一问07】Batch Normalization

目的：

算法流程：

优点：

相关文章