您现在的位置是：首页 > 其它

当前栏目

RTReLU激活函数

函数激活

2023-09-27 14:20:17 时间

RTReLU激活函数

文章链接：Randomly translational activation inspired by the input distributions of ReLU

年份：2018

简介

通常情况下，非线性激活函数的输入分布近似于高斯分布，大部分输入集中在零附近，这样导致学习到的CNN对非线性激活输入的小抖动很是敏感，而且容易造成过拟合。本文为了解决上述问题，提出了深度CNN的随机平移非线性激活函数。在训练阶段，非线性激活函数由高斯分布采样的偏移量随机平移。在测试阶段采用零偏移非线性激活。

通过观察在卷积神经网络上的ReLU激活函数的输入的分布类似于高斯分布，这意味着ReLU上的大部分输入都集中在零附近，通常，ReLU的输入存在较小的抖动或噪声，因为当ReLU的输入不为零时，对小的抖动或噪声输出是鲁棒的。但是当ReLU的输入接近与0时， ReLU对小的抖动和噪声很敏感。

假设ReLU的输入由两部分组成：基本输入 $x_i^0$ 和抖动 $n_i$ 。由此ReLU被表达为：
$\begin{cases} x_i^0 + n_i , & x_i^0 + n_i >0\\ 0, & x_i^0 +n_i \le 0 \end{cases}$

其中 $n_i$ 是一个很小的噪声。当 $x_i^0$ 接近0时， $n_i$ 有可能导致误激活。例如，当 $x_i^0 = 0.5$ 时，而 $n_i<-0.5$ ， $x_i^0 + n_i <0$ 则，本应该激活，结果输出的激活值为0，成为误激活；当 $x = - 0.5$ ，本不应该激活，但是如 $n_i>0.5$ ， $x_i^0 + n_i >0$ ，则输出激活值，又称为误激活。为了解决ReLU导致学习的CNN可能对抖动敏感，提出了RTReLU激活函数：
$\begin{cases} x_i+ a_i , & x_i + a_i >0\\ 0, & x_i +a_i \le 0 \end{cases}$
其中 $a_i$ 为在 $x$ 轴上的偏移量。在训练阶段，RTReLU中的 $a_i$ 在每次迭代时，从高斯分布中随机采样， $a_i\sim N(0, \sigma)$ ， $\sigma$ 为高斯分布的标准差。通常情况下 $\sigma=0.75$
具体的RTReLU的曲线如下图所示：
在这里插入图片描述
该方法也可以应用于其他非线性激活函数，PReLU是ReLU的一个变体，RTPReLU可以写成
$\begin{cases} x_i+ a_i , & x_i + a_i >0\\ k_i(x_i +a_i), & x_i +a_i \le 0 \end{cases}$
$a_i$ 为RTPReLU在x轴上的偏移量，采样来自高斯分布，具体的函数图像如下图：
在这里插入图片描述

分析

随机平移非线性激活(RTReLU或RTPReLU)的优点总结如下,

可以使非线性激活的输入更加分散，因此该函数有更强的鲁棒性
PTReLU是ReLU的正则化，以减少训练阶段的过拟合
在不增加计算成本的情况下提高精度。

可是该函数的梯度不连续，而且随机平移后，对正区域的输入影响较大。而且该函数的非线性不是太好，通过具体的试验，该函数的表现没有本论文说的那么好

猜你喜欢

Android项目该如何选择targetSdkVersion
笔记本外接显示器后没有声音
如何将服务器传来的字符串转成HTML显示在前端页面
java基础复习之对于String对象，能够使用“=”赋值，也能够使用newkeyword赋值，两种方式有什么差别？
【JavaScript】使用 JSON
Windows8应用开发权威指南
基因表达调控 | 实验技术
090614 T DDD与591jj
03计算机性能指标
SSM-CRUD入门项目——删除
除了想了几个月的大安全，周鸿祎还回答了这些问题
修改dwz accordion 手风琴初始化的时候,如何设置左侧第一个菜单默认从打开到折叠
winform 获取当前项目所在的路径
一位数据科学家的私房工具清单
ASC17超算大赛猜想：戈登·贝尔奖应用&人工智能AlphaGO？
Maven 依赖管理
WPF 屏幕点击的设备类型
Nginx

相关主题

python 匿名函数
js之箭头函数
7.Go函数
神经网络激活函数
JS自执行函数
mysql----函数
SQL的函数

zl程序教程

当前栏目

RTReLU激活函数

RTReLU激活函数

简介

分析

相关文章