您现在的位置是：首页 > 其他

当前栏目

从矩阵的谱半径到神经网络梯度消失

神经网络

2023-04-18 15:20:43 时间

一、矩阵的范数

二、矩阵的谱半径

虽然，谱半径小于等于任意矩阵范数。

但是，也必存在一个算子范数，小于等于谱半径+一个小的正数

从线性方程组的迭代法的收敛性到矩阵的幂的收敛。

谱半径小于1，也必存在一个算子范数，小于1；

若矩阵的范数小于1，当k趋于无穷时，矩阵任意范数的k次幂肯定趋近于0，这就使x(k)逼近其解。也就是说，矩阵的幂趋近于0矩阵。

三、深度神经网络的梯度消失

在训练深层的神经网络时，例如MLP或RNN，由于反向传播的链路过长，从而涉及到多次的矩阵的连乘（激活函数关于净输入的偏导数矩阵、当前层输入关于净输入的偏导数矩阵，可以视为一个矩阵）。

如果这个矩阵的谱半径小于一，那么随着反向传播的进行，回传的梯度信号衰减地越厉害，这使得越是网络浅层的参数地梯度越微弱，那么其越难得到很好地更新。

参考：数值分析ppt

猜你喜欢

UnrealIRCd 基础3
UnrealIRCd 基础4
UnrealIRCd 基础5
UnrealIRCd 基础6
UnrealIRCd 基础7
UnrealIRCd 基础8
UnrealIRCd 基础9
UnrealIRCd 基础10
UnrealIRCd 基础11
Docker Swarm 基础1
车企新品牌、新车型层出，数据采集分析告诉你到底哪家强！
数字化时代，DevOps发展趋势是怎样的?如何推进后续进程？
uni-app 第一个小程序之旅（二）
vue 3.0 拖拽组件
Vue.use是干什么的？原理是什么？
Vue3 源码解析（七）
Vue3.0 响应式实现原理分析
Vue3+Vite+Ts+Antd2.x项目搭建
vue3与vue2的区别
Docker Swarm 基础2

zl程序教程

当前栏目

从矩阵的谱半径到神经网络梯度消失

一、矩阵的范数

二、矩阵的谱半径

三、深度神经网络的梯度消失

相关文章