您现在的位置是：首页 > IT要闻

当前栏目

人工神经网络学习笔记（3）

笔记学习神经网络

2023-04-18 16:06:35 时间

如何更新权重

在上一篇文章中我们算出了各个层的误差，现在是时候利用这些误差来指导链接权重的修改了。那么该如何修改？

**暴力枚举：**对于一个三层的神经网络，每层有3个神经元结点，有两个3 × 3 3 imes 33×3的链接权重矩阵，共有18个权重值。假设每个权重在1和-1之间共有1000种取值，那么我们有100 0 18 1000^{18}1000

种权重组合，这个数字已经很大了。但是，如果是每层有500个结点呢？那么权重数将达到2 × 500 × 500 = 500000 2 imes 500 imes 500 = 5000002×500×500=500000个，将会有100 0 500000 1000^{500000}1000

500000

种组合。想要遍历这么些种可能得等到人类灭绝…

可见，暴力枚举并不能实际地解决我们的问题。

**新的思路：**让我们再次明确下我们的最终目的，让误差值降到最小。试着将其转化成数学上的求函数最小值问题。先前我们知道，误差是所有链接权重的函数:

现在我们需要额就是找出该函数的最小值。但由于真正的误差函数的自变量太多，先举个简单的例子：

假设误差函数只有一个自变量（链接权重）：

可以将其想象成一个连绵的山脉，有山峰也有山谷。设想将一个小球至于山腰，那么在重力的作用下它必定沿着所在位置的斜率方向向下滚动直到山谷。但是很明显，我们并没有重力帮忙，因此必须人为指定“滚动方向”。

不难发现，当斜率为正时应向左滚动（x–），斜率为负时应向右滚动（x++）。这种方法在数学上被称为梯度下降（gradient descent）。 可能的意外情况： 我们可能会碰到这种情况：当小球的起始位置为左侧山腰时，其很有可能最终会在局部最小值（左侧的山谷）停下，这可不是我们所希望的结果。因为我们的目的是把误差降到最小，那里显然不是最小的地方。

为了避免上述情况，我们应从选择不同的其实位置对神经网络进行多次训练，以确保其并不总是终止于错误的地方。而不同的其实位置意味着不同的链接权重。

选择误差函数的形式

可选项：

我们选用方差形式，因为其具有很多优点：

可以很容易地使用代数方法（链式法则求解偏导数）计算出梯度下降的斜率
误差函数平滑连续，这使得梯度下降算法可以很好地发挥作用
越接近最小值梯度（斜率）越小，按照斜率调整步长可以减少越过最佳位置的风险

计算梯度值（斜率）

当只有一个链接权重时，误差函数为二维曲线：

当有两个链接权重时，误差函数为一个三维曲面： [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hLK7QfiG-1580383013480)(https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1559636048297&di=a69a0ac50c0c4c39c6290d14fe697429&imgtype=0&src=http%3A%2F%2Fimg.ph.126.net%2FwdlmGd6Cl2EyG0Bp-xEihQ%3D%3D%2F1016406140918957318.jpg)]

上述表达式表示了当权重w j , k w误差E 是如何改变的。这是误差函数的斜率，也就是我们希望使用梯度下降的方法达到最小值的方向。

计算梯度：

在开始计算前我们回顾一下网络中各个参数的意义：

展开误差函数：由于一个结点的误差只与与其相连的链接权重有关，因此误差函数可以简单地表示为：

因此，我们得到了以下表达式：

又由于我们只关心误差函数斜率的方向，因此可以将公式中的常数2省略，并不影响正负号

改变链接权重

之前提到过，权重的改变方向与梯度的方向相反。因此我们规定权重的改变方式为：

到此，所有的前期工作都已完成。

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程