您现在的位置是：首页 > 硬件

当前栏目

（《机器学习》完整版系列）第5章神经网络——5.2 RBF网络（单层RBF就可解决异或问题）与ART网络（实现“自适应谐振”）

机器网络学习神经网络实现解决系列适应

2023-09-11 14:14:53 时间

单层RBF神经网络就可解决异或问题。
ART网络已发展出一个了一个算法族，需要理解它是如何实现“自适应谐振”的。

RBF网络

径向基函数网络RBF如图5.3所示，此图为缩略图，即一个圆圈代表一组圆圈。
图5.3 RBF网络

图5.3 RBF网络

分为两部分：左边的虚线框确定神经元中心 $\boldsymbol{c}$ ，可用聚类算法找出各类的中心作为神经元中心，右边虚线框为一个前馈神经网。下面我们将右边虚线框展开成图5.4（此时 $\boldsymbol{c}$ 为已确定，视为常数）：
在这里插入图片描述

图5.4 RBF网络的BP部分

显然，图5.4是一个类BP网络，其特点是使用径向基函数 $\rho$ 作为隐层神经元的激活函数。当然不是套用前述BP网络更新公式，而是依其思路导出自己的更新公式。

RBF网络的输出是一个实数值，用于回归预测任务，而BP网络的输出是一个向量，用于分类任务。

我们构造一个单层RBF神经网络解决异或问题，异或问题的训练集即为异或真值表5.1。

作单层RBF神经网络，如图5.5所示。
图5.5 单层RBF神经网络

图5.5 单层RBF神经网络

隐层四个点的坐标即为图5.5中的四个点，即 $\mathbf{C}_{ij}=(i,j),\,i,j \in \{0,1\}$ ，由【西瓜书式(5.19)】有
$\begin{align} \rho (\boldsymbol{x},\mathbf{C}_{ij}) & =\mathrm{e}^{-\beta {\Vert\boldsymbol{x}-\mathbf{C}_{ij} \Vert}^2 }\notag \\ & = \begin{cases} 1\, , & \qquad (\boldsymbol{x}=\mathbf{C}_{ij}) \\ \mathrm{e}^{-\beta}\ \text{或}\ \mathrm{e}^{-{2}\beta }\, , & \qquad (\boldsymbol{x}\neq \mathbf{C}_{ij}) \end{cases} \tag{5.10} \end{align}$
其中，参数 $\beta$ 采取共享方式。若以式(5.10)的值表示亮度，则取足够大的 $\beta$ ，使得 $\mathrm{e}^{-\beta}< \frac{1}{2}$ ，表示“灯暗”。

再设隐层两白圈至输出结点的权重为1，两灰圈至输出结点的权重为0，则由【西瓜书式(5.18)】，该RBF的输出为
$\begin{align} \varphi (\boldsymbol{x}) = \begin{cases} 1+\mathrm{e}^{-{2} \beta}\, , & \qquad (\text{白灯亮时}) \\ 2\mathrm{e}^{-\beta}\, , & \qquad (\text{灰灯亮时}) \end{cases} \tag{5.11} \end{align}$

再增加一阶跃函数【西瓜书图5.2(a)】变换，即 $y=\mathrm{sgn}(\varphi (\boldsymbol{x})-1)$ ，
则该网络实现了异或运算。

ART网络

ART网络已发展出一个了一个算法族，【西瓜书】对ART进行了简介，这里结合图5.6作进一步说明，以便理解如何实现“自适应谐振”的。
图5.6 ART网络（简化）

图5.6 ART网络（简化）

如图5.6所示是ART网络的简单情况，组成如下：

左则为网络部分，由两层神经元构成两个子系统：比较层 $C$ 和识别层 $R$ ；
右则为控制部分：由阈值 $\rho$ 、重置Reset和逻辑控制信号组成，其中，两个逻辑控制信号 $G_1$ 和 $G_2$ ，分别制控两个子系统；
输入层结点（向量 $\boldsymbol{x}$ 的分量）与比较层 $C$ 的神经元是一一对应的。输入层输入的向量 $\boldsymbol{x}$ 称为模式（因为ART网络初期用于模式识别，故有此名），最简单的模式为黑白图像，对应的向量就是二值向量，即分量为0或1；
比较层 $C$ 和识别层 $R$ 之间，为有向全连接，前向连接权重矩阵为 $\mathbf{W}$ ，图示的 $\boldsymbol{w}$ 代表从 $C$ 的一个神经元出发射向R所有神经元的一组射线的权重向量，后向连接权重矩阵为 $\boldsymbol{T}$ ，图示的 $\boldsymbol{t}$ 代表从 $R$ 的一个神经元出发射向 $C$ 所有神经元的一组射线的权重向量。

ART网络的功能分解：

（1）识别层 $R$ 的记忆功能： $R$ 层的每个神经元充当聚类（聚类概念请参考第9章）的一个簇中心， $K$ 个神经元代表 $K$ 个簇（类），设第 $k$ 个神经元为 $r_k$ ，如何使它代表第 $k$ 簇（类）呢？方法就是让这个神经元把第 $k$ 簇（类）中心点的向量（坐标）存起来，这里，不光是存起来，还将其作为后向连接的权重向量 $\boldsymbol{t}$ ，如图5.7所示。
图5.7中可以看出权重向量 $\boldsymbol{t}$ 是从 $r_k$ 出发的向量，故后向连接的权重向量 $\boldsymbol{t}$ 称为外星权重向量，相应地，前向连接的权重向量 $\boldsymbol{w}$ 称为内星权重向量。
图5.7 识别层R神经元的记忆

图5.7 识别层R神经元的记忆

（2）识别层 $R$ 的识别功能： $R$ 层可以用一个前馈神经网络来实现，即对一个输入模式 $\boldsymbol{x}$ ，该层通过竞争产生一个响应结点 $r_k$ ，说明输入模式 $\boldsymbol{x}$ “疑似”属于结点 $r_k$ ，再交由比较层决策。

（3）识别层 $R$ 的学新功能：当输入模式 $\boldsymbol{x}$ 不能归入R的任一簇（类）中时，该层产生一个新结点，作为一个新的簇（类）。通过这种方法 $R$ 层“不忘旧知识，学习新知识”。

（4）比较层 $C$ 的比较功能：针对上述“疑似”情况，计算 $\boldsymbol{x}$ 与结点 $r_k$ （后向连接权重向量 $\boldsymbol{t}$ ）的相似度，当相似度超过阈值 $\rho$ 时，认为该输入模式 $\boldsymbol{x}$ 属于结点 $r_k$ 。

（5）优化功能：当比较层 $C$ 认为输入模式 $\boldsymbol{x}$ 属于结点 $r_k$ 时，调整该结点 $r_k$ 的前向连接权重向量 $\boldsymbol{w}$ 和后向连接权重向量 $\boldsymbol{t}$ ，使该输入模式 $\boldsymbol{x}$ 和该结点 $r_k$ 间更适配，即 $\boldsymbol{x}$ 更易激活该结点 $r_k$ ，并获得更高的相似度，其几何解释为：簇（类） $r_k$ 由于 $\boldsymbol{x}$ 的加入，其重心会向 $\boldsymbol{x}$ 稍作偏移。两组权重同时调整，故为“谐振”。

（6）控制功能：逻辑控制信号 $G_1$ 控制网络的运行阶段，当 $G_1=1$ 指示比较层让道，让输入模式 $\boldsymbol{x}$ 直接通过，以便实现上述（1），当（1）完成后，调整 $G_1=0$ 完成网络的后续功能。下一次输入前再设 $G_1=1$ 。信号 $G_2=0$ 针对识别层控制：当输入 $\boldsymbol{x}=0$ 时，它与任意向量 $\boldsymbol{w}$ 的内积都为0，产生不了竞争胜出结点，这种特殊情况由信号 $G_2=0$ 指定某结点胜出。

有了上述功能分解，就可以得到ART网络的运行流程，原理如下（略去表达式）：

（1）网络初始化：主要是初始化识别层各结点的前向连接权重向量 $\boldsymbol{w}$ 和后向连接权重向量 $\boldsymbol{t}$ ，以及阈值 $\rho$ 及逻辑控制信号 $G_1$ 和 $G_2$ ；

（2）输入新 $\boldsymbol{x}$ ：此时 $G_1=1$ ，故模式 $\boldsymbol{x}$ 直接穿过比较层 $C$ ，经 $\mathbf{W}$ 到达识别层 $R$ ；

（3）产生响应结点 $r_k$ ：即上述识别层 $R$ 的识别功能，并置 $G_1=0$ ；

（4）比较：即上述比较层 $C$ 的比较功能，当认为该输入模式 $\boldsymbol{x}$ 属于结点 $r_k$ ，转入（7），否则：

（5）重置Reset：取消对 $\boldsymbol{x}$ 的识别结果，恢复 $G_1=1$ ，返回（2）进行重新识别，此时，将上轮的“疑似”结点排除在识别范围之外，重新识别的结果实际上是上轮的第2名结点（“次疑似”结点）胜出，若存在该胜出结点，则转入（7），否则：

（6） $R$ 增加新结点：当（5）的识别范围为空时转入此步，实现上述识别层 $R$ 的学新功能；

（7）优化网络：上述优化功能起作用；

（8）至此，已完成了一个样本 $\boldsymbol{x}$ 的学习，以此为基础可以输入下一个模式 $\boldsymbol{x}$ ：置 $G_1=0$ ，返回（2）学习新样本，此循环可以不断地学习。

本文为原创，您可以：

点赞（支持博主）
收藏（待以后看）
转发（他考研或学习，正需要）
评论（或讨论）
引用（支持原创）
不侵权

上一篇：5.1 误差逆传播算法（BP算法）
下一篇：5.3 SOW网络（“灯阵”面板）、Elman网络（将训练集转化时序数据）、Boltzmann机（达到Boltzmann分布）

猜你喜欢

Elasticsearch 6.x版本全文检索学习之分布式特性介绍
分布式全局ID的几种生成方案
手机上有没有同步记事本？
【Codeforces Round #459 (Div. 2) C】The Monster
Web前端开发JavaScript提高
MySQL优化union查询
SAP Commerce Cloud 的 Simple Responsive Banner Component
UITableView详解
2-1 Add Two Polynomials
android 常用JVM配置参数
LeetCode（41）：缺失的第一个正数
玩转华为数据中心交换机系列 | 配置基于VLAN的VLAN Mapping（2 to 2）

相关主题

机器学习基础
机器学习笔记
机器学习A
机器学习-目录
机器学习-随机森林
[机器学习] 集成学习
机器学习的基本概念
机器学习和统计学习
机器学习_knn算法_2
机器学习之深度学习
李宏毅机器学习
机器学习的原理
Python 7步机器学习
机器学习之感知机
机器学习之数学基础
机器学习之K-means算法
机器数

zl程序教程

当前栏目

（《机器学习》完整版系列）第5章神经网络——5.2 RBF网络（单层RBF就可解决异或问题）与ART网络（实现“自适应谐振”）

RBF网络

ART网络

相关文章

当前栏目

（《机器学习》完整版系列）第5章 神经网络——5.2 RBF网络（单层RBF就可解决异或问题）与ART网络（实现“自适应谐振”）

RBF网络

ART网络

相关文章

（《机器学习》完整版系列）第5章神经网络——5.2 RBF网络（单层RBF就可解决异或问题）与ART网络（实现“自适应谐振”）