您现在的位置是：首页 > 后端

当前栏目

基于哈里斯鹰算法的极限学习机(ELM)分类算法-附代码

算法代码基于分类极限学习机

2023-09-14 09:06:11 时间

基于哈里斯鹰算法的极限学习机(ELM)分类算法

文章目录

基于哈里斯鹰算法的极限学习机(ELM)分类算法

摘要：本文利用哈里斯鹰算法对极限学习机进行优化，并用于分类问题

1.极限学习机原理概述

典型的单隐含层前馈神经网络结构如图1 所示，由输入层、隐含层和输出层组成，输入层与隐含层、隐含层与输出层神经元间全连接。其中，输入层有 n 个神经元，对应 n 个输入变量，隐含层有 l个神经元；输出层有 m 个神经元，对应 m 个输出变量。为不失一般性，设输入层与隐含层间的连接权值 w 为:
$=\left[\begin{matrix}w_{11}&w_{12}&...&w_{1,n}\\ w_{21}&w_{22}&...&w_{2n}\\ ...\\ w_{l1}&w_{l2}&...&w_{ln} \end{matrix}\right]\tag{1}$
其中， $w_n$ 表示输入层第 $i$ 个神经元与隐含层第 $j$ 个神经元间的连接权值。

设隐含层与输出层间的连接权值，为 $\beta$ :
$\beta =\left[\begin{matrix} \beta_{11}&\beta_{12}&...&\beta_{1m}\\ \beta_{21}&\beta_{22}&...&\beta_{2m}\\ ...\\ \beta_{l1}&\beta_{l2}&...&\beta_{lm} \end{matrix}\right] \tag{2}$
其中，自 $\beta_{jk}$ 表示隐含层第 j 个神经元与输出层第 k个神经元间的连接权值。

设隐含层神经元的阈值值 b 为：
$=\left[\begin{matrix}b_1\\ b_2\\ ...\\ b_l \end{matrix}\right]\tag{3}$
设具有 Q 个样本的训练集输入矩阵 X 和输出矩阵 Y 分别为
$=\left[\begin{matrix}x_{11}&x_{12}&...&x_{1Q}\\ x_{21}&x_{22}&...&x_{2Q}\\ ...\\ x_{n1}&x_{n2}&...&x_{nQ} \end{matrix}\right]\tag{4}$

$KaTeX parse error: Undefined control sequence: \matrix at position 11: Y =\left[\̲m̲a̲t̲r̲i̲x̲{y_{11},y_{12},…$

设隐含层神经元的激活函数为 g(x)，则由图1 可得，网络的输出 T 为:
$[t_1,..,t_Q]_{m*Q},t_j = [t_{1j},...,t_{mj}]^T =\left[\begin{matrix}\sum_{i=1}^t\beta_{i1}g(w_ix_j + b_i)\\ \sum_{i=1}^t\beta_{i2}g(w_ix_j + b_i)\\ ...\\ \sum_{i=1}^t\beta_{im}g(w_ix_j + b_i) \end{matrix}\right]_{m*1},(j=1,2,...,Q)\tag{6}$
式(6)可表示为：
$H\beta = T’ \tag{7}$
其中， T’为矩阵 T 的转置； H 称为神经网络的隐含层输出矩阵，具体形式如下：
$H(w_1,...,w_i,b_1,...,b_l,x_1,...,x_Q) =\left[\begin{matrix} g(w_1*x_1 + b_1)&g(w_2*x_1 + b_2)&...&g(w_l*x_1 + b_l)\\ g(w_1*x_2 + b_1)&g(w_2*x_2 + b_2)&...&g(w_l*x_2 + b_l)\\ ...\\ g(w_1*x_Q + b_1)&g(w_2*x_Q + b_2)&...&g(w_l*x_Q + b_l) \end{matrix}\right]_{Q*l}$

2.ELM学习算法

由前文分析可知，ELM在训练之前可以随机产生 w 和 b ，只需确定隐含层神经元个数及隐含层和神经元的激活函数（无限可微），即可计算出 $\beta$ 。具体地， ELM 的学习算法主要有以下几个步骤：

（1）确定隐含层神经元个数，随机设定输入层与隐含层间的连接权值 w 和隐含层神经元的偏置 b ;

（2）选择一个无限可微的函数作为隐含层神经元的激活函数，进而计算隐含层输出矩阵 H ;

（3）计算输出层权值： $\beta = H^+T'$

值得一提的是，相关研究结果表明，在 ELM 中不仅许多非线性激活函数都可以使用（如 S 型函数、正弦函数和复合函数等)，还可以使用不可微函数，甚至可以使用不连续的函数作为激活函数。

3.分类问题

本文对乳腺肿瘤数据进行分类。采用随机法产生训练集和测试集，其中训练集包含 500 个样本，测试集包含 69 个样本。

4.基于哈里斯鹰算法优化的ELM

哈里斯鹰算法的具体原理参考博客：https://blog.csdn.net/u011835903/article/details/108528147

由前文可知，ELM的初始权值和阈值都是随机产生。每次产生的初始权值和阈值具有满目性。本文利用哈里斯鹰算法对初始权值和阈值进行优化。适应度函数设计为训练集的错误率与测试集的错误率的和，以期望使训练得到的网络在测试集和训练集上均有较好的结果:
$f i t n ess = a r g min (T r ain E rror R a t e + T es tE rror R a t e) 。$

5.测试结果

哈里斯鹰算法相关参数如下：

%训练数据相关尺寸
R = size(Pn_train,1);
S = size(Tn_train,1);
N = 20;%隐含层个数
%% 定义哈里斯鹰优化参数
pop=20; %种群数量
Max_iteration=50; %  设定最大迭代次数
dim = N*R + N*S;%维度，即权值与阈值的个数
lb = [-1.*ones(1,N*R),zeros(1,N*S)];%下边界
ub = [ones(1,N*R),ones(1,N*S)];%上边界

将经过哈里斯鹰优化后的SSA-ELM与基础ELM进行对比。

预测结果如下图

哈里斯鹰收敛曲线如下：

在这里插入图片描述

数据结果如下：

哈里斯鹰优化ELM结果展示：----------------
训练集正确率Accuracy = 98.2%(491/500)
测试集正确率Accuracy = 100%(69/69)
病例总数：569 良性：357 恶性：212
训练集病例总数：500 良性：316 恶性：184
测试集病例总数：69 良性：41 恶性：28
良性乳腺肿瘤确诊：41 误诊：0 确诊率p1=100%
恶性乳腺肿瘤确诊：28 误诊：0 确诊率p2=100%
传统ELM结果展示：----------------
训练集正确率Accuracy = 90.2%(451/500)
测试集正确率Accuracy = 84.058%(58/69)
病例总数：569 良性：357 恶性：212
训练集病例总数：500 良性：316 恶性：184
测试集病例总数：69 良性：41 恶性：28
良性乳腺肿瘤确诊：37 误诊：4 确诊率p1=90.2439%
恶性乳腺肿瘤确诊：21 误诊：7 确诊率p2=75%

从上述数据可以看出，哈里斯鹰-ELM训练得到的网络，无论是在测试集和训练集上的正确率均高于基础ELM训练得到的网络。哈里斯鹰-ELM具有较好的性能。

6.参考文献

书籍《MATLAB神经网络43个案例分析》

7.Matlab代码

猜你喜欢

英特尔测试完成以现有硅基半导体制程生产量子运算芯片
进击的JAMStack
一个优秀的程序员应该养成哪些好的习惯？
asp实现dig功能的js代码
MySQL上机主名的意义及作用解析（mysql上机主名指什么）
动力电池的“备胎”故事：锂不够，钠来凑？
MySQL查询操作使用不等于0语句筛选数据（mysql不等于0语句）
HTTPS终于搞懂了
开启Linux音频体验：建立你的音频库（linux音频库）
库高性能运行 Oracle数据库一个月高性能运行记录（oracle一个月的数据）
Oracle中按字段去重实现数据整理（oracle中按字段剔重）
iOS实现漂亮的时钟代码详解手机开发
Linux的发展之路：从分支到主干（linux的分支）
在VUE项目中添加使用SkeyeWebPlayer.js直播点播H5免费播放器
JMeter 扩展开发：BeanShell 数据模拟实现及性能探讨
关于微信小游戏代码授权的理解
博客云服务器迁移备忘录
树莓派使用入门：在树莓派上使用 Mathematica 进行高级数学运算
分布式基础篇-docker安装mysql和redis
ucosii操作系统和linux,请高手介绍下uCOSII和Linux的差异？
Oracle中使用运算符的应用示例（oracle 运算符）
点对点通信-简介

相关主题

冒泡算法
平衡树算法
机器学习——EM算法
机器学习算法分类
前向算法
01d-1: 算法分析
算法-递归算法

zl程序教程