您现在的位置是：首页 > 后端

当前栏目

AdaBoost算法学习笔记

算法笔记学习 AdaBoost

2023-09-14 09:06:54 时间

AdaBoost算法

前面我介绍了提升方法，但是没有具体的介绍其中的某一种算法，下面，就介绍提升方法中一种典型的算法AdaBoost.

之前讲过提升方法需要完成两个目标，一是在每一轮训练中如何改变训练数据的权值或概率分布。二是如何将弱分类器线性组合成一个强分类器。
AdaBoost对于第一个问题，对于前一轮错误分类的样本改变它的权值在下一轮训练中被更加关注，对于第二个问题，使分类错误率更小的分类器有更大的权值。

下面就详细介绍一下它的算法实现

首先，有一个大小为N的训练数据集，即这个训练数据集有N个样本，按照之前所说的，我们先给这个数据集的每一个样本设置一个权值，这个权值决定这个样本在下一轮分类器的训练中的关注度。因为第一轮是首轮，所以每一样本应该被平等对待，即每个样本对应的权值为1/N.

上面应该有一个疑惑，这个权值决定这个样本训练中的重要性，那么怎么体现的呢？又依据什么去改变权值呢？
其实这些都是依据分类误差率来决定的，这个分类误差率是我们自定义的，如下式
在这里插入图片描述
对于上面这个式子，解释一下，我们针对每一轮的分类器的训练准则就是误差率尽量小，现在，我们定义的误差率是上式显示的误差计算公式，你会发现误差率仍然由每一个样本决定，分类错误的越多误差越大，但是我们加入了一个权重W，在W，这是你会发现，如果，某一个样本对应的权值W很大，那么它如果被错误分类了，误差率增大的幅度会很大，所以通过重新定义误差率公式，我们就能利用每一个样本的权值W去决定那个样本在下一轮训练中的关注度，其对应的W越大越被关注。
那么提升方法第一问题解决了，第二个问题呢？
给出下面的公式
在这里插入图片描述
a是什么，a就是我们前面提到若分类器线性组合是与其相乘的权重，它决定了这个弱分类器在组合强分类器时发挥的重要性程度，从上面的式子其实可以看出，分类误差率越小，a就越大。G(x)也就是我们最终学习的强分类器。还有最后一个问题，权值决定每个样本关注度的权值怎么更新？
下面给出公式，至于这个公式怎么来的，有些复杂，这里就不解释了
在这里插入图片描述
m+1，表示训练的是第m+1轮，即第m+1个弱分类器，i表示这个权值对应的是序号为i的样本。

猜你喜欢

HTML <blockquote> 标签
MySQL中使用变量进行数据插入（c mysql插入变量）
为什么MySQL不推荐使用关联查询（mysql不建议关联查询）
Redis集群写入数据失败探索原因与解决之道（redis集群写数据失败）
Oracle函数A带来的改变（oracle 函数a.）
快速上手：使用C语言与MySQL进行数据添加（cmysql添加数据）
分析 MSSQL 中的临时表（临时表 mssql）
微软开始在Windows 10上弹出更多EDGE广告诱导用户设置为默认浏览器
解决Linux下没有SCP的问题（linux没有scp）
给 Java 开发者的 10 个大数据工具和框架详解编程语言
探索UIO Linux，了解更多关于Linux系统的新技术（uiolinux）
从Redis压缩到列表优化性能体验（压缩列表 redis）
使用MSSQL连接网络服务器的简单指南（mssql链接网络服务器）
cocos2dx-lua对图片进行九宫格缩放
基于Android扫描sd卡与系统文件的介绍
初次接触Linux？学习使用grep命令吧（greplinux命令）
Farrago for Mac(音频编辑软件)

相关主题

决策树算法
KNN算法
Floyd算法
机器学习之KNN算法
笔记笔记笔记
算法-索引
DBSCAN算法

zl程序教程

当前栏目

AdaBoost算法学习笔记

AdaBoost算法

相关文章