您现在的位置是：首页 > 硬件

当前栏目

机器学习技法总结（一）：支持向量机（linear support vector machine，dual support vector machine）

机器学习总结支持向量 vector support MACHINE

2023-09-27 14:20:30 时间

第一阶段技法：

large margin (the relationship between large marin and regularization)， hard-SVM，soft-SVM，dual problem(解对偶问题)，kernel trick，kernel logistic regression，

主要思路是：（这里不区分线性与非线性，差别只是特征空间转换，X空间与Z空间的关系）

1. 从PLA出发，对于二维平面的二分类问题，PLA可能得出一堆能够正确分类的直线，但是哪一条直线会是最好的呢？我们应当如何评价分类的好坏呢？从而导出了large margin 和 support vector的概念。

具有large margin的那条直线具有更好的抗干扰能力，鲁棒性好。而影响margin大小的其实就是在fat边界上的那些数据，这些数据叫做support vector（candidate）。所以，就有了这样的一个优化目标，如何通过调节w使得margin最大。后面就是一系列的数学优化推导，最后转化为二次规划问题得到解决。

下面说明large margin背后所隐藏的一些可以解释为何large margin会“好”的原因：1）从regularization角度看，large margin所对应的优化函数，类似于加了regularizer的线性分类/回归问题，也就是说，large margin对应着regularization；

2）从VC dimension的角度来讲，large margin其实是减少了hypothesis能够shutter的dichotomy（二分类）的数量，也就是说减少了VC dimension，使得模型可以控制overfitting。

2. 我们另一个动机就是：能不能将X特征空间转化到无限维度的特征空间呢？同时为了保证Hoeffding's 不等式对VC dimension的限制及计算量上的限制，则希望转化后的Z空间的VC dimension不跟W的自由度d相关。

因此，开始研究svm的dual problem（对偶问题）。在不断的推导和求解dual support vector machine问题时，用到了著名的KKT条件：

通过上面给的推导和解释，我们可以看到，实际上W值是由on fat boundary上面的support vector线性表出的（这就是后面要讲到的表示定理）。数学的推导与理论分析都说明support vector才是主导我们进行模型选择所用到的数据。

所以，现在重新限制support vector，刚开始我们提出的边界上的data叫做support vector（candidate），而这个通过解dual问题得到的决定W的alpha不为零的data就叫做support vector。

回想PLA，类似support vector machine，这个W都是可以通过样本点线性表出的；PLA实际上是通过犯错误的点表出，而support vector machine则是通过support vector线性表出的。

这就是原始的svm和dual svm的对比。

到目前为止，我们还没有解决W的维度d和计算量的评估，下面将通过一个叫做kernel trick的方法，实现无限维度的特征转换。

猜你喜欢

js将多维数组变成一维数组
例11 整数排序
无法访问您可能没有权限使用网络资源
netty系列之:netty中的ByteBuf详解
联系的结构-深度思考
并发和Read-copy update(RCU)
使用云市场快速搭建小型电商网站
数据安全——黑客来袭，如何保护自己?
SqlServer2000+ 身份证合法校验函数
渗透脚本快速生成工具Intersect
Win64 驱动内核编程-8.内核里的其他常用
p6spy工具的使用
Unity 之性能测试UnityPerformanceReporting(UPR)的使用简介
vue项目index.html缓存
大数据项目遭遇失败的八个理由
不满足于供应商苹果开发自家蓝牙芯片
欧盟为反垄断违法行为举报者提供新工具
PHP大马后门分析
开涛spring3(4.1) - 资源之 4.1 基础知识

相关主题

机器学习简介
机器学习算法
[机器学习] 集成学习
机器学习算法分类
机器学习-视频

zl程序教程

当前栏目

机器学习技法总结（一）：支持向量机（linear support vector machine，dual support vector machine）

相关文章