您现在的位置是：首页 > 硬件

当前栏目

机器学习：在SVM中使用核函数来构造复杂的非线性决策边界

机器学习函数复杂构造 SVM 边界决策

2023-09-27 14:28:32 时间

文章目录

用核函数衡量相似度
利用相似度构建回归
关于参数

用核函数衡量相似度

起初，在逻辑回归中如果我们遇到像下图这样看起来较复杂的非线性边界：
在这里插入图片描述
显然，只用线性的 $\theta_0+\theta_1x_1+\theta_2x_2$ 无法划分这两个类别的样本，一种做法是向表达式中添加一些更高次的项，比如 $x_1^2,x_1x_2,x_1^6x_2^7$ 等等，再此基础之上进行逻辑回归。

但是，这样的高次式有无限多可能，我们没法直观地判断出到底是 $x_1^2$ 更好还是 $x_1x_2$ 更好，在特征值数目更多的情况下这样的情况会更加严重。我们需要一个更有效的构造特征值的方式。

最终，相似度脱颖而出，成为我们构造特征值的上好选择。相似度描述的是两个向量之间的接近程度，有许多种函数都可以实现这个功能。在这里，我们选用的是高斯函数，定义两个向量 $\vec{x}$ 和 $\vec{l}$ 之间的相似度为 $f=\text{similarity}(\vec{x},\vec{l})=\exp(-\frac{||\vec{x}-\vec{l}||^2}{2\sigma^2})$
这样的函数，我们就称为核函数，核函数的函数值随着周围点距离核（也就是 $\vec{l}$ ）的距离和参数 $\sigma$ 而改变。距离核越远，函数值越小，而 $\sigma$ 控制核函数的变化速率， $\sigma$ 越大，核函数的变化越平缓，反之越陡峭。
在这里插入图片描述

利用相似度构建回归

我们可以看到，通过核函数，我们就可以构造出一个圆形且从圆心向无穷远处递减的区域。如果我们将多个核函数组合在一起，就可以构造出一个复杂的非线性决策边界。那么，如何选取核函数的核呢？

一个简单的做法就是，把所有样本点都作为核，一个样本的特征值就是它与所有样本点的相似度。具体来讲，我们把一个样本向量 $\vec{x_i}$ 的特征值向量 $\vec{f_i}$ 定义为
$\vec{f_i}= \left[\begin{matrix} \text{similarity}(\vec{x_i},\vec{x_1})\\ \text{similarity}(\vec{x_i},\vec{x_2})\\ \vdots\\ \text{similarity}(\vec{x_i},\vec{x_m})\\ \end{matrix}\right]$
而我们的假设函数 $h_\theta$ 则变为 $\theta^Tf$ ，即
$\theta_0f_0+\theta_1f_1+\cdots+\theta_mf_m$
所以我们需要最小化的代价函数 $J(\theta)$ 变为
$C\sum_{i=1}^m[y^{(i)}\text{cost}_1(\theta^Tf^{(i)})+(1-y^{(i)})\text{cost}_0(\theta^Tf^{(i)})]+\frac{1}{2}\sum_{j=1}^m\theta_j^2$
看起来，似乎逻辑回归一样可以运用核函数。但根据吴恩达所说，核函数搭配逻辑回归的运算速度很慢，现有的许多优化都是针对SVM+核函数的，这两者搭配在一起才能事半功倍。

关于参数

和别的回归类似，我们可以通过控制参数来调整模型的偏差与方差， $C$ 的作用在上一篇博客已经讲过了，而核函数参数 $\sigma$ 的作用可以很容易的观察出来：当 $\sigma$ 较小时，核函数非常陡峭，只允许很小的偏差，所以是个低偏差高方差模型，反之是个高偏差低方差模型。
在这里插入图片描述

猜你喜欢

Spring DI - 依赖注入
康师傅方便面还能吃吗？—— 如何解决“土坑酸菜”现象，如何看待康师傅对食品安全的轻视问题
敏捷过程中的需求分析
使用log4j 的三种配置组合详解
MyBatisPlus（MP）学习记录（分页查询的开启+日志打印配置+乐观锁+映射匹配+字段匹配和表名匹配+null值判定+代码生成器等等）
Keepalived配置与使用--转载
【PSO识别】基于PSO粒子群的聚类图像模式识别的matlab仿真
fresco xml配置属性不起作用
我是怎么做到开源系统中的前后端连通的？
我国智慧物流发展驶入快车道
Google Earth Engine（python）——卷积神经网络第 2 部分
nuxt项目运行在ie报错
技术分享 | App测试时常用的adb命令你都掌握了哪些呢？
PHP 使用redis实现秒杀
vue 父组件如何调用子组件的函数Methods
ios NSAttributedString 具体解释
CSDN日报20170302——《一个想法：成立草根技术联盟对开发人员进行技术定级解决企业员工招聘难问题！》
python：校验邮箱格式
-第3章 jQuery方法实现下拉菜单显示和隐藏
Android入门之RatingBar（评分）
支付业务以及支付业务的质量保障

相关主题

机器学习基础
机器学习相关
机器学习——Adaboost
机器学习之深度学习
[ML] 机器学习简介

zl程序教程