基于蜣螂算法优化Kmeans图像分割-附代码
基于蜣螂优化Kmeans图像分割算法 - 附代码
摘要:基于蜣螂优化Kmeans图像分割算法。
1.Kmeans原理
K-Means算法是一种无监督分类算法,假设有无标签数据集:
X
=
[
x
1
,
x
2
,
.
.
.
,
x
n
]
(1)
X = [x_1,x_2,...,x_n] \tag{1}
X=[x1,x2,...,xn](1)
该算法的任务是将数据集聚类成
k
k
k簇
C
=
C
1
,
C
2
,
.
.
.
,
C
k
C = C_1,C2,...,C_k
C=C1,C2,...,Ck,最小化损失函数为:
E
=
∑
i
=
1
k
∑
x
∈
C
i
∣
∣
x
−
u
i
∣
∣
2
(2)
E = \sum_{i=1}^k\sum_{x\in C_i}||x-u_i||^2 \tag{2}
E=i=1∑kx∈Ci∑∣∣x−ui∣∣2(2)
其中
u
i
u_i
ui为簇的中心点:
u
i
=
1
∣
C
i
∣
∑
x
∈
C
i
x
(3)
u_i = \frac{1}{|C_i|}\sum_{x\in C_i}x \tag{3}
ui=∣Ci∣1x∈Ci∑x(3)
要找到以上问题的最优解需要遍历所有可能的簇划分,K-Mmeans算法使用贪心策略求得一个近似解,具体步骤如下:
1.在样本中随机选取 k k k个样本点充当各个簇的中心点 { u 1 , u 2 , . . . , u k } \{u_1,u_2,...,u_k\} {u1,u2,...,uk}
2.计算所有样本点与各个簇中心之间的距离 d i s t ( x i , u j ) dist(x_i,u_j) dist(xi,uj),然后把样本点划入最近的簇中 x i ∈ u n e a r e s t x_i \in u_{nearest} xi∈unearest
3.根据簇中已有的样本点,重新计算簇中心
u
i
=
1
∣
C
i
∣
∑
x
∈
C
i
x
u_i = \frac{1}{|C_i|}\sum_{x\in C_i}x
ui=∣Ci∣1x∈Ci∑x
4.重复2、3
K-means算法得到的聚类结果严重依赖与初始簇中心的选择,如果初始簇中心选择不好,就会陷入局部最优解.因此初始簇中心的选择非常重要。本文利用蜣螂优化算法对初始簇中心进行优化,改进其容易陷入局部最优的特点。
2.基于蜣螂算法的Kmeans聚类
蜣螂算法的具体原理参考博客:https://blog.csdn.net/u011835903/article/details/128280084
适应度函数:利用蜣螂算法改进kmeans时,以聚类中心作为蜣螂算法的优化变量,适应度函数设计如下:
f
i
t
n
e
s
s
=
∑
i
=
1
k
∑
x
∈
C
i
∣
∣
x
−
u
i
∣
∣
2
fitness = \sum_{i=1}^k\sum_{x\in C_i}||x-u_i||^2
fitness=i=1∑kx∈Ci∑∣∣x−ui∣∣2
该适应度函数与kmeans的最小损失函数一致。
算法的具体流程如下:
1.随机抽样待分类数据点,作为蜣螂聚类候选点。
2.利用蜣螂算法搜索最小损失的的聚类点。
3.将这些聚类点作为kmeans算法的初始聚类点。
4.利用kmeans获得最终的聚类点。
3.算法实验结果
将基于蜣螂优化的Kmeans算法用于图像的分割实验。对于图像,选取10%的像素点作为聚类候选点。
对于彩色图像的聚类效果如下图所示:
收敛曲线:
4.Matlab代码
相关文章
- 图神经网络发Nature子刊,却被爆比普通算法慢104倍,质疑者:灌水新高度?
- 平均每天只写 7 行代码:一算法工程师被开除
- NSGA2算法中拥挤度计算代码[通俗易懂]
- 基于近邻的协同过滤算法
- 实时系统动态内存算法分析dsa(二)——TLSF代码分析
- 阶乘算法挑战「建议收藏」
- fastRcNN算法路面病害检测_R语言经典算法
- 秀到起飞!LeetCode官方推出算法面试指导手册(代码版)限时开源
- Java大数运算_floyd算法时间复杂度
- PID算法详解[通俗易懂]
- 数据分享|R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病|附代码数据
- ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测|附代码数据
- 谈谈虚拟DOM,Diff算法与Key机制
- 特定领域知识图谱融合方案:技术知识前置【一】-文本匹配算法、知识融合学术界方案、知识融合
- R语言使用随机技术差分进化算法优化的Nelson-Siegel-Svensson模型|附代码数据
- 大数据下的高级算法:hyperloglog,统计海量数据下不同元素的个数
- KMP 算法
- 【计算理论】计算复杂性 ( 时间复杂度时间单位 : 步数 | 算法分析 | 算法复杂性分析 )
- 查找算法的实现(C/C++实现)详解编程语言
- 算法练习之二叉树的最小深度,路径总和详解编程语言
- php读取30天之内的根据算法排序的代码
- 基于php冒泡排序算法的深入理解
- floyd算法实现思路及实例代码
- c#获取相同概率随机数的算法代码
- python快速查找算法应用实例