您现在的位置是：首页 > 工具

当前栏目

数学建模学习（57）：K-Means聚类原理分析讲解与应用

建模应用学习原理分析讲解数学聚类

2023-09-14 09:05:40 时间

算法原理

K -Means算法的工作原理:首先随机从数据集中选取K个点,每个点初始地代表每个簇的聚类中心,然后计算剩余各个样本到聚类中心的距离﹐将它赋给最近的簇﹐接着重新计算每簇的平均值﹐整个过程不断重复,如果相邻两次调整没有明显变化,说明数据聚类形成的簇已经收敛。本算法的一个特点是在每次迭代中都要考察每个样本的分类是否正确。若不正确﹐就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代。这个过程将不断重复直到满足某个终止条件,终止条件可以是以下任何一个:

没有对象被重新分配给不同的聚类。
聚类中心不再发生变化。
误差平方和局部最小。

K- Means算法步骤

从N个数据对象任意选择K个对象作为初始聚类中心。
循环③到④直到每个聚类不再发生变化为止。
根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分。
重新计算每个聚类的均值(中心对象),直到聚类中心不再变化。这种划分使得下式最小:

K- Means算法特点

在K - Means算法中K是事先给定的,这个K值的选定是非常难以估计的。
在K-Means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。
K-Means算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。
K-Means算法对一些离散点和初始K值敏感,不同的距离初始值对同样的数据样本可能得到不同的结果。

K- Means算法应

猜你喜欢

WiFi6介绍「建议收藏」
Mongodb: 处理大文件需注意的问题及解决方法（mongodb大文件）
油箱表成“欢乐表” 愁坏车主！沃尔沃召回S60、S90轿车
MariaDB 备份与日志管理
的涂抹MySQL: 新时代的数据库解决方案（涂抹mysql）
google软件测试之道_gtest测试框架
处理MySQL事务嵌套处理：深入探索（mysql事务嵌套）
为 64 位版本的 Android Studio 和 Android 模拟器做好准备
公有云攻防系列——云服务利用篇
机器学习算法（一）: 基于逻辑回归的分类预测
命令Linux下Tee命令使用实例分享（linux下tee）
全球化思考:怎样克服交流中的文化差异
【Android NDK 开发】JNI 方法解析 ( JNIEnv *env 参数 )

相关主题

建模工具
5G信道建模
建模
UML建模图
研究生数学建模
数学建模笔记
Blender 建模
数学建模
数据仓库建模
对关系建模