zl程序教程

您现在的位置是:首页 >  工具

当前栏目

数学建模学习(57):K-Means聚类原理分析讲解与应用

建模应用学习原理 分析 讲解 数学 聚类
2023-09-14 09:05:40 时间

算法原理

K -Means算法的工作原理:首先随机从数据集中选取K个点,每个点初始地代表每个簇的聚类中心,然后计算剩余各个样本到聚类中心的距离﹐将它赋给最近的簇﹐接着重新计算每簇的平均值﹐整个过程不断重复,如果相邻两次调整没有明显变化,说明数据聚类形成的簇已经收敛。本算法的一个特点是在每次迭代中都要考察每个样本的分类是否正确。若不正确﹐就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代。这个过程将不断重复直到满足某个终止条件,终止条件可以是以下任何一个:

  • 没有对象被重新分配给不同的聚类。
  • 聚类中心不再发生变化。
  • 误差平方和局部最小。

K- Means算法步骤

  • 从N个数据对象任意选择K个对象作为初始聚类中心。
  • 循环③到④直到每个聚类不再发生变化为止。
  • 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分。
  • 重新计算每个聚类的均值(中心对象),直到聚类中心不再变化。这种划分使得下式最小:
    在这里插入图片描述

K- Means算法特点

  • 在K - Means算法中K是事先给定的,这个K值的选定是非常难以估计的。
  • 在K-Means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。
  • K-Means算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。
  • K-Means算法对一些离散点和初始K值敏感,不同的距离初始值对同样的数据样本可能得到不同的结果。

K- Means算法应