您现在的位置是：首页 > 其他

当前栏目

聚类算法实现流程

流程算法实现聚类

2023-09-11 14:15:15 时间

聚类算法实现流程

k-means其实包含两层内容：

K : 初始中心点个数（计划聚类数）
means：求中心点到其他数据点距离的平均值

1 k-means聚类步骤

1、随机设置K个特征空间内的点作为初始的聚类中心
2、对于其他每个点计算到K个中心的距离，未知的点选择最近的一个聚类中心点作为标记类别
3、接着对着标记的聚类中心之后，重新计算出每个聚类的新中心点（平均值）
4、如果计算得出的新中心点与原中心点一样（质心不再移动），那么结束，否则重新进行第二步过程

通过下图解释实现流程：

k聚类动态效果图

2 案例练习

案例：【选取15个点】

1、随机设置K个特征空间内的点作为初始的聚类中心（本案例中设置p1和p2）

2、对于其他每个点计算到K个中心的距离，未知的点选择最近的一个聚类中心点作为标记类别

3、接着对着标记的聚类中心之后，重新计算出每个聚类的新中心点（平均值）

4、如果计算得出的新中心点与原中心点一样（质心不再移动），那么结束，否则重新进行第二步过程【经过判断，需要重复上述步骤，开始新一轮迭代】

5、当每次迭代结果不变时，认为算法收敛，聚类完成，K-Means一定会停下，不可能陷入一直选质心的过程。

3 小结

流程:

事先确定常数K，常数K意味着最终的聚类类别数;
首先随机选定初始点为质心，并通过计算每一个样本与质心之间的相似度(这里为欧式距离)，将样本点归到最相似的类中，
接着，重新计算每个类的质心(即为类中心)，重复这样的过程，直到质心不再改变，
最终就确定了每个样本所属的类别以及每个类的质心。

注意:

由于每次都要计算所有的样本与每一个质心之间的相似度，故在大规模的数据集上，K-Means算法的收敛速度比较慢。

猜你喜欢

python数字图像处理---噪声的应用
8. 使用JMeter连接EMQ进行万级客户端连接测试
Spring Boot 优雅的配置拦截器方式
多版本 python3 pip安装模块
Codeforces Round #783 (Div. 2) C. Make it Increasing
中国黑客瞄准萨德，对韩国军方网站“狂轰乱炸”
美行四维图新导航地图可以升级了！！
《手把手教你学C语言》学习笔记（2）---学习C语言的目标和方法
PostgreSql中COPY的用法
《JavaScript开发框架权威指南》——1.2　配置Bower
计算机等级考试二级C语言上机题集（第6~10套）
英语应用文写作之投诉信_抱怨信
Allegro快速编辑丝印文字操作指导
vue-cli 和 vite 全局变量定义和使用
玩转gRPC—深入概念与原理
高速PCB设计指南系列(五)
mysql 计算日期为当年第几季度
react 后台（一）react + redux + react-route + webpack+ axios + antd+styled-components（替代less）
正则表达式
技术分享 | 代码覆盖率集成
如何使用 Django中的 get_queryset, get_context_data和 get_object 等方法
《惢客创业日记》2019.11.28（周四）近者悦，远者来

相关主题

SQL流程控制
算法-排序算法
算法-贪心算法
流程控制-if
微信公众号开发流程
Go-流程控制
算法 - KMP算法
算法_贪心算法
从架构到流程
Struts2流程
排序算法-算法
算法-递归算法

zl程序教程

当前栏目

聚类算法实现流程

聚类算法实现流程

1 k-means聚类步骤

2 案例练习

3 小结

相关文章