机器学习-无监督学习-聚类:聚类方法(五)--- 均值漂移聚类
2023-09-27 14:20:37 时间
均值漂移聚类是基于滑动窗口的算法,来找到数据点的密集区域。这是一个基于质心的算法,通过将中心点的候选点更新为滑动窗口内点的均值来完成,来定位每个组/类的中心点。然后对这些候选窗口进行相似窗口进行去除,最终形成中心点集及相应的分组。
具体步骤:
- 确定滑动窗口半径r,以随机选取的中心点C半径为r的圆形滑动窗口开始滑动。均值漂移类似一种爬山算法,在每一次迭代中向密度更高的区域移动,直到收敛。
- 每一次滑动到新的区域,计算滑动窗口内的均值来作为中心点,滑动窗口内的点的数量为窗口内的密度。在每一次移动中,窗口会想密度更高的区域移动。
- 移动窗口,计算窗口内的中心点以及窗口内的密度,知道没有方向在窗口内可以容纳更多的点,即一直移动到圆内密度不再增加为止。
- 步骤一到三会产生很多个滑动窗口,当多个滑动窗口重叠时,保留包含最多点的窗口,然后根据数据点所在的滑动窗口进行聚类。
下图演示了均值漂移聚类的计算步骤:
相关文章
- Spark2.0机器学习系列之8:多类分类问题(方法归总和分类结果评估)
- 让机器有温度:带你了解文本情感分析的两种模型
- 机器学习笔记四-----------------Prophet(时间序列模型)的校验方法及调参方法
- 机器学习笔记二-----------------Prophet(时间序列模型)的复杂例程笔记及给jupyter添加多个python版本的kernel的方法
- 机器学习四种调参方法总结
- 机器学习-有监督学习-集成学习方法(一):集成(Ensemble)学习方法综述【Bootstrap(Bagging装袋、Boosting提升)、Stacking堆叠、Blending融合】
- 机器学习-降维方法-无监督学习:PCA算法(主成分分析)【计算协方差矩阵X^TX的特征值与特征向量W(特征向量W控制旋转、特征值控制尺度)->特征向量W作为投影矩阵->将样本X通过W投影进行降维】
- 机器学习-无监督学习-聚类:聚类方法(四)--- 层次聚类算法
- 如何用机器学习方法,提升另一半的满意指数?
- Jmeter 多台机器产生负载及问题解决方法
- 机器学习笔记之Jupyter Notebook各种使用方法
- 机器学习算法究竟是什么?
- [转载]机器学习优化方法总结:SGD,Momentum,AdaGrad,RMSProp,Adam
- OpenPower机器上面搭建RabbitMQ 以及简单进行用户配置的方法
- 非平衡数据集的机器学习常用处理方法
- MTK机器原始OTA更新方法
- 当空间数据遇上机器学习,城市的颜值有了新的度量方法