机器学习算法一之基于K均值聚类算法实现数据聚类及二维图像像素分割
2023-09-14 09:14:39 时间
K均值聚类算法
1.含义及原理
K均值(k-means)聚类算法,顾名思义首先给定K个初始均值作为聚类中心,然后通过分析其他n-k个点同K个聚类中心的距离进行分类,然后对集群求取新的均值作为聚类中心,由此迭代,知道K个不同类别之间的类间距离满足设定阈值条件为止,可应用于一维数据分析和语义分割场景
算法原理及过程:
输入:n个样本的集合
输出:样本集合的聚类
过程:
(1)初始化。随机选择k的样本作为初始聚类的中心。
(2)对样本进行聚类。针对初始化时选择的聚类中心,计算所有样本到每个中心的距离,默认欧式距离,将每个样本聚集到与其最近的中心的类中,构成聚类结果。
(3)计算聚类后的类中心,计算每个类的质心,即每个类中样本的均值,作为新的类中心。
(4)然后重新执行步骤(2)(3),直到聚类结果不再发生改变。
K均值聚类算法的时间复杂度是O(nmk),n表示样本个数,m表示样本维数,k表示类别个数。
2.一维数据进行K均值聚类处理
来自百度百科:
相关文章
- 机器学习十大经典算法之决策树
- 8个常见的机器学习算法的计算复杂度总结
- 机器学习十大经典算法入门[通俗易懂]
- 简单易学的机器学习算法——Mean Shift聚类算法
- 机器学习之朴素贝叶斯分类算法
- 8个常见的机器学习算法的计算复杂度总结
- 机器学习算法: AdaBoost 详解
- 机器学习_knn算法_2
- Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告
- 机器学习算法:K-NN(K近邻)
- 机器学习经典算法:决策树(2)
- 机器学习(五):机器学习算法分类
- 机器学习算法: AdaBoost 详解
- 《机器学习十大经典算法》报告邀请
- A.机器学习算法入门教程(一): 基于逻辑回归的分类预测
- A.机器学习入门算法(四): 基于支持向量机的分类预测
- A.机器学习入门算法(九): 基于线性判别模型的LDA手写数字分类识别
- A.机器学习入门算法(六)基于天气数据集的XGBoost分类预测
- 【干货书】时间序列算法导论:使用Python实现机器学习和深度学习技术
- MIT研发脑控机器人,全新机器学习算法识别脑波只需10ms