您现在的位置是：首页 > 其他

当前栏目

k-means学习笔记

算法计算笔记学习

2023-04-18 15:28:08 时间

算法思想

k-means算法是一种聚类分析算法，通过不断地迭代求解实现对样本的分类，其中k代表的是样本的类别数。k-means对样本按相似性进行分簇，其基本思想是让簇内的样本点更“紧密”一些，也就是说，让每个样本点到本簇中心的距离更近一些。

算法步骤

随机产生k个初始簇中心（或者随机选择k个点作为初始簇中心）；
对每个点，计算与所有簇中心的距离，将其分配到最近的簇；
如果没有点发生分配结果的改变，则结束，否则继续下一步；
计算每个簇中所有点坐标的平均值，找到新的簇中心；
回到第二步。

注意

常用欧式距离作为距离的度量，在计算距离前可以先进行标准化操作。
算法的优化目标是使每个样本点到本簇中心的距离的平方和尽量小。
每个样本点到本簇中心的距离的平方和也称为误差平方和（SSE），在优化算法中称为损失函数或代价函数。

算法优缺点

优势

简单，快速，适合常规数据集。

劣势

不同的初始点对结果的影响非常大；
k值难确定，普遍情况下需要多次设置k值来比较；
复杂与样本数呈线性关系;
很难发现任意形状的簇。

算法可视化演示

k-means的可视化演示

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程