您现在的位置是：首页 > 后端

当前栏目

【OpenCV-Python】教程：7-3 理解KMeans

Python Opencv 教程理解 Kmeans

2023-09-14 09:01:40 时间

OpenCV Python KMeans 的理解

【目标】

理解KMeans聚类的基础概念
KMeans是如何工作的，

【理论】

Tshirt尺寸问题

有个公司，打算投放一批T-shirt到市场上售卖，但是不知道人们需要什么样的尺寸，而且工厂也不会制作所有的尺寸样衣，所以，他们需要想办法，用尽可能少的尺寸数量满足用户需求。

在这里插入图片描述

他们把人分为小、中、大三种，只生产这三种适合所有人的型号。这种将人分成三组的方法可以通过k-means聚类来实现，算法提供了满足所有人的最佳3个大小。如果没有，公司可以把人们分成更多的小组，可能是五组，以此类推。请看下图:

在这里插入图片描述

K-Means步骤

该算法就是一个迭代更新的过程，下面将一步一步的进行介绍。以下图数据为例（可以认定为T-shirt问题，下图的数据，我们将它们聚为2类）：

在这里插入图片描述

1. 随机选择聚类中心 $C 1$ 和 $C 2$

2. 计算距离并标记

分别计算每个点到两个质心的距离，看与哪个质心更近，如果与 $C 1$ 近，则认为属于类别0 , 与 $C 2$ 近，认为属于类别 1。（此处 0,1 为设定的类别号），本例中0表示红色，1表示蓝色；

在这里插入图片描述

3. 重新计算分配

分别计算所有红色点和蓝色点的平均值，新的平均值就是新的质心，也是新的 $C 1$ 和 $C 2$

不停的进行步骤2 和步骤 3, 得到下图的结果。

在这里插入图片描述

迭代进行以上步骤后，直到两个质心都收敛到固定点（或者收敛到我们设定的值，例如最大迭代次数，达到的精度等）。简单的说，就是 $C 1 \leftrightarrow R e d P o in t s$ 与 $C 2 \leftrightarrow Bl u e P o in t s$ 距离和最小。

$\lbrack J=\sum_{AllRedPoints}{distance(C1,RedPoint)} + \sum_{AllBluePoints}{distance(C2,BluePoint)} \rbrack$

最终的效果如下：
在这里插入图片描述

这只是对KMeans的直观理解，若要理解更多的细节，请看专业的机器学习书籍。

【参考】

Understanding K-Means Clustering
Machine Learning Course, Video lectures by Prof. Andrew Ng (Some of the images are taken from this)

猜你喜欢

学习如何在MySQL数据库中建立视图。（mysql数据库建立视图）
ORA-47062: error creating Identity map for Identity string.string, Factor Link string, string already defined for operation string on string ORACLE 报错故障修复远程处理
Java面向对象3（K~O）
Oracle一个月精彩报表发布上线（oracle一个月的报表）
7b2美化-首页背景自动换图搜索框
微软 3D 视频影像技术大升级：戴上 HoloLens，像《星球大战》一样“面对面”通话
如何使用Linux函数查看系统信息（linux函数查看）
利用Oracle仓库模块实现优化管理（oracle仓库模块）
实现PHP与MongoDB的桥梁：连接数据库（php连接mongodb）
逻辑回归(Logistic Regression)详解大数据
android bioset 进程,kthrotlds(WatchDogs变种)查杀方法「建议收藏」
策略解决Redis与Java结合的过期策略问题（redisjava过期）
linux怎么退出文件编辑模式
MySQL修改删除数据的操作方法（mysql下修改删除信息）
asp.netajaxControlToolkitValidatorCalloutExtender的简单用法
XML 数据存储
利用Idea构建MySQL驱动开发环境（ideamysql驱动）
MySQL实例如何进行分库管理（mysql 一个实例分库）
针对网络安全，有以下几点措施建议可以参考！
经验分享-------专业绘图软件AutoCAD中文版，AutoCAD软件2023安装教程 win

相关主题

Python Socket编程
Python-Python入门
Python 中文乱码
python之sys.argv
python_IO编程
h5 Python_python做h5网站
Python - Opencv
Python的pandas
python之opencv库

zl程序教程

当前栏目

【OpenCV-Python】教程：7-3 理解KMeans

OpenCV Python KMeans 的理解

【目标】

【理论】

Tshirt尺寸问题

K-Means步骤

1. 随机选择聚类中心 $C 1$ 和 $C 2$

2. 计算距离并标记

3. 重新计算分配

【参考】

相关文章

当前栏目

【OpenCV-Python】教程：7-3 理解KMeans

OpenCV Python KMeans 的理解

【目标】

【理论】

Tshirt尺寸问题

K-Means步骤

1. 随机选择聚类中心 C 1 C1 C1 和 C 2 C2 C2

2. 计算距离并标记

3. 重新计算分配

【参考】

相关文章

1. 随机选择聚类中心 $C 1$ 和 $C 2$