【ML 吴恩达】11 聚类Clustering的概念、应用和算法简介
2023-09-14 09:13:09 时间
1 简介
聚类Clustering : 将数据集中的样本划分为若干个通常不相交的子集,每个子集称为簇(cluster)。
簇cluster:A group of objects that are similar to other objects in the cluster ,and dissimilar to data points in other clusters
一组与集群中其他对象相似,但与其他集群中的数据点不同的对象称为簇
2 聚类应用
(1)出版社
• 自动分类新闻内容
• 建议类似的文章
(2)医疗
• 表征病人的行为
(3)生物
• 聚类遗传标记以识别家庭纽带
(4)零售\市场
• 识别顾客购买的方式
• 推荐新书和新电影给顾客
(5)银行
• 支票的检测
• 识别用户群
(6)保险
• 索赔分析中的欺诈检测
• 顾客的投保风险
3 选择聚类方法的情况
(1)探索性数据分析
(2)总结概要
(3)离群值检测(outlier detection)
(4)查重
(5)预处理步骤
4 聚类算法
(1)基于分区的聚类
• 相关高效,用于中等或者大型数据集
• K-means 、K-Median 、Fuzzy c-Means
(2)层次聚类
• 产生树的聚类
• 凝聚算法(Agglomerative algorithm)分割算法(Divison algorithm)
(3)基于密度的聚类算法
• 产生任意形状的簇
• DB scan算法
相关文章
- 理解 angular2 基础概念和结构 ----angular2系列(二)
- 一小时了解数据挖掘⑤数据挖掘步骤&常用的聚类、决策树和CRISP-DM概念
- 喧哗的背后:Serverless 的概念及挑战
- ML - 深度学习之美十四章-概念摘要(1~7)
- 操作系统概念系类——操作系统特征
- 重新整理操作系统概念系类——信号量
- 【PS技巧】常用概念和功能操作
- EL:集成学习(Ensemble Learning)的概念讲解、问题应用、算法分类、关键步骤、代码实现等相关配图详细攻略
- ML之MaL: 流形学习MaL的概念认知、算法分类、案例应用、代码实现之详细攻略
- C++多态的概念及前提条件(最精辟)
- 线程锁的概念函数EnterCriticalSection和LeaveCriticalSection的使用方法
- 4. docker镜像的概念、管理(查看、下载、删除)
- DatagramSocket(邮递员):对应数据报的Socket概念,不需要创建两个socket,不可使用输入输出流。
- ffmpeg 音频概念的详解
- I2C知识大全系列一 —— I2C相关概念
- 统计学常见分布、概念