使用sklearn估计器构建K-Means聚类模型
2023-03-14 09:45:55 时间
实例要求:以sklearn库自带的iris数据集为例,使用sklearn估计器构建K-Means聚类模型,并且完成预测类别功能以及聚类结果可视化。
实例代码:
import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_iris from sklearn.preprocessing import MinMaxScaler from sklearn.cluster import KMeans from sklearn.manifold import TSNE ''' 构建K-Means模型 ''' iris = load_iris() iris_data = iris['data'] # 提取数据集中的数据 iris_target = iris['target'] # 提取数据集中的标签 iris_names = iris['feature_names'] # 提取特征名 scale = MinMaxScaler().fit(iris_data) # 训练规则 iris_dataScale = scale.transform(iris_data) # 应用规则 kmeans = KMeans(n_clusters=3,random_state=123).fit(iris_dataScale) # 构建并训练模型 print('构建的K-Means模型为:\n',kmeans) result = kmeans.predict([[1.5,1.5,1.5,1.5]]) print('花瓣花萼长度宽度全为1.5的鸢尾花预测类别为:',result[0]) ''' 聚类结果可视化 ''' tsne = TSNE(n_components=2,init='random',random_state=177).fit(iris_data) # 使用TSNE进行数据降维,降成两维 df = pd.DataFrame(tsne.embedding_) # 将原始数据转换为DataFrame df['labels'] = kmeans.labels_ # 将聚类结果存储进df数据表中 df1 = df[df['labels']==0] df2 = df[df['labels']==1] df3 = df[df['labels']==2] # fig = plt.figure(figsize=(9,6)) # 绘制图形 设定空白画布,并制定大小 plt.plot(df1[0],df1[1],'bo',df2[0],df2[1],'r*',df3[0],df3[1],'gD') plt.show() # 显示图片
实例结果:
构建的K-Means模型为:
花瓣预测结果:
聚类结果可视化:
相关文章
- 数据孤岛是业务效率的无声杀手
- 2023展望:新的一年将给大数据分析领域带来什么?
- 阿里云ADB基于Hudi构建Lakehouse的实践
- 大数据在医疗保健领域的使用案例
- 微软增加说明:KB5021751 更新扫描已经 / 即将过时 Office 过程中不会触碰用户隐私
- 2022 Gartner全球云数据库管理系统魔力象限发布 腾讯云数据库入选
- 场景化、重实操,分享一个实时数仓实践案例
- Arctic的湖仓一体践行之路
- 分布式计算MapReduce究竟是怎么一回事?
- 淘系数据模型治理优秀实践
- 大数据分析对医疗保健的影响
- 当我们说大数据Hadoop,究竟在说什么?
- 2022年及以后大数据的五个发展趋势
- 网易严选离线数仓治理实践
- 2023 年数据治理趋势
- 一份“靠谱”的年度经营计划,你学会了吗?
- 漫谈对大数据的思考
- 测试一下,读懂数据的能力,你有吗?
- 用艺术的眼光探索数据之美
- 聊聊数据分析成果如何落地