您现在的位置是：首页 > 硬件

当前栏目

机器学习-鸢尾花【K近邻算法（knn）带【交叉验证】适合于大样本的自动分类

机器算法自动学习分类验证适合交叉

2023-09-11 14:16:58 时间

'''
Created on 2022年1月16日
1.获取数据集
2.数据基本处理
3.特征工程
4.机器学习(模型训练)
5.模型评估
@author: datangzn
'''

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection._search import GridSearchCV
from sklearn.model_selection.tests.test_search import test_grid_search_bad_param_grid

#1.获取数据集
iris = load_iris()
#2.数据基本处理
#2.1数据分割
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=22,test_size=0.2)

#3.特征工程
#3.1实例化一个转换器
transfer = StandardScaler()
#3.2调用fit_transform方法
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)

#4.机器学习(模型训练)
#4.1 实例化一个估计器
estimator = KNeighborsClassifier(n_neighbors=1)

#4.2 调用交叉验证网格搜索模型
param_grid = {"n_neighbors":[1,3,5,7,9]}
estimator = GridSearchCV(estimator,param_grid=param_grid,cv=10,n_jobs=-1)

#4.3模型训练
estimator.fit(x_train,y_train)

#5.模型评估
#5.1输出预测值
y_pre = estimator.predict(x_test)
print("预测值是：\n",y_pre)
print("预测值和真实值对比：\n",y_pre == y_test)

#5.2输出准确率
ret = estimator.score(x_test, y_test)
print("准确率是：\n",ret)

#其实评价指标
print("最好的模型：\n",estimator.best_estimator_)
print("最好的结果：\n",estimator.best_score_)
print("整体模型结果：\n",estimator.cv_results_)

猜你喜欢

SQL按某字段去重保留按某个字段排序最大值
编译安装x264
线性可分支持向量机
Shell 脚本实现ansible免密认证 expect批量导入ssh公钥
【元学习meta-learning】通俗易懂讲解元学习以及与监督学习的区别
内存数据库 HSQLDB
[BZOJ 1012][JSOI2008]最大数maxnumber
3分钟搞懂曝光直方图(转)
lotus-seal-worker port refused
【python cookbook】【字符串与文本】11.从字符串中去掉不需要的字符
BZOJ 1324 Exca神剑最小割
apache kafka系列之性能优化架构分析
【LeetCode-面试算法经典-Java实现】【066-Plus One（加一）】

相关主题

机器学习资料
机器学习实战
机器学习开源项目
机器学习——EM算法
Python 7步机器学习
Python机器学习算法
算法_贪心算法
机器学习原理
机器数

zl程序教程

当前栏目

机器学习-鸢尾花【K近邻算法（knn）带【交叉验证】适合于大样本的自动分类

相关文章