机器学习-鸢尾花【K近邻算法(knn)带【交叉验证】适合于大样本的自动分类
'''
Created on 2022年1月16日
1.获取数据集
2.数据基本处理
3.特征工程
4.机器学习(模型训练)
5.模型评估
@author: datangzn
'''
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection._search import GridSearchCV
from sklearn.model_selection.tests.test_search import test_grid_search_bad_param_grid
#1.获取数据集
iris = load_iris()
#2.数据基本处理
#2.1数据分割
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=22,test_size=0.2)
#3.特征工程
#3.1实例化一个转换器
transfer = StandardScaler()
#3.2调用fit_transform方法
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)
#4.机器学习(模型训练)
#4.1 实例化一个估计器
estimator = KNeighborsClassifier(n_neighbors=1)
#4.2 调用交叉验证网格搜索模型
param_grid = {"n_neighbors":[1,3,5,7,9]}
estimator = GridSearchCV(estimator,param_grid=param_grid,cv=10,n_jobs=-1)
#4.3模型训练
estimator.fit(x_train,y_train)
#5.模型评估
#5.1输出预测值
y_pre = estimator.predict(x_test)
print("预测值是:\n",y_pre)
print("预测值和真实值对比:\n",y_pre == y_test)
#5.2输出准确率
ret = estimator.score(x_test, y_test)
print("准确率是:\n",ret)
#其实评价指标
print("最好的模型:\n",estimator.best_estimator_)
print("最好的结果:\n",estimator.best_score_)
print("整体模型结果:\n",estimator.cv_results_)
相关文章
- 机器学习流程,常规算法,降维方法
- 机器学习集成算法--- 朴素贝叶斯,k-近邻算法,决策树,支持向量机(SVM),Logistic回归
- [机器学习] 有趣的机器学习项目
- 神经网络与机器学习 笔记—LMS(最小均方算法)和学习率退火
- 神经网络与机器学习 笔记—Rosenblatt感知器收敛算法C++实现
- (《机器学习》完整版系列)第8章 集成学习——8.2 AdaBoost算法(三合一:分布演进、集成投票、权重优选)
- (《机器学习》完整版系列)第16章 强化学习——16.12 逆强化学习(逆是指回到条件中)
- (《机器学习》完整版系列)第16章 强化学习——16.8 异策略蒙特卡罗强化学习算法(换分布)
- (《机器学习》完整版系列)第13章 半监督学习——13.3 标记传播算法(亲和矩阵、伪概率标记矩阵、能量函数)
- (《机器学习》完整版系列)第12章 计算学习理论——12.3 有限假设空间可分情形(剔除“过拟合”需要足够多的样本)
- 机器学习笔记之集成学习(五)梯度提升树(GBDT)
- 机器学习笔记之狄利克雷过程(六)预测任务求解
- 搜狗首席科学家柳超博士谈“字根嵌入”让机器更懂中文
- Python和R代码机器学习算法速查对比表
- 大数据分析:机器学习算法实现的演化
- 【HMS Core】机器学习服务热门问题合集
- 机器学习到底是什么?
- 为你的回归问题选择最佳机器学习算法
- 《数字图像处理与机器视觉——Visual C++与Matlab实现》——第0章 数字图像处理概述
- Python3 机器学习之kNN(k-邻近算法)含源码
- 机器学习——“防干扰训练”《全新算法助机器学习抵抗干扰》
- 【HMS core】【ML Kit】机器学习服务常见问题FAQ(二)
- 【机器学习】:Kmeans均值聚类算法原理(附带Python代码实现)
- Google云服务推进机器学习 由两位女性掌舵
- FPGA云端服务器助力百度机器深度学习
- 机器学习——支持向量机SVM之非线性模型(原问题转化为对偶问题)
- 群里兄弟量化测试数据。技术大牛,用到Kafka,GO语言,机器学习算法