您现在的位置是：首页 > 其它

当前栏目

sklearn的train_test_split，果然很好用啊！

test split sklearn train

2023-09-14 09:11:54 时间

sklearn的train_test_split

train_test_split函数用于将矩阵随机划分为训练子集和测试子集，并返回划分好的训练集测试集样本和训练集测试集标签。

格式：

X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)

参数解释：

train_data：被划分的样本特征集

train_target：被划分的样本标签

test_size：如果是浮点数，在0-1之间，表示样本占比；如果是整数的话就是样本的数量

random_state：是随机数的种子。

随机数种子：其实就是该组随机数的编号，在需要重复试验的时候，保证得到一组一样的随机数。比如你每次都填1，其他参数一样的情况下你得到的随机数组是一样的。但填0或不填，每次都会不一样。

随机数的产生取决于种子，随机数和种子之间的关系遵从以下两个规则：

种子不同，产生不同的随机数；种子相同，即使实例不同也产生相同的随机数。

示例

>>> import numpy as np
>>> from sklearn.model_selection import train_test_split
>>> X, y = np.arange(10).reshape((5, 2)), range(5)
>>> X
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])
>>> list(y)
[0, 1, 2, 3, 4]

>>>
>>> X_train, X_test, y_train, y_test = train_test_split(
...     X, y, test_size=0.33, random_state=42)
...
>>> X_train
array([[4, 5],
       [0, 1],
       [6, 7]])
>>> y_train
[2, 0, 3]
>>> X_test
array([[2, 3],
       [8, 9]])
>>> y_test
[1, 4]

猜你喜欢

SqlServer数据库开发带来的巨大好处（sqlserver 好处）
ES6 spread operator 展开运算符详解编程语言
Linux 串口探索：查看串口数据（查看linux串口数据）
Linux的发展史及其分支系统（linux的分支）
脑机接口人体实验首度成功，它用 50 年把科幻电影变为现实
表占了更多的存储空间Oracle：查看占用存储空间最多的表（oracle查看哪些）
Linux 搜索之旅：快速找到你想要的文件（linux搜索）
numpy转tensorflow_pytorch numpy
Adobe InCopy 2022 最新中文版安装注册教程 ic mac 版本下载
Open webOS 已正式更名 LuneOS
浅谈JavaScript字符集
Win7中开启系统自带FTP服务器的方法
探寻Redis队列的原理与运作（查看redis队列）
ORA-26012: header in file string has an incompatible version number ORACLE 报错故障修复远程处理
一步到位：Linux轻松清理ARP缓存（linux清理arp缓存）
使用Redis实现数据持久化存储（redis设置数据持久化）
天猫好房与UC达成战略合作携手共建房产信息服务新渠道
破解Redis架构借助虚拟机的帮助（使用虚拟机里的redis）

相关主题

python_test_01
test
Qt test
A/B Test
python_24_test
mysql test== 坑
Test Python
Spring boot test
shell test [ ]

zl程序教程

当前栏目

sklearn的train_test_split，果然很好用啊！

sklearn的train_test_split

相关文章