python工具方法 4 依据随机种子将数据划分为训练集、测试集、验证集
2023-09-14 09:15:04 时间
1、图像文件划分
依据随机种子将图片文件数据按照3:1:1分成训练集,测试集,验证集三部分保证可复现,同时确保每一个子类的图片分布都是3:1:1(可以修改0.4为0.2,则数据集划分比例为,8:1:1)
代码通过遍历目录的每一个子文件夹,单独对子文件夹的数据连续调用两次train_test_split函数,实现对数据的分类;对目录X划分后,运行结束多出三个目录,X-验证 ,X-测试 ,X-训练
# -*- coding: utf-8 -*-
"""
Created on Wed Jun 19 09:53:39 2019
@author: root
"""
import os,shutil
from sklearn.cross_validation import train_test_split
#from sklearn.model_selection import train_test_split
def splitDir(dirPath,random_state):
path_type=['验证','测试','训练']
class_arr=[]
class_name_arr=[]
class_tmp=[]
name_dir="name_dir"
for (root, dirs, files) in os.walk(dirPath):
if files:
for f in files:
if name_dir not in root:
#切换下一个分类时,将上一个分类的数据存入
if name_dir!="name_dir":#第一次运行
相关文章
- python求逆矩阵的方法,Python 如何求矩阵的逆「建议收藏」
- python实现矩阵的转置_Python实现矩阵转置的方法分析
- mt4 python_一个使用Python自动化交易外汇MT4脚本实现「建议收藏」
- python移动app开发_神奇的Kivy,让Python快速开发移动app
- python hashlib_Python hashlib模块实例使用详解
- python判断linux中文件是否存在_Python判断文件是否存在的三种方法
- 【说站】python中re.findall函数的介绍
- 【说站】python PyQt组织菜单和工具栏
- Python实现自动回复_python 微信机器人
- python学习:文件操作及os方法大全
- python如何生成随机数_Python生成50个随机数
- 【7】python_matplotlib 输出(保存)矢量图方法;画图时图例说明(legend)放到图像外侧;Python_matplotlib图例放在外侧保存时显示不完整问题解决
- Python列表常用的函数和方法(1)_Python自学第二十节
- 预备小菜:Python入门之字符串
- 【Python】Python 入门基础
- FreeBuf 周报 | 马斯克血洗推特安全部门;新形式钓鱼软件针对 Python开发人员
- python生成字母验证图片详解编程语言
- python3-开发面试题(python)6.23基础篇(2)详解编程语言
- 使用Python执行Linux命令的方法(python调用linux命令)
- Python子类继承父类构造方法的方式详解编程语言
- Python驱动Oracle数据库(python操作oracle)
- Linux查看Python安装路径的方法(linux查看python安装路径)
- python将xmlxsl文件生成html文件存储示例讲解
- python基础教程之lambda表达式使用方法
- python实现给字典添加条目的方法