Python视觉深度学习系列教程 第三卷 第3章 准备ImageNet(1)
2023-09-14 09:01:35 时间
第三卷 第三章 准备ImageNet(1)
下载 ImageNet 数据集后,现在有超过 1200 万张图像驻留在磁盘上,它们都没有“人类可读”的文件名。
在本章中,我们将从了解 ImageNet 文件结构开始,包括原始图像和开发工具包(即“DevKit”)。 从那里,我们将编写一个辅助 Python 实用程序脚本,使我们能够解析 ImageNet 文件名 + 类标签,创建一个很好的输出文件,将给定的输入文件名映射到其相应的标签(每行一个文件名和标签)。
最后,我们将这些输出文件与 mxnet im2rec 工具一起使用,该工具将获取我们的映射并创建高效打包的记录 (.rec) 文件,这些文件可用于在太大而无法放入主内存的数据集上训练深度模型。我们会发现,这种 .rec 格式不仅比 HDF5 更紧凑,而且 I/O 效率也更高,使我们能够更快地训练我们的网络。
1、了解 ImageNet 文件结构
假设您已经完成了 ILSVRC2012_CLS-LOC.tar.gz 文件的下载,建议在睡觉前进行解压,第二天你可以进入文件夹查看,包含三个文件夹Annotations、Data、ImageSets。
Annotations 目录。 该目录仅用于定位挑战(即对象检测),因此我们可以忽略该目录。
Data目录最重要,在 Data 内部,我们会找到一个名为 CLS-LOC 的子目录:在这里,我们可以找到训练、测试和验证“拆分”。
<相关文章
- Python微信公众号教程基础篇——收发文本消息
- Python运用于数据分析的简单教程
- Python视觉深度学习系列教程 第三卷 第16章 从头开始训练SSD
- Python视觉深度学习系列教程 第三卷 第13章 Faster R-CNNs
- Python视觉深度学习系列教程 第三卷 第10章 校正图像方向
- Python视觉深度学习系列教程 第二卷 第9章 Kaggle竞赛:Cat与Dog
- Python视觉深度学习系列教程 第二卷 第10章 GoogLeNet
- Python视觉深度学习系列教程 第二卷 第6章 高级优化方法
- Python视觉深度学习系列教程 第二卷 第4章 微调网络
- Python视觉深度学习系列教程 第二卷 第3章 理解rank-1&rank-5精度
- Python视觉深度学习系列教程 第二卷 第11章 ResNet
- Python视觉深度学习系列教程 第二卷 第8章 使用HDF5和大型数据集
- Python视觉深度学习系列教程 第一卷 第22章 案例:微笑检测
- Python视觉深度学习系列教程 第一卷 第7章 第一个图像分类器
- Python视觉深度学习系列教程 第一卷 第13章 保存和加载模型
- Python视觉深度学习系列教程 第一卷 - 第8章 参数化学习
- Python视觉深度学习系列教程 第一卷 第2章 什么是深度学习
- 【OpenCV-Python】教程:6-2 Pose Estimation (姿态估计)
- 零基础也能懂的python办公自动化教程,从此上班摸鱼轻轻松松
- 十年阿里程序员:10个阶段完成python学习计划任务,有教程哦
- 价值9890元的600集Python教程,在此透露给大家!速度来拿哇
- 我用python处理Excel表格数据,工作量直接减少一半(含教程)
- Python Django框架学习01:Django 教程
- python在线测试代码及教程
- 【Python教程】《零基础入门学习Python》(小甲鱼)
- python环境搭建
- Python实时垃圾分类系统(环境教程&完整源码&数据集)
- Python基于OpenCV的人脸集合相似度检测系统(源码&UI&教程)