zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Python视觉深度学习系列教程 第三卷 第3章 准备ImageNet(1)

Python教程学习 系列 深度 视觉 准备
2023-09-14 09:01:35 时间

        第三卷 第三章 准备ImageNet(1)

        下载 ImageNet 数据集后,现在有超过 1200 万张图像驻留在磁盘上,它们都没有“人类可读”的文件名。

        在本章中,我们将从了解 ImageNet 文件结构开始,包括原始图像和开发工具包(即“DevKit”)。 从那里,我们将编写一个辅助 Python 实用程序脚本,使我们能够解析 ImageNet 文件名 + 类标签,创建一个很好的输出文件,将给定的输入文件名映射到其相应的标签(每行一个文件名和标签)。

        最后,我们将这些输出文件与 mxnet im2rec 工具一起使用,该工具将获取我们的映射并创建高效打包的记录 (.rec) 文件,这些文件可用于在太大而无法放入主内存的数据集上训练深度模型。我们会发现,这种 .rec 格式不仅比 HDF5 更紧凑,而且 I/O 效率也更高,使我们能够更快地训练我们的网络。

        1、了解 ImageNet 文件结构

        假设您已经完成了 ILSVRC2012_CLS-LOC.tar.gz 文件的下载,建议在睡觉前进行解压,第二天你可以进入文件夹查看,包含三个文件夹Annotations、Data、ImageSets。

        Annotations 目录。 该目录仅用于定位挑战(即对象检测),因此我们可以忽略该目录。

        Data目录最重要,在 Data 内部,我们会找到一个名为 CLS-LOC 的子目录:在这里,我们可以找到训练、测试和验证“拆分”。

<