您现在的位置是：首页 > 后端

当前栏目

Python视觉深度学习系列教程第二卷第8章使用HDF5和大型数据集

Python 教程学习数据系列深度视觉大型

2023-09-14 09:01:35 时间

第二卷第八章使用HDF5和大型数据集

到目前为止，在本书中，我们只使用了适合我们机器主内存的数据集。对于小数据集，这是一个合理的假设——我们只需加载每个单独的图像，对其进行预处理，并允许它通过我们的网络馈送。然而，对于大规模深度学习数据集（例如ImageNet），我们需要创建一次只访问数据集的一部分（即小批量）的数据生成器，然后允许该批次通过网络。

幸运的是，Keras附带的方法允许您使用磁盘上的原始文件路径作为训练过程的输入。您不必将整个数据集存储在内存中——只需将图像路径提供给Keras数据生成器，您的图像将分批加载并通过网络馈送。

然而，这种方法效率极低。驻留在磁盘上的每个图像都需要I/O操作，这会给训练管道带来延迟。训练深度学习网络已经足够慢了——我们会尽可能地避免I/O瓶颈。

一个更优雅的解决方案是为原始图像生成HDF5数据集，就像我们在第3章关于迁移学习和特征提取中所做的那样，只是这次我们存储图像本身而不是提取的特征。HDF5不仅能够存储海量数据集，而且还针对I/O操作进行了优化，尤其是从文件中提取批次（称为“切片”）。正如我们将在本书的其余部分看到的那样，采取额外步骤将驻留在磁盘上的原始图像打包到HDF5文件中，这使我们能够构建一个深度学习框架，该框架可用于快速构建数据集和训练深度学习网络在他们之上。

在本

猜你喜欢

关闭Linux系统的防火墙（关闭linux的防火墙）
DDD话语“聚合”中的伪创新-软件方法（下）第8章Part15
Linux中如何离开Python环境（linux怎么退出python）
学习Java注解
Linux安装NS2系统教程（linux安装ns2）
php实现遍历目录并删除指定文件中指定内容
Java图片转换为base64格式详解编程语言
初中数学重要公式定理（一）
oracle创建表空间扩展表空间文件修改表空间自动增长详解数据库
Oracle 如何规范清理v$archived_log记录实例详解
联合国机构：共同应对气候变化挑战迫在眉睫
Linux恢复被rm命令删除的文件（linux撤销rm）
Redis构建无忧权限管理（redis配置权限）
Linux命令：熟悉重定向操作（linux命令重定向）
STL实践项目之用stack实现计算器（含实现代码）
基于Zend的Captcha机制的应用
NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等
MySQL数据库基础学习（九）
使用MySQL中的IF判断进行相等判断（mysqlif判断相等）

相关主题

Python教程
Python 3 教程
Python入门-函数
Python定时任务
Python基础(二)
Python-Python入门
Python练习6
h5 Python_python做h5网站
Python中的JSON库
Python的定位
Python 2.7教程
python的特性
Python之argparse
python之*的用法

zl程序教程

当前栏目

Python视觉深度学习系列教程第二卷第8章使用HDF5和大型数据集

第二卷第八章使用HDF5和大型数据集

相关文章

当前栏目

Python视觉深度学习系列教程 第二卷 第8章 使用HDF5和大型数据集

第二卷 第八章 使用HDF5和大型数据集

相关文章

Python视觉深度学习系列教程第二卷第8章使用HDF5和大型数据集

第二卷第八章使用HDF5和大型数据集