您现在的位置是：首页 > 后端

当前栏目

python工具方法27 训练时在线random resize的实现（支持图像分类与语义分割）

Python 方法训练工具实现支持图像分类

2023-09-14 09:15:04 时间

在训练过程中动态调整数据的尺寸可以增强模型对不同size尺寸物体的适应能力，是提升模型泛化能力的一种手段。如在paddledection套件中，就提供了参数设置多种size组合；此外，博主在拜读SegFormer模型论文时，作者也提到了使用0.5-2.0的倍率对训练数据进行缩放（作者操作还包含随机水平翻转和随机裁剪）。为此对该操作进行实现，对于图像的resize均使用PIL.Image实现与ai框架无任何关联，paddle、pytorch、tensorflwo都可以使用。对目标检测暂不支持，如果后续有需要会完善。

在使用中切记，进行random_size时，由于要将图片转换为uint8，因此传入的数据不能进行标准化（减均值除方差），只传入允许归一化的数据。否则会导致性能极差，模型无法收敛（标准化的数据存在负数，转uint8后存在信息丢失）

1、具体实现

1.1 resize函数的实现

在进行图像resize时，需要注意的是label的格式是WH，为二维数据，而image的格式为CWH或WHC为三维数据，此外image还分为单通道和三通道，三通道通常为rgb数据，而单通道通常为灰度图数据。针对于不同的数据需要选用不同的函数进行resize操作，具体共有以下三个函数。

from PIL import

猜你喜欢

Linux系统的分支：开放源码的发展之路（linux的分支）
Oracle 等待事件 BFILE open 官方解释，作用，如何使用及优化方法
Laravel消息通知系统之数据库
转换Oracle中字符串大小写转换的技巧（oracle字符串大小写）
MySQL Error number: MY-013990; Symbol: ER_GRP_RPL_PAXOS_SINGLE_LEADER_DIFF_FROM_OLD_GRP; SQLSTATE: HY000 报错故障修复远程处理
ORA-01257: cannot reuse database file string, unknown file size ORACLE 报错故障修复远程处理
优化SQL Server内存占用的有效方法（sqlserver内存占用）
器数据库重置MySQL服务器：如何安全删除数据库（删除mysql服务）
信息管理深入浅出MongoDB信息管理（mongodbmongodb）
java学习笔记09–反射机制详解编程语言
精通C语言，编程指尖上操控Oracle（c 语言使用oracle）
Linux 发行版简介系列：Linux 是什么？
Python数据结构(一)·顺序表
这个饭制版《口袋妖怪GO》告诉你AR的未来是什么样
让Linux系统实现时间同步（linux设定时间同步）
js防止DIV布局滚动时闪动的解决方法
从Redis中获取模糊查询结果（获取redis模糊查询）
redis 解决key的乱码问题,并清理详解
Linux内核：在线升级就在眼前（Linux内核在线升级）

相关主题

python魔法方法
Python数据结构
Python RabbitMQ
python get方法
h5 Python_python做h5网站
python 迭代器与生成器
Python标准库：1. 介绍
python 魔术方法
python 堆排序

zl程序教程

当前栏目

python工具方法27 训练时在线random resize的实现（支持图像分类与语义分割）

1、具体实现

相关文章