您现在的位置是：首页 >

当前栏目

【目标检测】SAHI: 切片辅助推理和微调小目标检测

检测目标辅助切片推理微调

2023-06-13 09:11:06 时间

前言

在我之前的文章中，写过一种对于微小目标的检测策略，即将大图裁成多个小图，每个小图分别进行检测，最后将所有的检测结果进行叠加，统一使用NMS进行滤除。但是经过实验，该方法的效果并不是非常明显。

SAHI也采用了类似切片检测的思路，不同的是其采用了更多策略，并将其封装成了一个检测框架，支持 Detectron2，MMDetection和YOLOv5。

论文标题：Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection 论文地址：https://arxiv.org/abs/2202.06934 仓库地址：https://github.com/obss/sahi

效果概览

首先看论文里给出的这张图片，左图是原始预测效果，中间是经过SAHI预测效果，右图是经过SAHI再微调的检测效果。

可以看到，对小目标检测增强的效果还是比较明显的。

再来看数据

如表所示，经过SAHI之后，整体AP均有所提升。不过同样需要注意的是对于大目标(AP50l)，经过SAHI之后，AP反而有所下降。个人猜测可能是因为切片太小导致大目标被分割。注：这里小目标的定义是宽度小于图像宽度的1%。

原理简析

论文很短，原理也并不复杂，整体原理可以由这幅图来囊括。

上图表示切片辅助微调的过程，在原始图片提取出一些补丁块，然后将里面的部分进行放大(如图中红框所示)，相当于一种数据增强。

下图表示切片辅助推断的过程，将图片裁成一块块，分别进行预测，然后用NMS统一进行过滤。

隐藏标签

由于小目标密集时，标签会发生重叠和遮挡。因此最佳方式是不显示标签，仅显示检测框。 Sahi没有像YOLOv5-6.x版本那样，预留了两个接口hide-label、hide-conf隐藏标签和置信度。看到有人在官方仓库提了这个issue，但作者直接回复不支持。。

其实改起来也很简单，无非是需要修改库源码。首先如果是采用setup.py安装的方式，会发现安装的库文件是一个不可修改的egg文件，首先需要将其解压，提取出其中的sahi文件夹，放置在相应site-packages中。

通过阅读源码可以发现，绘图函数放在了utils/cv.py文件中。

因此，只需要将cv.py中的add bunding box text下面的内容注释掉即可。

测试效果

下面就来实际测试一下，测试代码根据官方的示例进行修改，加载本地模型。

from sahi.model import Yolov5DetectionModel
from sahi.predict import get_sliced_prediction

model_path = 'dota_best.pt'

# 使用的YOLOv5检测模型，使用gpu加速，置信度0.25
detection_model = Yolov5DetectionModel(
    model_path=model_path,
    confidence_threshold=0.25,
    device="cuda:0"
)

# slice_height/slice_width 切片高宽
# overlap_height_ratio/overlap_width_ratio 切片间重合度
result = get_sliced_prediction(
    "data/dota_img/P2826.png",
    detection_model,
    slice_height=256,
    slice_width=256,
    overlap_height_ratio=0.2,
    overlap_width_ratio=0.2
)

# 保存检测图片
result.export_visuals(export_dir="result/")

测试图片我选择了Dota-test数据集中的一张，模型选择训练好的YOLOv5l6.pt.

直接预测结果：

经过SAHI的效果：

乍一看区别并不大，原始的模型就已经取得了可观的结果。

那么再放大来看看细节对比，这里选取右上角的一块局部区域，如下图所示，左侧为直接检测结果，右侧为经SAHI之后的结果。

可以看到，原始检测结果中，处于房子阴影部分的车辆，以及被树枝遮挡的车辆并无法被检测出来；而经过SAHI处理之后，这部分也能够被检测出来，说明SAHI确实是有效的算法。

猜你喜欢

解决方案：如何处理MySQL数据不支持序列的问题（mysql数据不支持序列）
Flume实现MySQL数据采集（flume与mysql）
Ubuntu下如何安装apache2服务器
如何根据字段计算MySQL的价格（mysql价格字段）
组织架构设计、角色与权限设计的一些思考
一些cgi论坛所需要的影射
数字零售进入「中台时间」
MySQL Error number: MY-012359; Symbol: ER_IB_MSG_534; SQLSTATE: HY000 报错故障修复远程处理
ThreadLocal面试六连问
复现awvs——HTTP.SYS远程代码执行漏洞(MS15-034)
如何快速且轻松地安装部署Redis（如何安装部署redis）
ExcelVBA随机生成不重复的N个N位数文本
深入解析Linux服务器重启方法（怎么重启linux服务器）
python＞＞numpy（第二讲）
Jvm虚拟机结构与机制详解程序员
快速掌握 MySQL 编写触发器技巧（mysql编写触发器）
微软 Outlook 如何修改邮件列表中的字体或字号
Oracle初始化失败：如何解决灾难？（oracle初始化失败）
电商后台管理系统技术总结（黑马）[通俗易懂]
Photoshop 2017 软件下载 PS全版本软件下载地址（包括最新的2023）
Digester 解析 XML详解编程语言
PHP如何使用Composer来自动加载项目文件？

zl程序教程