zl程序教程

您现在的位置是:首页 >  后端

当前栏目

【目标检测论文解读复现NO.31】基于改进YOLO v5复杂场景下肉鹅姿态的检测算法研究

算法论文 基于 检测 研究 场景 解读 目标
2023-09-14 09:15:13 时间
前言
此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文,帮助大家解答疑惑。解读的系列文章,本人已进行创新点代码复现,有需要的朋友可关注私信我。

一、摘要

[目的]肉鹅姿态是预警肉鹅异常行为、评判肉鹅健康状态的重要指标,针对传统养殖场人工观察肉鹅姿态耗时费力且有很大主观性等问题,提出了一种基于深度学习模型自动识别肉鹅姿态的检测算法。[方法]利用YOLO v5模型对扬州鹅4种姿态进行识别(站立、休憩、饮水和梳羽);对YOLO v5模型加入SENet、CBAM、ECA三种注意力模块改进网络结构,提高模型的识别能力;设计明暗试验和密集场景实验进一步验证模型在复杂场景下的鲁棒性。[结果]YOLO v5+ECA模型的平均检测精度(mAP)为88.93%,相比YOLO v5提升了2.27%。在识别精度(AP)上,站立姿态为91.85%,休憩姿态为93.42%,饮水姿态为90.02%,梳羽姿态为80.42%。在明暗试验和密集场景实验中,YOLO v5+ECA模型性能表现稳定,漏检现象和误检现象相对较少。[结论]该模型可以实现养殖场复杂场景下肉鹅姿态准确快速的检测,为后续的肉鹅行为监控和健康防疫做数据支撑。

二、网络模型及核心创新点

个人解读:这篇文章就通过对比几种不同注意力机制模块对网络的影响,进行实验分析得到ECA效果最佳。大家平时如果添加的模块不好用,也可以写进论文中,作为自己的工作量,可能也能得到审稿人的认可,提高录用的概率。

1.SENet注意力模块

2.CBAM注意力模块

3. ECA注意力模块

三、应用数据集(模型构建过程)

挑选了不同时段的肉鹅活动视频,利用python脚本文件对视频进行抽帧处理,每个视频按照一定的间隔抽帧获取100张彩色RGB图片,经过数据清洗后将原有的MP4格式视频数据转为了800张JPG图像,包括400张白天肉鹅图像和400张夜晚肉鹅图像。统一批量重新编号为格式“00000X.jpg”。

四、实验效果(部分展示)

1.为了进一步了解模型对于各姿态类别的识别效果,改进前后模型对于不同姿态识别的AP实验结果如表3所示。

对实验结果进行分析,站立姿态的识别AP最高达到了91.85%,休憩姿态的识别AP最高达到了93.48%,饮水姿态的识别AP最高达到了93.00%,而梳羽姿态的识别最高只有80.42%。

2.鲁棒性实验

(1)明暗实验

为了测试模型对于亮度的敏感性,将测试集中的白天与夜晚图片分开计算模型的mAP值,相关结果如下表4所示。

由上表可知,模型在明暗场景的姿态识别情况差异不大,并且加入注意力机制后,模型在白天和夜晚的场景中检测精度均有所上升。

(2)密集场景实验

密集场景的实验是对模型小目标检测能力的考验。本实验为了进一步测试改进后的YOLO v5+ECA模型在密集场景的肉鹅姿态识别的能力,测试选取了一张白天图像,并且这张图片不属于测试集中的原有照片,可以验证模型的泛化能力。

从上图可以看出,在YOLO v5中出现了梳羽姿态误检为站立姿态以及站立姿态漏检的问题,而在改进后的YOLO v5+ECA模型均得到改善,改进后的模型误检和漏检现象减少,模型在密集场景下的表现有所提升。

五、实验结论

本研究基于深度学习的方法,对YOLO v5算法引入注意力机制改进网络结构。通过模型的基本测试以及鲁棒性实验的对比,改进后的YOLO v5+ECA模型能够对肉鹅的站立(standing)、休憩(resting)、饮水(drinking)、梳羽(feather preening)这4种常见姿态做到较为准确的识别,平均检测精度(mAP)达88.93%,相比YOLO v5提升2.27%,检测速度为30.92 帧/秒,提升了4.22帧/秒。站立、休憩、饮水的姿态识别AP都达到90%以上,梳羽姿态的识别AP值虽然只达到80.42%,但相比YOLO v5提升了6.07%。明暗试验和密集场景实验证明了改进后的YOLO v5+ECA模型在复杂场景下的检测效果好,对光线的适应性强,漏检和误检现象相对较少。

六、投稿期刊介绍

注:论文原文出自 刘璎瑛,曹晅,郭彬彬,陈慧杰,戴子淳,龚长万.基于改进YOLO v5复杂场景下肉鹅姿态的检测算法研究[J/OL].南京农业大学学报. https://kns.cnki.net/kcms/detail/32.1148.S.20220909.1544.004.html

解读的系列文章,本人已进行创新点代码复现。