您现在的位置是：首页 > 后端

当前栏目

【YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进NO.57】引入可形变卷积

算法系列引入改进卷积 YOLOv5 YOLOv7 rcnn

2023-09-14 09:01:43 时间

文章目录

前言
一、解决问题
二、基本原理
三、添加方法
四、总结

前言

作为当前先进的深度学习目标检测算法YOLOv8，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv8的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv8，YOLOv7、YOLOv5算法2020年至今已经涌现出大量改进论文，这个不论对于搞科研的同学或者已经工作的朋友来说，研究的价值和新颖度都不太够了，为与时俱进，以后改进算法以YOLOv7为基础，此前YOLOv5改进方法在YOLOv7同样适用，所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

具体改进办法请关注后私信留言！关注免费领取深度学习算法学习资料！

一、解决问题

卷积层用于提取图像中的特征信息，传统的矩形卷积通常使用固定的大小和比例的卷积核对特征图的特定位置进行特征学习和下采样。但在同一特征层的不同位置对应的是不同尺度和形状的目标，因此，目标检测具有一定的局限性。可变形卷积可根据对象的比例和形状自适应调整，变形卷积网络提出的不规则卷积核，有效地克服了固定矩形结构采样不足的缺点，提高了网络对物体变形的模拟
能力。YOLO检测网络的卷积层为conv2D卷积+BN+Silu激活函数，尝试将卷积层的卷积改为可可形变卷积，引入可变形卷积，扩大特征图的感受野，使提取的特征辨析力更强，有效地提高了模型的识别能力。

二、基本原理

在这里插入图片描述原文链接
 代码链接
卷积神经网络（CNN）由于其构建模块中的固定几何结构，固有地局限于模型几何变换。在这项工作中，我们引入了两个新模块来增强神经网络的变换建模能力，即可变形卷积和可变形RoI池。这两种方法都基于在模块中增加额外偏移量的空间采样位置，并从目标任务中学习偏移量，而无需额外监督的想法。新的模块可以很容易地取代现有CNN中的普通模块，并且可以通过标准反向传播进行端到端的训练，从而产生可变形的卷积网络。广泛的实验验证了我们的方法在复杂的视觉任务（对象检测和语义分割）上的有效性。代码将被发布。

3x3可形变卷积结构示意图

三、添加方法

第一步：先在common中定义模块DCNConv，然后在yolo.py中注册该模块。部分代码如下：

class DCNConv(nn.Module):
    # Standard convolution
    def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True):  # ch_in, ch_out, kernel, stride, padding, groups
        super().__init__()
        self.conv1 = nn.Conv2d(c1, c2, 3, 2, 1, groups=g, bias=False)
        deformable_groups = 1
        offset_channels = 18
        self.conv2_offset = nn.Conv2d(c2, deformable_groups * offset_channels, kernel_size=3, padding=1)
        self.conv2 = DeformConv2d(c2, c2, kernel_size=3, padding=1, bias=False)

        # self.conv2 = DeformableConv2d(c2, c2, k, s, autopad(k, p), groups=g, bias=False)
        self.bn1 = nn.BatchNorm2d(c2)
        self.act1 = nn.SiLU() if act is True else (act if isinstance(act, nn.Module) else nn.Identity())
        self.bn2 = nn.BatchNorm2d(c2)
        self.act2 = nn.SiLU() if act is True else (act if isinstance(act, nn.Module) else nn.Identity())

第二步：定义yaml网络结构文件。

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license

# Parameters
nc: 4  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, DCNConv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

第三步：在train.py中选择网络结构yaml即可。

四、总结

预告一下：下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我，有问题可以留言或者私聊我哦

PS：该方法不仅仅是适用改进YOLOv5，也可以改进其他的YOLO网络以及目标检测网络，比如YOLOv7、v6、v4、v3，Faster rcnn ，ssd等。

最后，有需要的请关注私信我吧。关注免费领取深度学习算法学习资料！

猜你喜欢

深入探索Linux UCI命令行操作（linuxuci）
项目分享 | 货物运输监督智能卡
js实现页面跳转重定向的几种方式
Linux配置必备技能（linux需要怎样的配置）
简单高效，轻松计算——Linux小型计算器实用指南（linux小型计算器）
MySQL注册机：一步到位注册你的数据库（mysql注册机）
将u8BF7u9009u62E9这样的字符串转为汉字的代码
Java无法连接Redis服务器（java连不上redis）
利用Oracle触发器实现数据自动处理（oracle在触发器）
Redis缓存清理最佳操作实践（redis缓存清理的方法）
纯HTML个人简历模板代码
python进阶教程之模块（module）介绍
基于Redis的身份验证配置指南（redis 身份验证配置）
stm32编程步骤_单片机STM32
MySQL两种简单设置方法（mysql两种设置方法）
下载如此快速！下载神器FDM分享 idm多个版本（电脑、手机、浏览器插件都有）
ABCMacOS安装软件ABC的指南（macos装软件）
WordPress 技巧：将你的博客添加到百度首页
ORA-29844: duplicate operator name specified ORACLE 报错故障修复远程处理
LG暂时中止在其Best Shop销售苹果设备的计划
MetaDaily｜奥迪推出通过AR控制的概念车，苹果头显可通过Siri创建AR程序
基于UDP协议的虚拟路灯

相关主题

Hmac算法
iOS 算法题
C++ STL算法
算法1.1
01d-1: 算法分析
排序算法-算法

zl程序教程

当前栏目

【YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进NO.57】引入可形变卷积

文章目录

前言

一、解决问题

二、基本原理

三、添加方法

四、总结

相关文章

当前栏目

【YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进NO.57】引入可形变卷积

文章目录

前言

一、解决问题

二、基本原理

三、​添加方法

四、总结

相关文章

三、添加方法