您现在的位置是：首页 > 其它

当前栏目

【目标检测】29、Focal-EIoU：Focal and Efficient IOU Loss for Accurate Bounding Box Regression

for and 检测目标 29 Box Loss Efficient

2023-09-14 09:04:28 时间

在这里插入图片描述

文章目录

论文：Focal and Efficient IOU Loss for Accurate Bounding Box Regression

贡献点：

总结了现有回归 loss 的问题：最重要的是没有直接优化需要优化的参数
提出了现有方法收敛速度较慢的问题，很多的低质量样本贡献了大部分的梯度，限制了框的回归
提出了 Focal-EIoU，平衡高质量样本和低质量样本对 loss 的贡献，也就是提升高质量（IoU 大）样本的贡献，抑制低质量（IoU 小）样本的贡献

一、背景

目标检测框的回归问题，主要有两种 loss 函数：

$l_n$ -norm 函数
IoU-based 函数
- IoU loss 的问题：当两个框不相交时，IoU loss 将无法更新，且无法反应两个框的距离远近，收敛速度很慢
- GIoU loss 的问题：使用惩罚项会让网络趋于选择更大的和 gt 有相交的 anchor，收敛速度很慢，当两框为包含关系时，退化为 IoU loss，收敛速度也很慢
- DIoU loss 的问题：考虑了中心点距离，但没考虑 anchor 的纵横比
- CIoU loss 的问题：虽然考虑的纵横比的问题，但是通过其公式中的 $v$ 反映的纵横比的差异，而不是宽高分别与其置信度的真实差异，anchor 的长和宽不能同时增大或减小。

CIoU 的详细对比：

当两个框为等比例缩放的时候， $v = 0$ ，难以被优化
$w$ 和 $h$ 其中一个增大，另一个必然减小，无法同时增大或减小，抑制了模型的优化。因为 $\frac{\partial v}{\partial w} = - \frac{h}{w}.\frac{\partial v}{\partial h}$ ，而偏导又是正值，所以有这样的关系。
只关心两者比例，而非每个边对应的真实差距，容易导致不期望的优化方式。如图 1 所示，当 gt 框的长和宽都为 1 时，初始 anchor w=1，h=2.4。50 次迭代后，w=1.64，h=2.84，所以 CIoU 更期望提升两个框纵横比的相似性，而非真实的长和宽。

在这里插入图片描述

二、方法

2.1 EIoU Loss

EIoU Loss 定义如下：

在这里插入图片描述

$w^c$ 和 $h^c$ 是最小包围框的宽和长
EIoU loss 可以分为 3 部分：IoU loss + 距离 loss + 纵横比 loss
EIoU loss 直接最小化 anchor 和 gt 的宽和高的差异，使得收敛速度更快，定位效果更好

在这里插入图片描述

2.2 Focal EIoU Loss

在框回归问题中，高质量的 anchor 总是比低质量的 anchor 少很多，这也对训练过程有害无利。所以，需要研究如何让高质量的 anchor 起到更大的作用。

1、Focal L1 Loss

首先，损失函数的特性要求如下：

当回归的误差趋于 0 时，梯度的模值也会趋于 0
梯度的模值应该在小回归误差处快速上升，在大回归误差处逐步下降
需要有一些超参数来控制低质量 anchor 灵活性的抑制程度
梯度函数需要在 (0, 1] 之间，来平衡高质量和低质量 anchor

在这里插入图片描述

满足 1 和 2 条件的函数如图 5a 所示，当添加了一个超参数 $\beta$ 时，如图 5b 所示，随着 $\beta$ 的增大，虽然难样本的梯度模值会被很大程度的抑制，但高质量样本的梯度模值会降低，这并非期望的结果。

所以，又添加了一个参数 $\alpha$ ，来将梯度模值归一化到 [0, 1]，所以，梯度模值可以被写为：
在这里插入图片描述

所以，得到能够对边界框进行回归监督的 Focal L1 Loss 如下：

在这里插入图片描述

如图 4b 所示，Focal L1 Loss 可以提高 inliers 的梯度值，并根据 $\beta$ 抑制 outliers 的梯度值：

$\beta$ 越大，则 inliers 会有小的回归误差，并且快速抑制 outliers 的梯度值

如图 4a 所示：

蓝色线是 $\beta$ 的最大值，随着回归误差的增大，蓝色线会先很快增大，然后稳定
橘色线是 $\beta$ 是在 $\beta$ 最小时，会快速增长，然后在 x=1 时达到峰值
经过消融实验，最后选择 $\beta=0.8$ ，即红线所示

在这里插入图片描述

2、Focal-EIoU Loss

为了让 EIoU Loss 更关注高质量样本，可以使用 EIoU loss 来代替上面公式中的 x，但效果不太好。所以作者就通过分析之后，提出了下面的最终形式：

$L_{Focal-EIoU}=IoU^{\gamma} L_{EIoU}$

$\gamma=0.5$

这里以 IoU loss 的形式来分析一下 Focal 形式的曲线（EIoU 曲线不太好画），蓝线为 $(1 - I o U)$ 曲线，橘色线为 $IoU^{0.5}(1-IoU)$ ，所以在 IoU 小的时候（0-0.8）， $IoU^{0.5}(1-IoU)$ 会被拉低，在 IoU 大的时候（0.8-1）， $IoU^{0.5}(1-IoU)$ 基本保持不变。

从这个曲线可以看出，Focal-EIoU loss 能够通过降低难样本的 loss 来让网络更关注简单样本。

在这里插入图片描述

三、效果

在这里插入图片描述

猜你喜欢

深入了解Linux的分区概念（linux怎么看分区）
Linux输出文件的处理方法（linux的out文件）
Oracle 索引反转：优化查询性能的妙招（oracle索引反转）
【Groovy】集合遍历 ( 使用 for 循环遍历集合 | 使用集合的 each 方法遍历集合 | 集合的 each 方法返回值分析 )
PHP连接MSSQL：让你更快更好地实现数据互通（php接mssql）
学习Linux，把握就业机会（学linux就业）
易编程，学习MSSQL，就在这里！（易语言mssql教程）
函数式编程之compose
7b2美化-用户头像旋转特效
滥用Edge浏览器的“恶意站点警告”特性，实现地址栏欺骗
Java实用工具类-根据当前weekday返回分段排序的周一至周日详解编程语言
内网隧道之frp
Oracle 分区数据管理主动调整（oracle主子分区）
Cornerstone for Mac(SVN管理工具)v4.2永久激活版
Oracle中用于拼接字符串的函数CONCAT（oracle 中拼接函数）
MySQL存储过程查询优化（mysql存储过程查询）
支付Linux驱动开发带给员工新的工资支付方式（linux驱动工资）
Linux调试：从动态库踏上Debug之路（linux调试动态库）
单风扇甜品卡：AMD RX 6600、RX 6600 XT 8月11日登场
Linux Kernel 3.4.62 LTS 现已经提供下载
第一次牛客模考总结

相关主题

JAVA增强for循环
java for语句
shell for循环
v-for 遍历数组
循环4-for循环
增强for循环
20.10 for循环
for in 循环
if-for-while
for in和for of
java for循环
for DEMO
Batch - FOR %%a %%b
for...in和for...of
wait-for

zl程序教程

当前栏目

【目标检测】29、Focal-EIoU：Focal and Efficient IOU Loss for Accurate Bounding Box Regression

文章目录

一、背景

二、方法

2.1 EIoU Loss

2.2 Focal EIoU Loss

三、效果

相关文章