zl程序教程

您现在的位置是:首页 >  IT要闻

当前栏目

Paddle目标检测学习笔记(二)

2023-03-14 22:41:48 时间

Faster R-CNN简析


第一阶段:产生候选区域


使用 Anchor替代 Selective search,选取候选区域

选出包含物体的 Ancho进入Rol Pooling提取特征

第二阶段:对候选区域进行分类并预测目标物体位置


RPN

结构:


image


训练:


1.向RPN网络输入一个监督信息,判断 Anchor.是否包含物体。

Anchor包含物体-正样本

Anchor不包含物体-负样本

2.根据Anch和真实框loU取值,判断正or负样本

正样本:

与某一真实框loU最大的 Anchor

与任意真实框loU>07的 Anchor

负样本:

与所有真实框的loU<0.3的 Anchor

3.采样规则:

共采样256个样本

从正样本中随机采样,采样个数不超过128个

从负样本中随机采样,补齐256个样本

loss

image



生成Proposals

image


RoI pooling


候选框分为若干子区域,将每个区域对应到输入特征图上,取每个区域内的最大值作为该区域的输出。


不足:


在两次取整近似时,导致检测信息与提取出的特征不匹配


解决:RoI Align


BBox Head

image


补充


Q:请分别列举你所认为的当前最先进的目标检测方法,并解释为什么该方法的是当前最先进的方法?在原理上,该方法做了什么创新?


EfficientDet


来自[1911.09070] EfficientDet: Scalable and Efficient Object Detection (arxiv.org)


主要贡献点是BiFPN和Compound scaling方法,具体我也没有精读,下面是我对其直观的理解。


BiFPN是在FPN的基础上对其进行改进,对原始的FPN模块又添加了添加上下文信息的边,并对每个边乘以一个相应的权重。


Compound scaling方法是一种复合特征金字塔网络缩放方法,统一缩放所有backbone的分辨率、深度和宽度、特征网络和box/class预测网络。


今年的单阶段算法TOOD(来自[2108.07755] TOOD: Task-aligned One-stage Object Detection (arxiv.org)),在COCO数据集上刷新了单阶段目标检测新纪录,但我还没有去了解。

特征金字塔网络缩放方法,统一缩放所有backbone的分辨率、深度和宽度、特征网络和box/class预测网络。


今年的单阶段算法TOOD(来自[2108.07755] TOOD: Task-aligned One-stage Object Detection (arxiv.org)),在COCO数据集上刷新了单阶段目标检测新纪录,但我还没有去了解。