您现在的位置是：首页 > 其他

当前栏目

《Distilling Object Detectors with Fine-grained Feature Imitation》论文笔记

论文笔记 with object Feature Fine

2023-09-11 14:22:29 时间

1. 概述

导读：这篇文章是在two stage检测网络Faster RCNN基础上使用知识蒸馏改进亲轻量级网络性能。其中的核心思想是teacher网络中需要传递给student网络的应该是有效的信息，而非无效的背景区域信息，因而文章将backbone输出的特征图与RPN网络输出的结果进行组合，从而得到student网络应该学习的特征，从而指导student网络产生对应的分布从而提升检测的性能。其在VGG11上使用文章的方法实现了相对baseline 15%的提升，整体上文章的思想比较简单，但是实际证明还是很有效的。

在下图中展示了文章网络的大致结构，其中可以看出文章使用Fine-Gained特征图来指导student网络的学习。
在这里插入图片描述
以下参考：CVPR19-检测模型蒸馏
之前有两个工作有类似的探索，但是都比较局限于特定框架，且未公布代码，对于具体实现存在一定疑惑。

1）论文：Learning efficient object detection models with knowledge distillation，文中使用两个蒸馏的模块：第一，全feature imitation（由FitNets: Hints for Thin Deep Nets 文中提出，用于检测模型蒸馏）, 但是实验发现全feature imitation会导致student 模型performance反而下降，推测是由于检测模型feature 比较大，不同于classification，这其中包含大量的background, 存在大量的noise, 最后通过per-channel vairance 的验证基本确定这个情况。第二，对detection head的蒸馏，这里存在一个很大的问题，就是teacher 和student 的proposal set 不相同，如何进行匹配以便于施加distillation文中没有详述。
2）论文：Mimicking very efficient network for object detection.
这篇文章report 的蒸馏效果确实不错，但是框架仍然比较限定，且蒸馏区域取决于rpn的输出。

2. 方法设计

2.1 Fine-Gained区域提取

文章给出对于有效特征区域提取的流程见下图所示：
在这里插入图片描述
对于backbone输出的特征图，假设其大小为 $W * H$ ，网络中使用的anchor数量为 $K$ ，则文章对于Fine-Gained区域的提取步骤可以归纳如下（上图中的右边所示）：

1）对于给定的特征图按照设置好的anchor信息，生成 $W * H * K$ 个框，将这些框与GT计算IoU；
2）对于这些IoU值，在其中选择最大的IoU值M，在此基础上引入一个参数 $\psi \in[0,1]$ ，文中将这个参数设置为经验值 $\psi=0.5$ ，这个参数与最大IoU值相乘得到一个IoU的阈值 $F=\psi * M$ ，用以控制什么样框（框对应的特征）会被采纳参与知识蒸馏；
3）对于所有生成框使用阈值 $F$ 进行过滤，之后将这些过滤之后的值进行组合得到一个掩码 $I$ ，后面计算蒸馏损失也是按照这个掩码进行的。

2.3 蒸馏损失

这里注意到student网络在引入teacher label进行学习的时候是添加了一个feature adaptation的，这里添加这个的原因有两点：

1）student与teacher在对应特征层级上其channel是不对应的，这里需要进行维度平衡；
2）既是在维度匹配的前提下，若是直接将损失加在student的backbone上会导致蒸馏效果的减弱，从而得到次优的效果；

这里对于蒸馏的损失是在对应的feature上使用平方损失计算得到的，因而将之前选择到的Fine-Gained的特征引入，得到损失的定义为：
$L_{imitation}=\frac{1}{2N_p}\sum_{i=1}^{W}\sum_{j=1}^{H}\sum_{c=1}^{C}I_{ij}(f_{adap}(s)_{ijc}-t_{ijc})^2$
其中， $N_p=\sum_{i=1}^W\sum_{j=1}^HI_{i,j}$ 。因而，总的损失函数被描述为：
$L=L_{gt}+\lambda L_{imitation}$

3. 实验结果

文章的方法在几个不同backbone上进行实验得到的结果，其结果显示文章的方法总体带来的收益还是很不错的：
在这里插入图片描述

猜你喜欢

为什么不记录慢速查询？
centos 7 使用Ansible 发布tomcat 服务
Golang【Web 入门】常用命令
1.6实践与练习
分布式缓存详解
LoadRunner 技巧之检查点
国内外临时手机号接收短信验证码 + 匿名临时邮箱
中国光伏如何规避产业风险？
.NET Generic Host in ASP.NET Core
【Linux 软件包管理器 yum】
纪念逝去的岁月——C++实现一个栈（使用类模板）
NetLogo编程的几个小技巧
浅谈测试：单元测试的爱恨情仇
Android图片加载神器之Fresco-加载图片基础[详细图解Fresco的使用]（秒杀imageloader）
How to do conditional auto-wiring in Spring?
Ubuntu Install Chrome Brwoser

相关主题

ICLR论文2
如何读论文？
写论文的笔记
论文阅读笔记
笔记笔记笔记
论文笔记
笔记笔记
AI~N篇论文1
U-Net论文笔记

zl程序教程