[论文笔记] R-CNN for Small Object Detection 阅读笔记
2023-09-27 14:20:18 时间
R-CNN for Small Object Detection 阅读笔记
R-CNN for Small Object Detection(ACCV 2016)
论文链接:论文链接
看这篇文章是为了看小目标检测里面的 context modeling ,我认为context modeling有利于对x-ray中遮挡的物品进行检测。
动机
- 解决小目标检测性能不足的问题
解决方案
- 建立了一个针对小目标检测问题的基准数据集
- 使用context model和small region proposal generator来改进R-CNN
小目标检测数据集
SOD R-CNN
- 选择R-CNN作为研究目标的原因。R-CNN和Fast R-CNN:前者使用ss获取感兴趣的区域,然后无差别地将区域拉伸为一个固定大小的区域;而后者将原图上感兴趣的区域直接project到后面的特征图,而小目标project在后面的特征图上可能只剩下了一个像素点,失去了大部分的信息。(这个问题在FPN之后就不是问题了,FPN的浅层特征可以保证小目标有足够的空间信息)
- 修改RPN:设置更小的prior anchor;使用更小的stride;使用更浅层的特征图缩小感受野
- 利用上下文(context)。
-
两个前端子网络分别以proposal region和context region(直接裁剪proposal周围的区域形成context region)作为输入,后端子网络将两个特征向量连接起来计算最终的分类分数
-
图中的3x和7x表示context region的大小被设置为proposal region的3倍和7倍
-
我们还研究了一个基于 ConvNet 的共现模型,该模型利用大物体的检测来更好地定位小物体。大小对象之间的空间关系作为可学习的参数被集成到端到端的训练框架中。但是,我们发现这种方法仅在连接到 Baseline AlexNet 时有效,在连接到两个 ContextNets 时没有任何改进
-
结果
相关文章
- BEVFusion:Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation——论文笔记
- SC-DepthV3:Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes——论文笔记
- 《NeW CRFs:Neural Window Fully-connected CRFs for Monocular Depth Estimation》论文笔记
- 《WSVD:Web Stereo Video Supervision for Depth Prediction from Dynamic Scenes》论文笔记
- 《Boosting Monocular Depth Estimation Models to High-Resolution ...》论文笔记
- 《RAFT:Recurrent All-Pairs Field Transforms for Optical Flow》论文笔记
- 《ADVENT:Adversarial Entropy Minimization for Domain Adaptation in Semantic Segmentation》论文笔记
- 《CrowdDetection:Detection in Crowded Scenes: One Proposal, Multiple Predictions》论文笔记
- 《Relation Networks for Object Detection》论文笔记
- 《TridentNet:Scale-Aware Trident Networks for Object Detection》论文笔记
- 《Matrix Nets:A New Deep Architecture for Object Detection》论文笔记
- 《GIoU: A Metric and A Loss for Bounding Box Regression》论文笔记
- 《PANet:Path Aggregation Network for Instance Segmentation》论文笔记
- 《UPSNet:A Unified Panoptic Segmentation Network》论文笔记
- 《HRNet-OCR:Object-Contextual Representations for Semantic Segmentation》论文笔记
- 《MGMatting:Mask Guided Matting via Progressive Refinement Network》论文笔记
- 《Context Prior for Scene Segmentation》论文笔记
- 《ICNet for Real-Time Semantic Segmentation on High-Resolution Images》论文笔记
- 《LEDNet:A Lightweight Encoder-Decoder Network For Real-Time Semantic Segmentation》论文笔记
- 《RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation》论文笔记
- 《DMCP:Differentiable Markov Channel Pruning for Neural Networks》论文笔记
- 《FPGM:Filter Pruning via Geometric Median for Deep Convolutional Neural Networks Acceleration》论文笔记
- 《Deep Compression》论文笔记
- 《Pruning Filters for Efficient Convnets》论文笔记
- 论文阅读笔记stylegan:A Style-Based Generator Architecture for Generative Adversarial Networks
- 论文阅读笔记from image to imuge:immunized image generation
- 论文阅读笔记ECCV 2018: Factorizable net: an efficient subgraph-based framework for scene graph generation
- 论文阅读笔记large scale gan training for high fidelity natural image synthesis(biggan)