Paddle目标检测学习笔记(二)
Faster R-CNN简析
第一阶段:产生候选区域
使用 Anchor替代 Selective search,选取候选区域
选出包含物体的 Ancho进入Rol Pooling提取特征
第二阶段:对候选区域进行分类并预测目标物体位置
RPN
结构:
训练:
1.向RPN网络输入一个监督信息,判断 Anchor.是否包含物体。
Anchor包含物体-正样本
Anchor不包含物体-负样本
2.根据Anch和真实框loU取值,判断正or负样本
正样本:
与某一真实框loU最大的 Anchor
与任意真实框loU>07的 Anchor
负样本:
与所有真实框的loU<0.3的 Anchor
3.采样规则:
共采样256个样本
从正样本中随机采样,采样个数不超过128个
从负样本中随机采样,补齐256个样本
loss
生成Proposals
RoI pooling
候选框分为若干子区域,将每个区域对应到输入特征图上,取每个区域内的最大值作为该区域的输出。
不足:
在两次取整近似时,导致检测信息与提取出的特征不匹配
解决:RoI Align
BBox Head
补充
Q:请分别列举你所认为的当前最先进的目标检测方法,并解释为什么该方法的是当前最先进的方法?在原理上,该方法做了什么创新?
EfficientDet
来自[1911.09070] EfficientDet: Scalable and Efficient Object Detection (arxiv.org)
主要贡献点是BiFPN和Compound scaling方法,具体我也没有精读,下面是我对其直观的理解。
BiFPN是在FPN的基础上对其进行改进,对原始的FPN模块又添加了添加上下文信息的边,并对每个边乘以一个相应的权重。
Compound scaling方法是一种复合特征金字塔网络缩放方法,统一缩放所有backbone的分辨率、深度和宽度、特征网络和box/class预测网络。
今年的单阶段算法TOOD(来自[2108.07755] TOOD: Task-aligned One-stage Object Detection (arxiv.org)),在COCO数据集上刷新了单阶段目标检测新纪录,但我还没有去了解。
特征金字塔网络缩放方法,统一缩放所有backbone的分辨率、深度和宽度、特征网络和box/class预测网络。
今年的单阶段算法TOOD(来自[2108.07755] TOOD: Task-aligned One-stage Object Detection (arxiv.org)),在COCO数据集上刷新了单阶段目标检测新纪录,但我还没有去了解。
相关文章
- 发现 Linux SpaceFM 文件管理器的威力
- 夯实数据智能底座 共筑数字经济发展“新基石”
- 五分钟教你使用console.log发布公司的招聘信息
- 微软发布 Windows 11 Beta 预览版 Build 22621.1250 和 22623.1250 (KB5023008)
- Windows 11 学院:在 Windows 11 Build 25290 上如何为文件管理器启用标签页拖拽支持
- 微软Windows 11 Dev 预览版 Build 25290 发布:带来新的开始菜单提醒角标
- 微软正用全屏通知提醒 Windows 10 用户免费升级 Windows 11,要点击 5 次才能退出
- Linux Mint 21.2 将于 6 月发布:改进登录屏幕,优化 Pix 图像管理程序等等
- 字节面试也会问SPI机制?
- 微软正式停售 Windows 10 产品密钥 / 许可证:继续提供 ISO 镜像下载,推荐用户升级 Windows 11
- 用复古电脑程序 Toy CPU 学习低级编程
- Windows 11 新功能泄露:现代音量合成器、实验工具和新的文件管理器
- 微软 Windows 11 文件资源管理器全新设计曝光:UI 迎来大修,整合 Microsoft 365
- 对比Pandas,学习PySpark大数据处理
- 微软宣布为Windows 11 21H2设备开启自动更新到22H2版本
- 互联网都在说降本增效,小红书技术团队是怎么做的?
- 微软将继续提供 Windows 10 ISO 镜像下载,即将停售产品密钥 / 许可证
- 微软宣布为Windows 11 21H2 设备开启自动更新到 22H2 版本
- 面试突击:Properties和Yml有什么区别?
- 微软 Windows 11 Beta 预览版 22621.1245 和 22623.1245 (KB5022358) 发布