zl程序教程

您现在的位置是:首页 >  硬件

当前栏目

机器学习笔记 - 使用DETR进行目标检测

机器笔记学习 进行 检测 目标 使用
2023-09-14 09:01:36 时间

一、DETR简述

        Transformers 是一种深度学习架构,近年来越来越受欢迎。它们依赖于一种称为注意力的简单而强大的机制,它使人工智能模型能够有选择地关注其输入的某些部分,从而更有效地推理。Transformer 已广泛应用于处理顺序数据的问题,特别是在自然语言处理 (NLP) 任务中,例如语言建模和机器翻译,并且还扩展到了各种任务,例如语音识别,符号数学, 和强化学习。但是,也许令人惊讶的是,计算机视觉还没有被 Transformer 革命席卷而来。

​        为了帮助弥合这一差距,我们正在发布检测变压器 (DETR),一种重要的目标检测和全景分割新方法。与以前的对象检测系统相比,DETR 完全改变了架构。它是第一个成功地将 Transformer 集成为检测管道中的核心构建块的对象检测框架。

        DETR 与最先进的方法的性能相匹配,例如在具有挑战性的 COCO 对象检测数据集上完善且高度优化的 Faster R-CNN 基线,同时还大大简化和精简了架构。

         ​DETR通过将常见的 CNN 与 Transformer 架构相结合,直接(并行)预测最终的检测集。在训练期间,二分匹配唯一地分配具有地面真值框的预测。没有匹配的预测应该产生“无对象”类预测。