zl程序教程

您现在的位置是:首页 >  IT要闻

当前栏目

论文阅读: 1802.Deeplabv3+

2023-04-18 13:10:17 时间

1802.02611:Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

  • 属于典型的DilatedFCN,它是Google提出的DeepLab系列的第4弹。

创新点

  • 在DeepLab v3上的基础上增加了一个Decoder。
    • Decoder将底层特征与高层特征进一步融合,提升分割边界准确度。
    • 从某种意义上看,DeepLabv3+在DilatedFCN基础上引入了EcoderDecoder的思路。
  • 把backbone从ResNet(DeepLabv3所采用)换成了改进的Xception。
    • 改进的Xception主要体现在以下几点:
      • 参考MSRA的修改(Deformable Convolutional Networks),增加了更多的层;
      • 所有的最大池化层使用stride=2的depthwise separable convolutions替换,这样可以改成空洞卷积;
      • 与MobileNet类似,在3x3 depthwise convolution后增加BN和ReLU。
      • 使用trimap实验测量模型在分割边界的准确度。计算边界周围扩展频带(称为trimap)内的mIoU。结果如下:
    • 采用改进的Xception网络作为backbone,网络变得更快、分割效果上有一定的提升。
    • 作者还尝试了在ASPP中加入深度可分离卷积(depthwise separable convolution),发现在基本不影响模型效果的前提下减少计算量。

性能

  • DeepLabv3+在VOC2012测试集上的取得了很好的分割效果: