zl程序教程

您现在的位置是:首页 >  其他

当前栏目

DL之MTCNN:MTCNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

2023-09-14 09:04:44 时间

DL之MTCNN:MTCNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

目录

MTCNN算法的简介(论文介绍)、架构详解、案例应用

MTCNN算法的架构详解

1、MTCNN的损失函数

2、MTCNN关键步骤

(1)、Proposal Net

(2)、Refine Net

(3)、Output Net

MTCNN算法的使用方法

1、案例应用

CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准


MTCNN算法的简介(论文介绍)、架构详解、案例应用

       MTCNN是一个深度级联多任务框架。该框架用来解决由于各种姿势、照明和遮挡,在不受约束的环境中进行人脸检测和对齐的问题。

Paper地址https://kpzhang93.github.io/MTCNN_face_detection_alignment/ 
github地址https://github.com/kpzhang93/MTCNN_face_detection_alignment
mxnet版本https://github.com/TropComplique/mtcnn-pytorch
pytorch版本https://github.com/YYuanAnyVision/mxnet_mtcnn_face_detection

MTCNN算法的架构详解

       网络采用三网级联结构,首先将图像重新缩放为不同大小的范围(称为图像金字塔),然后第一个模型(Proposal Network 或 P-Net)提出候选面部区域;第二个模型(Refine Network 或 R-Net)过滤边界框;第三个模型(Output Network或 O-Net)输出边界框和面部特征点位置。
 CNN 三个阶段。在第一阶段,它通过浅层 CNN 快速生成候选窗口。然后,它通过更复杂的 CNN 对窗口进行细化以拒绝大量非人脸窗口。最后,它使用更强大的 CNN 来细化结果并输出面部标志位置。
       模型被称为多任务网络,因为级联中的三个模型(P-Net、R-Net 和 O-Net)中的每一个都在三个任务上进行训练,例如进行三种类型的预测:人脸分类、边界框回归和人脸 landmark 定位。

1、MTCNN的损失函数

       针对人脸识别问题,直接使用交叉熵代价函数,对于框回归和关键点定位,使用L2损失。最后把这三部分的损失各自乘以自身的权重累加起来,形成最后的总损失。人脸识别损失函数(cross-entry loss)、回归框的损失函数 (Euclidean loss)、关键点的损失函数 (Euclidean loss)

2、MTCNN关键步骤

(1)、Proposal Net

(2)、Refine Net

(3)、Output Net

MTCNN算法的使用方法

1、案例应用

CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准

CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准_一个处女座的程序猿的博客-CSDN博客