DL之MTCNN:MTCNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之MTCNN:MTCNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
目录
CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准
MTCNN算法的简介(论文介绍)、架构详解、案例应用
MTCNN是一个深度级联多任务框架。该框架用来解决由于各种姿势、照明和遮挡,在不受约束的环境中进行人脸检测和对齐的问题。
Paper地址:https://kpzhang93.github.io/MTCNN_face_detection_alignment/
github地址:https://github.com/kpzhang93/MTCNN_face_detection_alignment
mxnet版本:https://github.com/TropComplique/mtcnn-pytorch
pytorch版本:https://github.com/YYuanAnyVision/mxnet_mtcnn_face_detection
MTCNN算法的架构详解
网络采用三网级联结构,首先将图像重新缩放为不同大小的范围(称为图像金字塔),然后第一个模型(Proposal Network 或 P-Net)提出候选面部区域;第二个模型(Refine Network 或 R-Net)过滤边界框;第三个模型(Output Network或 O-Net)输出边界框和面部特征点位置。
CNN 三个阶段。在第一阶段,它通过浅层 CNN 快速生成候选窗口。然后,它通过更复杂的 CNN 对窗口进行细化以拒绝大量非人脸窗口。最后,它使用更强大的 CNN 来细化结果并输出面部标志位置。
模型被称为多任务网络,因为级联中的三个模型(P-Net、R-Net 和 O-Net)中的每一个都在三个任务上进行训练,例如进行三种类型的预测:人脸分类、边界框回归和人脸 landmark 定位。
1、MTCNN的损失函数
针对人脸识别问题,直接使用交叉熵代价函数,对于框回归和关键点定位,使用L2损失。最后把这三部分的损失各自乘以自身的权重累加起来,形成最后的总损失。人脸识别损失函数(cross-entry loss)、回归框的损失函数 (Euclidean loss)、关键点的损失函数 (Euclidean loss)
2、MTCNN关键步骤
(1)、Proposal Net
(2)、Refine Net
(3)、Output Net
MTCNN算法的使用方法
1、案例应用
CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准
CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准_一个处女座的程序猿的博客-CSDN博客
相关文章
- 【NLP基础】英文关键词抽取RAKE算法
- 基于TMS320F28377D开发板的DSP CLA算法案例开发手册
- 移动端笔记(8)之bootstrap案例
- php案例:压缩一个文件
- Java8新特性之Stream流(含具体案例)
- 软件方法(下)第9章分析类图案例篇Part04
- 大数据必学Java基础(八十四):注解的案例介绍
- spring springboot关于异步线程实践案例
- 实战案例:初探工程配置 & 图标组件热身
- 浅谈两家大型机构的云原生安全实战案例
- Python中局部放大图案例
- 【Netty】NIO 选择器 ( Selector ) 通道 ( Channel ) 缓冲区 ( Buffer ) 网络通信案例
- Golang指针基本介绍及使用案例详解编程语言
- 零售业加速变革,他们如何用技术淘金?丨AI最佳掘金案例榜
- 学习基于Linux系统C语言编程案例学习(linuxc案例)
- 优化Oracle内存管理优化一个典型案例(oracle内存 典型)
- 案例Redis实现成功,改变行业格局(自己写个redis成功)
- 红色的编程Redis设计规范实践分享(redis设计规范案例)