zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Python视觉深度学习系列教程 第一卷 第22章 案例:微笑检测

Python案例教程学习 系列 深度 检测 视觉
2023-09-14 09:01:35 时间

        第一卷 第二十二章 案例:微笑检测

        在本章中,我们将构建一个完整的端到端应用程序,该应用程序可以使用深度学习和传统计算机视觉技术实时检测视频流中的微笑。

        为了完成这项任务,我们将在包含微笑和不微笑人脸的图像数据集上训练 LetNet 架构。 一旦我们的网络训练完毕,我们将创建一个单独的 Python 脚本——这个脚本将通过 OpenCV 的内置 Haar 级联人脸检测器检测图像中的人脸,从图像中提取感兴趣的人脸区域 (ROI),然后传递 ROI 通过 LeNet 进行微笑检测。

        1、微笑数据集

        SMILES 数据集由微笑或不微笑的人脸图像组成。 数据集中总共有 13,165 张灰度图像,每张图像的大小为 64×64 个像素。

        需要注意以下两个问题:

        1、因为我们的输入图像不仅会包含人脸,还会包含图像的背景,我们首先需要在图像中定位人脸并提取人脸 ROI,然后才能通过它 通过我们的网络进行检测。 幸运的是,使用传统的计算机视觉方法(例如 Haar 级联)实现。

        2、第二个问题是类不平衡。 虽然数据集中有 13,165 张图像,但其中 9,475 个示例没有微笑,而只有 3,690 个属于微笑类。 鉴于“不微笑”图像与“微笑”示例的数量超过 2.5 倍,我们在设计