人脸识别“Neural Aggregation Network for Video Face Recognition”
for Network 人脸识别 Video Neural Face Recognition Aggregation
2023-09-11 14:20:42 时间
人脸识别的新方法。主要对视频进行处理。使用CNN提取视频中多帧人像的特征,之后使用聚合模块对全部帧的特征向量进行学习累积。实验结果表明这样的方法比手工设计的方法如平均池化要好。人脸识别结构例如以下图所看到的:
视频中的人脸包括了目标不同姿态及光照条件下的图像,视频人脸识别的关键是怎样有效的怎样不同帧中的人脸信息,保留有效的信息并去除噪声。
经常使用的方法有池化,即平均池化和最大化池化,作者设计了一个自适应权值方法。使得特征表示变为:
累积模块的结构如图1所看到的。包括两个Attention块。每一个都将特征与核q进行卷积,生成一个与原始特征
作者觉得上下文自适应的核可以获取更好的结果。因此使用了两个attention块,让第一个核通过转换函数适应第二个核:
第一个attention块
在Youtube上的实验结果例如以下:
相关文章
- Leetcode: Minimum Domino Rotations For Equal Row
- DataTables warning: table id=dataTable - Requested unknown parameter 'acceptId' for row 0. For more
- What is a good network graph library for language X?
- 报错:Linux Restarting network (via systemctl): Job for network.service failed
- Aspose.Words for .NET使用表格教程之处理合并的单元格
- 范围for语句
- 用Navicat for oracle导入现有数据库
- Vue - v-for 循环渲染多个 “重复“ 子组件(仅 ref 不同,this.$refs.xx 使用时依然能准确找到子组件)将子组件 ref 设为动态,这样每个子组件都是 “独立“ 的!详细教程
- 话说模式匹配(5) for表达式中的模式匹配
- Use Memcached for Java enterprise performance, Part 1: Architecture and setup
- No identifier specified for entity 错误
- java for语句
- Unable to find IPv4-only network bridge for LXD.
- Android Wear - App Structure for Android Wear(应用结构)
- 解决MacOS ssh证书 每次都需要输入密码的问题 Enter passphrase for key everytime
- 《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》论文笔记
- 《LEDNet:A Lightweight Encoder-Decoder Network For Real-Time Semantic Segmentation》论文笔记
- 《Learning a Discriminative Feature Network for Semantic Segmentation》论文笔记
- 《To prune, or not to prune:exploring the efficacy of pruning for model compression》论文笔记
- 《SRN-DeblurNet:Scale-recurrent Network for Deep Image Deblurring》论文笔记