多模态(RGB-D)——人脸识别

最新推荐文章于 2025-04-17 11:41:20 发布

Peanut_范

最新推荐文章于 2025-04-17 11:41:20 发布

阅读量1.3w

点赞数 7

分类专栏：人脸识别文章标签：多模态 RGB-D 人脸识别

本文链接：https://blog.csdn.net/u013841196/article/details/82940647

版权

人脸识别专栏收录该内容

27 篇文章

订阅专栏

《RGB-D Face Recognition via Deep Complementary and Common Feature Learning》
FG 2018，Hao Zhang, Hu Han, Jiyun Cui, Shiguang Shan, Xilin Chen.

近年，利用RGB-D数据进行人脸识别的方案已经被广泛采用，然而现有方法多使用相同处理方式处理所有的模态，这没有充分考虑模态的差异，忽略了模态之间的相关性。作者提出一种新的RGBD多模态融合的人脸识别方案，能够学习多个模态之间的共同特征以及互补特征，进一步扩展多模态的学习能力。
RGB-D人脸识别由两个典型应用场景组成：
（1）multi-modality matching, e.g., RGB-D probe vs. RGB-D gallery
（2）cross-modality matching, e.g., RGB probe vs. RGB-D gallery
在这里插入图片描述
1.针对multi-modality matching
由于RGB和depth分别描述了人脸的纹理和形状信息，这两种模态应该是相关且可以互补的，通过引入联合损失，来增强模态之间的交互。基本架构如下图所示：

为了得到互补性的特征，同时优化各个模态的单独损失和联合损失，损失函数如下式所示：
在这里插入图片描述
其中， $W_{j}$ 为单个模态学习的权重矩阵， $W_{j}$ 为联合学习的权重矩阵， $y_{j}$ 为样本的id。为了得到更好的实验结果，作者对深度图的训练样本做了预处理，处理方式如下图所示，去除了较多的噪声：
在这里插入图片描述
整个网络的实现细节如下图所示：

引入loss4，增强互补特征学习，实现细节：

最后，使用RGB的FC1024特征和Depth的FC1024特征分别计算RGB-RGB的匹配得分值，Depth-Depth的匹配得分值，之后通过加权融合得到最后得分：
在这里插入图片描述
2.针对cross-modality matching
当深度图缺失时，提出把cross-modality matching：RGB to RGB-D分成两个子问题，(i)
RGB to RGB matching,and (ii) RGB to depth matching.
(i)RGB to RGB matching
直接使用提出的上面互补特征学习的网络，来获得RGB-to-RGB的匹配得分。
(ii) RGB to depth matching
提出学习共性特征从RGB和Depth，具体如下图所示：
在这里插入图片描述
3.RGB-D评测数据集：

4.互补特征的实验结果：

5.错误数据分析

6.参考：
报告人：韩琥
报告：《多模态人脸识别与属性学习》
主页：https://sites.google.com/site/huhanhomepage