用于低质量蒙面人脸识别的一致子决策网络

2024-08-27 13:44

本文主要是介绍用于低质量蒙面人脸识别的一致子决策网络,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Consistent Sub-Decision Network for Low-Quality Masked Face Recognition

摘要

        提出了一种利用由多个dropout块组成的在线一致性评估结构来获得对应于人脸不同区域的子决策网络,以获得对应于不同面部区域的子决策,并通过加权双向KL散度来约束子决策,使网络集中在上面而没有遮挡的面部。此外,还进行知识蒸馏,以驱动蒙面人脸嵌入接近原始数据分布,以减轻信息丢失。实验表明,所提出的方法在公共蒙面人脸识别数据集(即 RMFD、MFR2 和 MLFW)上的性能优于基线。

创新点

        1)提出了一致的子决策网络来获得对应于不同面部区域的子决策,并通过加权双向KL散度来约束子决策,使网络更加集中于面部区域(上面的脸没有遮挡)。

        2)进行知识蒸馏,以驱动蒙面人脸嵌入接近原始数据分布,以减轻信息丢失。

模型

        使用 FaceX-Zoo为每个正常人脸图像生成蒙版人脸图像,以获得混合训练数据集。假设正常人脸图像集、混合人脸图像集和身份标签集,组成一对数据集 D 。两个样本 {x_i}^N,{x_i}^M表示为作为来自同一身份的正常人脸图像及其对应的蒙版人脸图像。

        所提出的一致子决策网络的结构。在图的上部,每个人脸被提取成特征图,作为dropout模块的输入以获得多个子决策,不同的颜色区分了具有不同遮罩盖的面部图像的 dropout 模块的输出。应用双向KL散度约束来自动确定子决策一致性的优化方向。在图的下部,使用预训练的正常人脸识别模型来为上面的学生网络提炼指导性知识。

A. 一致的子决策网络

        基于模拟的方法提出从未蒙蔽的面孔生成蒙蔽的面孔。然而,在这些模拟人脸中,仍然存在一些具有负遮挡的低质量样本,从而导致面部特征模糊或缺失。为了解决这个问题,利用由多个dropout块组成的在线一致性评估结构来获得对应于人脸不同区域的子决策。子决策受到加权双向 KL 散度的约束,使网络更多地集中在没有遮挡的上表面上,并提取更多的判别性特征。

        在线子决策一致性评估方法的结构。展平后的特征图通过 dropout 模块生成子决策。一致性是通过子决策之间的 KL 散度来衡量的。

        给定来自D的人脸图像X,首先使用特征图生成器提取输入人脸图像的特征图。然后特征图被展平并通过多个 dropout 块以获得对应于不同面部区域的子决策,这些子决策被收集,并且在实现中设置 n =3。由于已经证明,在网络上重复应用dropout可以近似高斯过程的不确定性,我们进一步将这种不确定性扩展到子决策。在子决策之间应用双向KL散度计算来确定一致性值C(X)。

        子决策一致性可用于从模拟蒙面图像中检测低质量样本。首先,计算子决策之间的分歧。然后,应用激活函数来计算每个输入人脸图像的一致性值。一致性得分输出是[0,1]之间的概率值。如图2所示,可以看到一致性可以应用于从模拟蒙面图像中检测低质量样本。

        子决策一致性可用于从模拟蒙面图像中检测低质量样本。值越大表示子决策一致性和图像质量越高。

        为此,知道低子决策一致性值对应于模拟人脸图像中的低质量样本。然而,不同的子决策侧重于具有不同识别信息的不同面部区域。因此,寻求迫使具有低识别信息的子决策逼近具有高识别信息的子决策,从而使网络更多地集中在上表面而没有遮挡。为了自动评估每个子决策的信息程度,应用概念分支的输出作为双向KL散度约束中的权重。

 B. 知识蒸馏

        正常人脸比蒙面人脸包含更多的识别性身份信息。寻求使蒙面人脸嵌入接近正常人脸嵌入,以减轻信息丢失。具体来说,使用预训练的模型来执行知识蒸馏。给定一对面部图像X^N,X^M,从教师和学生模型中获得正常人脸嵌入 f^N和蒙面人脸嵌入 f^M。为了充分利用不同的面部区域信息,进一步应用概念分支的权重来获得加权嵌入,可以表示为:

        其中,M_{teacher}是预训练模型的嵌入编码器,G是特征图生成器,D_i是第i个dropout块,w^i表示概念分支的输出。使用嵌入之间的余弦距离方法来进行知识蒸馏作为正则项:

        为了保持类间差异和类内聚合,我们使用 CosFace作为我们的分类损失函数,它可以表示为

        总体损失函数公式如下:

这篇关于用于低质量蒙面人脸识别的一致子决策网络的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1111837

相关文章

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

【机器学习】高斯网络的基本概念和应用领域

引言 高斯网络(Gaussian Network)通常指的是一个概率图模型,其中所有的随机变量(或节点)都遵循高斯分布 文章目录 引言一、高斯网络(Gaussian Network)1.1 高斯过程(Gaussian Process)1.2 高斯混合模型(Gaussian Mixture Model)1.3 应用1.4 总结 二、高斯网络的应用2.1 机器学习2.2 统计学2.3

网络学习-eNSP配置NAT

NAT实现内网和外网互通 #给路由器接口设置IP地址模拟实验环境<Huawei>system-viewEnter system view, return user view with Ctrl+Z.[Huawei]undo info-center enableInfo: Information center is disabled.[Huawei]interface gigabit

Golang 网络爬虫框架gocolly/colly(五)

gcocolly+goquery可以非常好地抓取HTML页面中的数据,但碰到页面是由Javascript动态生成时,用goquery就显得捉襟见肘了。解决方法有很多种: 一,最笨拙但有效的方法是字符串处理,go语言string底层对应字节数组,复制任何长度的字符串的开销都很低廉,搜索性能比较高; 二,利用正则表达式,要提取的数据往往有明显的特征,所以正则表达式写起来比较简单,不必非常严谨; 三,使