人脸识别技术--双层异构深度神经网络

2024-04-20 02:38

本文主要是介绍人脸识别技术--双层异构深度神经网络,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

基本原理

人类的神经系统在处理信息时是分级的,例如在看一张人脸照片时,首先会从像素中提取人脸的边缘特征,然后将边缘特征组合成部件特征,接下来将部件特征组合成能表达整张人脸的特征,最后基于人脸特征判人脸的属性(例如身份、性别、年龄、种族等)。好的特征能够更好地表达模式(语音、图像等)的属性,因而特征提取是模式识别中最关键的一步。深度神经网络是对人脑神经结构的机器模拟,其思路是由低层特征逐步抽象形成高层特征,从而使特征具有良好的表达能力,能更好地描述模式的本质特性。基于这些优点,深度神经网络已经在语音识别,图像识别等领域取得前所未有的成功。但为了达到较好的性能,深度神经网络通常采用大量数据进行训练(权值学习)。
 
深度神经网络的主要缺点在于它是一种黑盒方法,其细节隐藏在连接节点(神经元)和节点之间的权值中,而这些权值却是没有明确现实意义的(无法确定哪些权值与哪些属性有关,也就是说这种神经网络是同构的),这就导致了先验信息很难加入到网络的训练过程中。但在实际应用中,如果知道权值与属性之间的对应关系,将会给深度神经网络的应用带来非常大的便利。例如,已有一个用于人脸身份识别的深度神经网络模型和少量具有种族标记的人脸图像数据(假设此种族的数据在之前训练数据中没有出现过),现在想更新网络参数并将此网络用于人脸种族识别。由于深度神经网络通常具有非常多(百万级)的参数,当训练数据量较少时,直接对模型进行更新(所有权值都将被更新)通常会导致过拟合,使网络性能变坏。但如果已知权值与“种族”这一属性的对应关系,那么就可以只对少量的权值进行更新,使模型更加适合于人脸种族识别。基于以上原因,我们提出了异构深度神经网络模型(图1)。
 
图 1:异构深度神经网络结构
异构深度神经网络不再是一个黑盒,其中的某些权值是与具体的属性相对应的,甚至网络中的每层也可被设定为具有明确的含义,例如其神经元的激活值对应于某种粒度的特征。利用大量具有属性标记的训练数据,采用多任务学习机制并在损失函数中加入稀疏性约束,通过考察神经元对不同刺激的反馈,可建立网络单元与属性的映射关系,实现网络结构的语义化。利用异构深度神经网络,可在人脸模型中方便地加入光照、遮挡、角度、年龄、种族等多种先验信息,增强了模型的适应性和特征的表达能力。
 
对于跨场景人脸识别问题,例如人证比对,即验证身份证芯片照与现场照的身份是否一致,由于两张照片失配程度较大(非同源、身份证照片分辨率低,两张照片年龄跨度大),会导致特征空间中样本分布的差异性较大,导致比对失败。为了将两张照片映射到同一特征空间中进行比较,在异构深度神经网络基础上,我们提出了双层异构深度神经网络模型。此模型中每层都是一个深度网络(分别以两张照片为输入),在训练时采用二分类损失函数并对两个网络中对应权值的差异性进行正则化,可实现不同图像空间到相同特征空间的映射。在特征空间中,相同身份人脸图像的类内差异变小,而不同身份人脸图像的类间差异变大,从而增强了特征的判别性。
图 2:异构深度神经网络结构

这篇关于人脸识别技术--双层异构深度神经网络的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/919093

相关文章

五大特性引领创新! 深度操作系统 deepin 25 Preview预览版发布

《五大特性引领创新!深度操作系统deepin25Preview预览版发布》今日,深度操作系统正式推出deepin25Preview版本,该版本集成了五大核心特性:磐石系统、全新DDE、Tr... 深度操作系统今日发布了 deepin 25 Preview,新版本囊括五大特性:磐石系统、全新 DDE、Tree

Node.js 中 http 模块的深度剖析与实战应用小结

《Node.js中http模块的深度剖析与实战应用小结》本文详细介绍了Node.js中的http模块,从创建HTTP服务器、处理请求与响应,到获取请求参数,每个环节都通过代码示例进行解析,旨在帮... 目录Node.js 中 http 模块的深度剖析与实战应用一、引言二、创建 HTTP 服务器:基石搭建(一

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

基于UE5和ROS2的激光雷达+深度RGBD相机小车的仿真指南(五):Blender锥桶建模

前言 本系列教程旨在使用UE5配置一个具备激光雷达+深度摄像机的仿真小车,并使用通过跨平台的方式进行ROS2和UE5仿真的通讯,达到小车自主导航的目的。本教程默认有ROS2导航及其gazebo仿真相关方面基础,Nav2相关的学习教程可以参考本人的其他博客Nav2代价地图实现和原理–Nav2源码解读之CostMap2D(上)-CSDN博客往期教程: 第一期:基于UE5和ROS2的激光雷达+深度RG

韦季李输入法_输入法和鼠标的深度融合

在数字化输入的新纪元,传统键盘输入方式正悄然进化。以往,面对实体键盘,我们常需目光游离于屏幕与键盘之间,以确认指尖下的精准位置。而屏幕键盘虽直观可见,却常因占据屏幕空间,迫使我们在操作与视野间做出妥协,频繁调整布局以兼顾输入与界面浏览。 幸而,韦季李输入法的横空出世,彻底颠覆了这一现状。它不仅对输入界面进行了革命性的重构,更巧妙地将鼠标这一传统外设融入其中,开创了一种前所未有的交互体验。 想象

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保