人脸属性 技术总结

2024-06-17 16:32
文章标签 人脸 属性 总结 技术

本文主要是介绍人脸属性 技术总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

对人脸的基本属性 实现 实时性分析。其基本属性包括:68个关键点,表情,年龄(年龄段),性别,种族。

2.可用于研究的数据集

关键点检测可用数据库:BioID100020个关键点),LFPW(1132 张,29个关键点),AFLW25993张,21个关键点),COFW(1852张,每个人脸标定29个关键点),ICCV13/MVFW (2500张,68个关键点),OCFW(3837张,68个关键点),300-W (600张,68个关键点

年龄:FG-NET:(82个人,1002)MORPH:(13673个人,55608张),Adience : (2284个人,26580(年龄、性别识别)IMDBWIKI :(20284个人,523051(年龄、性别识别)),CACD2000 :(2000个人,163446张),LAP

性别:AdienceIMDBWIKI

表情:JAFFECK+MMI

种族:暂未找到

可选大概实现方案:

1.深度学习:

a. 每个属性分别使用:CNN + SoftMaxLoss /EuclideanLoss

b. 一个CNN进行特征提取,使用多loss进行不同属性分析。

2.传统方法:

a. HOG/LBP/Gabor +降维(PCA/Adaboost+SVM/SVR 处理分类/回归 问题


各属性论文的优秀实现方案

,人脸特征点定位:

1. face alignment at 3000fps 2014, 运行较快(3,000 fps on a desktop or 300 fps on a mobile phone) ,但是存在侧脸准确度低,模型文件太大的问题[受特征点个数影响较大],在 300-W (68 landmarks)数据集 Common Subset 误差值为4.95

2. Deep Convolutional Network Cascade 2013采用三级级联的DCNN网络 准确度较高,该方法在LFPW数据集上取得当时(2013年)最好的定位结果。但是预测时间较长,120毫秒/张 , 在LFW5个关键点误差值为1.3左右。

3. Coarse-to-Fine Auto-Encoder Networks (CFAN) for Real-Time Face Alignment 2014 一种由粗到精的自编码器网络,CFAN可以实时地完成人脸人脸对齐(在I7的台式机上达到23毫秒/张)

二,人脸表情识别

1.Convolutional Neural Networks for Facial Expression Recognition 2016 结构简单:[Conv-(SBN)-ReLU-(Dropout)-(Max-pool)]M - [Affine-(BN)-ReLU-(Dropout)]N - Affine - Softmax  . 准确率为65%  dataset provided by Kaggle website, which consists of about 37,000 wellstructured 48 × 48 pixel gray-scale images of faces.

2.Facial Expression Recognition via Learning Deep Sparse Autoencoders  2017准确率在95.7% on CK+  dataset.

三,性别,年龄,种族识别

  1.Age and Gender Classification using Convolutional Neural Networks 2015  这篇文章没有什么新算法,只有调参,改变网络层数、卷积核大小,只要懂得Alexnet,实现这篇文献的算法,会比较容易。Gender accuracy 86.8% Age 预测精准的值 准确率在50.7% ,预测年龄段 准确率在 84.7%, 使用的数据集是Adience

2.基于LBP,亮度、形状直方图的多尺度特征融合的性别识别(Gender Classification Based on Fusion of Different Spatial Scale Features Selected by Mutual Information From Histogram of LBP, Intensity, and Shape)(2013年,IEEE检索)在性别识别中融入信息论概念, 对PCALDA等经典识别算法进行简化,在简化过程中根据熵、互信息量等指标提出一套特征选择理论,很有创新性和跨学科性。The best gender classification accuracy based on pixel intensities was 87.85% for a 36 × 36 pixel image. Results using shape features yielded 91.59% correct classification for 128 × 128 size, and 93.46% using LBP texture features, also on 128 × 128 image sizes. Fusing the three types of features (intensity, shape and texture) yielded the best score of 95.33% on the FERET database.

4.基于形状特征和神经网络的现实人脸性别分类(Gender recognition on real world faces based on shape representation and neural network)(2014年)先对人脸进行对齐操作,用人工神经网络的方法进行分类,在LFW数据库的非正向人脸样本部分做实验,识别率达到89.3%.

 

目前考虑实现方案

一,人脸特征点定位:

        方案1:考虑运行时间 可以复现 face alignment at 3000fps 2014 ,目前有源代码实现起来比较快。

        方案2:考虑精确度 可以复现 Coarse-to-Fine Auto-Encoder Networks (CFAN) for Real-Time Face Alignment 并根据实际情况做相应改进。

二,表情识别:

         方案1:使用 HOG 特征 + SVM进行表情分类,目前实验在CK+ 数据集表现良好。

         方案2:复现 论文  Facial Expression Recognition via Learning Deep Sparse Autoencoders ,但是其训练过程比较复杂,可以考虑先复现 Convolutional Neural Networks for Facial Expression Recognition 2016 看实际效果。

三,性别,年龄,种族:

         方案1: 使用特征融合的方法,基于 LBP,亮度,形状直方图及多尺度融合,然后使用SVM进行分类,实现方案可基于该论文(Gender Classification Based on Fusion of Different Spatial Scale Features Selected by Mutual Information From Histogram of LBP, Intensity, and Shape)做调整。

         方案2:基于  Age and Gender Classification using Convolutional Neural Networks 2015论文 进行改进,实现三种属性的判别。






这篇关于人脸属性 技术总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1069959

相关文章

关于C++中的虚拟继承的一些总结(虚拟继承,覆盖,派生,隐藏)

1.为什么要引入虚拟继承 虚拟继承是多重继承中特有的概念。虚拟基类是为解决多重继承而出现的。如:类D继承自类B1、B2,而类B1、B2都继承自类A,因此在类D中两次出现类A中的变量和函数。为了节省内存空间,可以将B1、B2对A的继承定义为虚拟继承,而A就成了虚拟基类。实现的代码如下: class A class B1:public virtual A; class B2:pu

乐鑫 Matter 技术体验日|快速落地 Matter 产品,引领智能家居生态新发展

随着 Matter 协议的推广和普及,智能家居行业正迎来新的发展机遇,众多厂商纷纷投身于 Matter 产品的研发与验证。然而,开发者普遍面临技术门槛高、认证流程繁琐、生产管理复杂等诸多挑战。  乐鑫信息科技 (688018.SH) 凭借深厚的研发实力与行业洞察力,推出了全面的 Matter 解决方案,包含基于乐鑫 SoC 的 Matter 硬件平台、基于开源 ESP-Matter SDK 的一

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

持久层 技术选型如何决策?JPA,Hibernate,ibatis(mybatis)

转自:http://t.51jdy.cn/thread-259-1-1.html 持久层 是一个项目 后台 最重要的部分。他直接 决定了 数据读写的性能,业务编写的复杂度,数据结构(对象结构)等问题。 因此 架构师在考虑 使用那个持久层框架的时候 要考虑清楚。 选择的 标准: 1,项目的场景。 2,团队的技能掌握情况。 3,开发周期(开发效率)。 传统的 业务系统,通常业

十五.各设计模式总结与对比

1.各设计模式总结与对比 1.1.课程目标 1、 简要分析GoF 23种设计模式和设计原则,做整体认知。 2、 剖析Spirng的编程思想,启发思维,为之后深入学习Spring做铺垫。 3、 了解各设计模式之间的关联,解决设计模式混淆的问题。 1.2.内容定位 1、 掌握设计模式的"道" ,而不只是"术" 2、 道可道非常道,滴水石穿非一日之功,做好长期修炼的准备。 3、 不要为了

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

人工智能机器学习算法总结神经网络算法(前向及反向传播)

1.定义,意义和优缺点 定义: 神经网络算法是一种模仿人类大脑神经元之间连接方式的机器学习算法。通过多层神经元的组合和激活函数的非线性转换,神经网络能够学习数据的特征和模式,实现对复杂数据的建模和预测。(我们可以借助人类的神经元模型来更好的帮助我们理解该算法的本质,不过这里需要说明的是,虽然名字是神经网络,并且结构等等也是借鉴了神经网络,但其原型以及算法本质上还和生物层面的神经网络运行原理存在

Java注解详细总结

什么是注解?         Java注解是代码中的特殊标记,比如@Override、@Test等,作用是:让其他程序根据注解信息决定怎么执行该程序。         注解不光可以用在方法上,还可以用在类上、变量上、构造器上等位置。 自定义注解  现在我们自定义一个MyTest注解 public @interface MyTest{String aaa();boolean bbb()

tensorboard-----summary用法总结

Tensorflow学习笔记——Summary用法         最近在研究tensorflow自带的例程speech_command,顺便学习tensorflow的一些基本用法。 其中tensorboard 作为一款可视化神器,可以说是学习tensorflow时模型训练以及参数可视化的法宝。 而在训练过程中,主要用到了tf.summary()的各类方法,能够保存训练过程以及参数分布图并在

七种排序方式总结

/*2018.01.23*A:YUAN*T:其中排序算法:冒泡排序,简单排序,直接插入排序,希尔排序,堆排序,归并排序,快速排序*/#include <stdio.h>#include <math.h>#include <malloc.h>#define MAXSIZE 10000#define FALSE 0#define TRUE 1typedef struct {i