面部识别必看!5篇顶级论文了解如何实现人脸反欺诈、跨姿势识别等(附链接)...

本文主要是介绍面部识别必看!5篇顶级论文了解如何实现人脸反欺诈、跨姿势识别等(附链接)...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=png

来源:新智元

本文约 1800字 ,建议阅读 5分钟
本文筛选了5篇非常重量级的有关人脸识别的机器学习论文,并提炼出论文最关键的信息。

640?wx_fmt=jpeg

[ 导读 ]面部识别是计算机视觉中最大的研究领域之一。许多公司都投资于面部识别技术的研究和开发。

面部识别是计算机视觉中最大的研究领域之一。现在,我们可以使用面部识别来解锁手机,在安全门上验证身份,并在某些国家/地区进行刷脸支付。许多公司都投资于面部识别技术的研究和开发,本文将重点介绍其中的一些研究,并介绍五篇有关人脸识别的机器学习论文。

1. 大规模多模式人脸反欺诈的数据集和基准

640?wx_fmt=png

随着大量实际应用,人脸识别技术变得越来越重要。从智能手机解锁到人脸验证付款方式,人脸识别可以在许多方面提高安全性和监视能力。

640?wx_fmt=png

但是,该技术也带来一些风险。可以使用多种面部欺诈方法来欺诈这些系统。因此,面部防欺诈对于防止安全漏洞至关重要。

为了支持面部反欺诈研究,本文的作者介绍了一种名为CASIASURF的多模式面部反欺诈数据集。截止本文撰写之日,它是最大的面部反欺诈开放数据集。

具体来说,该数据集包括以RGB,深度和IR方式从1000个主题中拍摄的21000个视频。除了数据集外,作者还提出了一种新颖的多模式融合模型,作为面部反欺诈的基准。

发布/最近更新– 2019年4月1日

作者和投稿人–Shifeng Zhang (NLPR, CASIA, UCAS, China) , Xiaobo Wang (JD AI Research), Ajian Liu (MUST, Macau, China), Chenxu Zhao (JD AI Research), Jun Wan (NLPR, CASIA, UCAS, China), Sergio Escalera (University of Barcelona), Hailin Shi (JD AI Research), Zezheng Wang (JD Finance), Stan Z. Li (NLPR, CASIA, UCAS, China).。

https://arxiv.org/pdf/1812.00408v3.pdf

2. FaceNet:人脸识别和聚类的统一嵌入

640?wx_fmt=png

在本文中,作者提出了一种称为FaceNet的面部识别系统。 

该系统使用深度卷积神经网络优化嵌入,而不是使用中间瓶颈层。作者指出,该方法最重要的方面是系统的端到端学习。

该团队在CPU集群上训练了卷积神经网络1000到2000小时。然后,他们在四个数据集上评估了他们的方法。 

值得注意的是,FaceNet在著名的野外标记人脸(LFW)数据集上的准确性达到99.63%,在Youtube Faces数据库上达到95.12%。

发布/最近更新– 2015年6月17日

作者和撰稿人– Florian Schroff, Dmitry Kalenichenko, and James Philbin, from Google Inc.

https://arxiv.org/pdf/1503.03832v3.pdf

3. 概率脸部嵌入

640?wx_fmt=png
用于面部识别的当前嵌入方法,能够在受控设置中实现高性能。这些方法通过拍摄一张脸部图像并将有关该脸部的数据存储在潜在的语义空间中而起作用。

但是,当在完全不受控制的设置下进行测试时,当前方法无法正常执行。这是由于在图像中缺少面部特征或模棱两可的情况。这种情况的一个例子是监视视频中的人脸识别,其中视频的质量可能很低。

为了帮助解决这个问题,本文的作者提出了概率面孔嵌入(PFE)。作者提出了一种将现有确定性嵌入转换为PFE的方法。最重要的是,作者指出,这种方法有效地提高了人脸识别模型的性能。

发布/最新更新– 2019年8月7日

作者和贡献者–Yichun Shi and Anil K. Jain, from Michigan State University.

https://arxiv.org/pdf/1904.09658.pdf

4. 人脸识别的魔鬼在噪音中

640?wx_fmt=png
商汤研究院,加利福尼亚大学圣地亚哥分校和南洋理工大学的研究人员研究了大规模面部图像数据集中的噪声影响。

由于它们的规模和成本效益,许多大型数据集都容易产生标签噪声。本文旨在提供有关标签噪声源及其在人脸识别模型中的后果的知识。此外,他们的目标是建立并发布一个名为IMDb-Face的干净人脸识别数据集。

该研究的两个主要目标是发现噪声对最终性能的影响,并确定注释脸部身份的最佳策略。为此,该团队手动清理了两个流行的张开面部图像数据集,MegaFace和MS-Celeb-1M。他们的实验表明,仅在其清理的MegaFace数据集的32%和MS-Celeb-1M清理的数据集的20%上训练的模型与在整个原始未清理的数据集上训练的模型具有相似的性能。

发布/最新更新– 2018年7月31日

作者和贡献者–Fei Wang (SenseTime), Liren Chen (University of California San Diego), Cheng Li (SenseTime), Shiyao Huang (SenseTime), Yanjie Chen (SenseTime), Chen Qian (SenseTime), and Chen Change Loy (Nanyang Technological University). 

https://arxiv.org/pdf/1807.11649v1.pdf

5. VGGFace2:用于识别跨姿势和年龄的人脸的数据集

640?wx_fmt=png

关于深度卷积神经网络的面部识别已经进行了许多研究。 反过来,已经创建了许多大规模的面部图像数据集来训练那些模型。 但是,本文的作者指出,先前发布的数据集并未包含有关面部姿势和年龄变化的大量数据。

在本文中,牛津大学的研究人员介绍了VGGFace2数据集。 该数据集包含年龄,种族,照明和姿势变化范围广泛的图像。 数据集总共包含331万张图像和9,131个对象。

发布/最新更新– 2018年5月13日

作者和撰稿人–Qiong Cao, Li Shen, Weidi Xie, Omkar M. Parkhi, and Andrew Zisserman, from the Visual Geometry Group at the University of Oxford. 

https://arxiv.org/pdf/1710.08092v2.pdf

希望上面有关人脸识别的机器学习论文有助于加深您对该领域工作的了解。

编辑:于腾凯

校对:龚力

640?wx_fmt=jpeg

这篇关于面部识别必看!5篇顶级论文了解如何实现人脸反欺诈、跨姿势识别等(附链接)...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901471

相关文章

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

C++工程编译链接错误汇总VisualStudio

目录 一些小的知识点 make工具 可以使用windows下的事件查看器崩溃的地方 dumpbin工具查看dll是32位还是64位的 _MSC_VER .cc 和.cpp 【VC++目录中的包含目录】 vs 【C/C++常规中的附加包含目录】——头文件所在目录如何怎么添加,添加了以后搜索头文件就会到这些个路径下搜索了 include<> 和 include"" WinMain 和

C/C++的编译和链接过程

目录 从源文件生成可执行文件(书中第2章) 1.Preprocessing预处理——预处理器cpp 2.Compilation编译——编译器cll ps:vs中优化选项设置 3.Assembly汇编——汇编器as ps:vs中汇编输出文件设置 4.Linking链接——链接器ld 符号 模块,库 链接过程——链接器 链接过程 1.简单链接的例子 2.链接过程 3.地址和

通过SSH隧道实现通过远程服务器上外网

搭建隧道 autossh -M 0 -f -D 1080 -C -N user1@remotehost##验证隧道是否生效,查看1080端口是否启动netstat -tuln | grep 1080## 测试ssh 隧道是否生效curl -x socks5h://127.0.0.1:1080 -I http://www.github.com 将autossh 设置为服务,隧道开机启动

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为

vue项目集成CanvasEditor实现Word在线编辑器

CanvasEditor实现Word在线编辑器 官网文档:https://hufe.club/canvas-editor-docs/guide/schema.html 源码地址:https://github.com/Hufe921/canvas-editor 前提声明: 由于CanvasEditor目前不支持vue、react 等框架开箱即用版,所以需要我们去Git下载源码,拿到其中两个主

android一键分享功能部分实现

为什么叫做部分实现呢,其实是我只实现一部分的分享。如新浪微博,那还有没去实现的是微信分享。还有一部分奇怪的问题:我QQ分享跟QQ空间的分享功能,我都没配置key那些都是原本集成就有的key也可以实现分享,谁清楚的麻烦详解下。 实现分享功能我们可以去www.mob.com这个网站集成。免费的,而且还有短信验证功能。等这分享研究完后就研究下短信验证功能。 开始实现步骤(新浪分享,以下是本人自己实现

基于Springboot + vue 的抗疫物质管理系统的设计与实现

目录 📚 前言 📑摘要 📑系统流程 📚 系统架构设计 📚 数据库设计 📚 系统功能的具体实现    💬 系统登录注册 系统登录 登录界面   用户添加  💬 抗疫列表展示模块     区域信息管理 添加物资详情 抗疫物资列表展示 抗疫物资申请 抗疫物资审核 ✒️ 源码实现 💖 源码获取 😁 联系方式 📚 前言 📑博客主页:

探索蓝牙协议的奥秘:用ESP32实现高质量蓝牙音频传输

蓝牙(Bluetooth)是一种短距离无线通信技术,广泛应用于各种电子设备之间的数据传输。自1994年由爱立信公司首次提出以来,蓝牙技术已经经历了多个版本的更新和改进。本文将详细介绍蓝牙协议,并通过一个具体的项目——使用ESP32实现蓝牙音频传输,来展示蓝牙协议的实际应用及其优点。 蓝牙协议概述 蓝牙协议栈 蓝牙协议栈是蓝牙技术的核心,定义了蓝牙设备之间如何进行通信。蓝牙协议

python实现最简单循环神经网络(RNNs)

Recurrent Neural Networks(RNNs) 的模型: 上图中红色部分是输入向量。文本、单词、数据都是输入,在网络里都以向量的形式进行表示。 绿色部分是隐藏向量。是加工处理过程。 蓝色部分是输出向量。 python代码表示如下: rnn = RNN()y = rnn.step(x) # x为输入向量,y为输出向量 RNNs神经网络由神经元组成, python