S3FD

2023-12-15 15:18
文章标签 s3fd

本文主要是介绍S3FD,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2017年的文章了,作者对已有基于anchor的人脸检测算法在感受野不匹配、小脸特征少、anchor匹配不均、以及浅层预测出现大量FP等问题分别分析并提出改进。

在这里插入图片描述

S3FD模型结构如上图可见为SSD的改进版,分别针对现有的不足,作者分别作了以下改进。

1.在模型结构上的改进
这一块作者称为scale-equitable framework,在vgg16模型基础上新增卷积层,并在6层特征图上分别做预测。作者通过对anchor尺度、有效感受野和实际人脸大小分析,设置以上的anchor大小以及在哪些层做预测是比较合适的。

2.在anchor匹配方面的改进
已有anchor匹配策略是先对所有GT找最匹配的anchor,然后再对anchor找匹配IOU大于一定阈值的GT来对anchor贴标签。可是anchor尺度是离散的而人脸大小分布是连续的,就会出现不同大小人脸匹配到的anchor数不均衡,看下图。作者对现有anchor匹配策略做出一定改进:第一步,将阈值大于0.35的anchor设置为正样本,这能增强GT匹配到的anchor数。第二步,对于匹配到anchor较少的GT,降低阈值到0.1,然后依据IOU排序,将最匹配的N个anchor设为GT匹配到的,这能增强小人脸匹配的anchor数。

在这里插入图片描述

3.max out background label
在浅层,anchor较多,造成很多FP,为了减少FP,作者设计了对cls预测采用max out策略。max out指对同一个anchor做多次背景预测(3次),然后将最大的背景预测值作为最终背景预测,而人脸预测只预测一次。

在这里插入图片描述

4.实现细节
作者也做了OHEM,训练增强就是图像增强然后随机裁剪缩放到640,随机翻转。
作者对较浅层的特征图在预测前还做了L2归一化,这是为啥也没讲?

作者将SSD和RPN作为baseline,F代表主干结构,S代表anchor匹配改进,M表示max out。发现结构改善提升最大啊,后面的tricks都有一定提升。
在这里插入图片描述

这篇关于S3FD的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/496908

相关文章

人脸检测:《S3FD: Single Shot Scale-invariant Face Detector》论文详解

最近项目中在做人脸检测识别。现大致对人脸检测做一个总结归纳。 文章链接:《S3FD: Single Shot Scale-invariant Face Detector》 GITHUB :https://github.com/sfzhang15/SFD This paper presents a real-time face detector, named Single Shot Scale