【人脸检测】DBface_small深度剖析

本文主要是介绍【人脸检测】DBface_small深度剖析，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

摘要： 基于高斯热力图的目标检测是anchor free中的代表方法，其具有原理简单，易于拓展，后处理简单等优势。

1. 简介

采用热力图做人脸检测，最开始是Centernet的出现，其在通用通用目标检测，人体关键点检测，3D目标检测上都达到了std的效果。后来就出现了centerface，采用mobilev2做bonenet，做人脸与关键点检测。但，项目只给出了推理代码，没有给出训练代码。后面我借鉴Centernet项目，复现了一个版本：CenterFace.pytorch，但，训练结果没法达到原文的最好效果。且代码是用的Centernet，所以可读性较差。

今年，出现了DBface，和dbface_small，其中dbface_small只有1.4M也能和retinaface_small一样的精度。同时，项目重构的代码，结构清晰，也便于理解和阅读。

2. 网络模型结构

2.1 神经网络部分

直接上图（PPT画的，😂😂😂）
在这里插入图片描述

Block
就是一个残差模块
ResSE
在每个残差模块的shortcut前，增加一个SE模块
FPN中的UP（借用原作者的经验）
双线性插值Bilinear+Conv+BN+Activation的上采样模块，优于用反卷积、最近邻插值等，所以比较推荐，但是不同框架对这个的支持不一样，造成使用困难
SSH
在输出加了一个SSH模块，增强特征
输出
有三个分支，分别对应人脸box中心点的高斯热力图，人脸box，人脸关键点landmark

2.2 模型原理部分

hm loss
人脸box中心点hm的尺寸为：200*200，hm_target也是200 * 200 ，采用focal loss作为损失函数。hm_target == 1表示正样本，hm_target < 1的表示负样本。所以一个目标用anchor的理念，就只有一个anchor。
- 引入pos_weight，改善大目标检测
  CenterNet AnchorFree的特性是所有目标都一个点，正类贡献无论目标尺寸大小都一样，Anchor Base的特性是目标越大正类loss贡献越大，也正因此，大目标在CenterNet上训练效果总是不好，解决大目标不行，本项目提倡增加pos_weights来处理，并且增加大目标的权重，实验证明有良好的提升大目标效果
box loss——giou loss
box输出为200 * 200 * 4。在Centernet项目中是预测的w，h，采用的是L1loss。DBface中人脸box采用的是[x1, y1, x2, y2]左上，右下，相对box中心的偏差，并用giou loss。
landmark loss
landmark输出为200 * 200 * 10。其也是相对于box中心点的偏差。人脸关键点采用WingLoss