本文主要是介绍How Far are We from Solving Pedestrian Detection?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
摘要
作者从 传统方法 和 最近比较火的convnets 来分析当前行人检测出错的地方,错误主要包括两种:定位(localisation)错误;和前景背景区分错误。并提出了一个经过新的校准的Caltech dataset.
一、引言
1. 定位问题是 导致high confidence的虚警的重要原因,解决这个问题的途径是提高训练集的标注信息的准确度;前景背景的区分度可以通过研究convnets来找到影响因素。
2. 在过去几年,大多数方法都是基于 ICF 框架的衍生。许多研究重心都在improved features,以得到更好的performance.而加入optical flow 和context information也有助于提高检测准确度。
3. 另一个框架就是convnet了,基于目标检测的框架做fine-tuning。
二、正文前言
1. Caltech dataset, MR标准,FPPI.
2. Filtered channel feature detectors中,目前最好的是Checkerboards detector,他也是ICF的一种衍生,对HOG+LUV feature channels进行 filter,然后用boosted decision forest 训练。RotatedFilters是简化版的LDCF,比Checkerboards的准确度差1pp,但是快6倍。
三、the state of the art 方法的分析
1.检测错误有两种,一种是false positives,把background当行人;或对行人的定位不准确。另一种是false negatives,行人的得分较低,或直接被missing.
其中,FP errors又可分为三种,详情如下图:
FN 如下:
综上,FP中定位问题包括对一个行人有重复的BB,这个可通过一些策略或NMS来解决。FN的小尺寸和遮挡问题有待提高。
四、提高the state of art
1. 定位和前景背景错误都很重要,在原dataset 上,去除一些错误的标注,和校准一些不太准确的标注,都有助于提高检测质量。
2. convnet 在图像分类和目标检测上性能很好,但对于小物体的定位还有一定的局限性,可能与pooling有关系,这时候bb regression和NMS就显得比较重要。而前景背景的区分度上也有待提升,说明convnet对于分类还有提升空间。
这篇关于How Far are We from Solving Pedestrian Detection?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!