物体检测之选择性搜索(Selective Search)

本文主要是介绍物体检测之选择性搜索(Selective Search)，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

物体检测之选择性搜索Selective Search

0 概述
1 物体检测和物体识别
- 1.1 滑窗法
- 1.2 候选区域（Region Proposal）算法
- - 1.2.1 物体检测之选择性搜索(Selective Search)
  - - 1.2.1.1 相似度
    - 1.2.1.2 效果
2 参考资料

0 概述

本文牵涉的概念是候选区域（Region Proposal ），用于物体检测算法的输入。无论是机器学习算法还是深度学习算法，候选区域都有用武之地。

本文的来源是翻译参考资料里的《Selective Search for Object Detection (C++ / Python)》，这是国外一个大神的博客，讲的是择性搜索(Selective Search)这一种产生候选区域的算法。这个算法并不是那个博主的原创，原创是2013年的一篇论文，我发现国内很多博客都做了介绍。

由于本人想系统的把从机器学习到深度学习的物体检测算法捋一遍，所以在此把国外大神的博客翻译一下，另外加一些自己的理解。

1 物体检测和物体识别

物体识别是要分辨出图片中有什么物体，输入是图片，输出是类别标签和概率。物体检测算法不仅要检测图片中有什么物体，还要输出物体的外框（x, y, width, height）来定位物体的位置。

物体检测的核心就是物体识别。

为了定位物体，我们需要选择一些子区域并在子区域上运行物体识别算法。物体的位置就是物体识别算法返回最高概率的子区域内。

在这里插入图片描述
产生候选子区域的最直接的方法就是滑窗法，但是这种办法效率比较低，一般使用‘候选区域’算法，而择性搜索(Selective Search)就是最流行的候选区域产生算法之一（个人理解：这个最流行可能是针对论文那两年说的，现在深度学习都是使用网络产生候选区域，不用算法生成了）。

1.1 滑窗法

在滑窗方案中，我们要使用一个小窗口遍历搜索整张图片，在每个位置上对滑窗内的图片做物体识别算法。不仅要搜索不同的位置，还要遍历不同的大小，工作量可想而知。

问题还没完，对于人脸和人体这种长宽比基本固定的物体还好，对于长宽不固定的物体，搜索起来简直就是噩梦，计算量直接飙升。

1.2 候选区域（Region Proposal）算法

滑窗法的问题可以使用候选区域产生算法解决。这些算法输入整张图片，然后输出可能有物体的候选区域位置，这些候选区域可以有噪声或者重叠，或者和物体的重合度不是很好，这都不要紧，只要这些区域里有一个和实际物体的位置足够接近就行。因为不好的候选区域会被物体识别算法过滤掉。

候选区域算法用分割不同区域的办法来识别潜在的物体。在分割的时候，我们要合并那些在某些方面（如颜色、纹理）类似的小区域。相比滑窗法在不同位置和大小的穷举，候选区域算法将像素分配到少数的分割区域中。所以最终候选区域算法产生的数量比滑窗法少的多，从而大大减少运行物体识别算法的次数。同时候选区域算法所选定的范围天然兼顾了不同的大小和长宽比。

候选区域算法比较重要的特征就是要有较高的召回率。我们要通过这种方法保证拥有物体的区域就在候选区域列表里。所以我们不介意有很多区域什么都有，这都没关系，物体检测算法会过滤掉他们，虽然会浪费一点时间。

目前已有不少成熟的后续区域产生算法：