关于opencv-CascadeClassifier(级联分类器)的初步认识

2023-11-01 11:32

本文主要是介绍关于opencv-CascadeClassifier(级联分类器)的初步认识,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

级联分类器包括两个:训练和检测;
这里主要是介绍检测部分;
如果需要利用cascade训练模型,可以参考:opencv级联分类器训练过程记载

关于CascadeClassifier的简介:

CascadeClassifier是opencv下objdetect模块中用来做目标检测的级联分类器的一个类;简而言之是滑动窗口机制+级联分类器的方式;早期opencv版本仅支持haar特征的目标检测,分别在opencv2.2和2.4之后开始支持LBP和HOG特征的目标检测。

Haar特征:
类Haar-like特征描述如下图:
在这里插入图片描述
在所有缩放尺度下,这些特征组成了boosting分类器使用的全部“原材料”。他们从原始灰度图像的积分图中快速计算得出。

LBP特征:
LBP是一种描述图像局部纹理特征的算子,被用于Viola-Jones检测器,回想Haar小波,它是在一小块邻域上通过小波变换的特征向量,而LBP在构造特征向量与此不同,在一个长宽都为3的倍数的矩形上,将它分割成不相重叠的3*3的小块,在每一个小块上,用积分图计算像素和,然后将中心点像素与周围8个像素点比较得到一个8位的特征值,用来描述相应矩形的特征。

在这里插入图片描述
HOG特征:
局部归一化的梯度方向直方图,是一种对图像局部重叠区域的密集型描述符, 它通过计算局部区域的梯度方向直方图来构成特征。
本质:统计图像局部区域的梯度方向信息来作为该局部图像区域的表征。

解读CascadeClassifier源代码:

打开:opencvXXX/include/opencv2/objdetect.hpp:

class CV_EXPORTS_W CascadeClassifier
{
pubilc:CV_WRAP CascadeClassifier();// @param filename Name of the file from which the classifier is loaded.//构造函数;@参数:要加载的分类器名称CV_WRAP CascadeClassifier(const String& filename);~CascadeClassifier();//@brief Checks whether the classifier has been loaded.//判断分类器是否已加载CV_WRAP bool empty() const;//@param filename Name of the file from which the classifier is loaded. //加载分类器;@参数:要加载的分类器名称CV_WRAP bool load( const String& filename );// @brief Reads a classifier from a FileStorage node.// @note The file may contain a new cascade classifier (trained traincascade application) only.//从FileStorage节点中读取一个分类器CV_WRAP bool read( const FileNode& node );//关于detectMultiScale有三个重载:		//@brief Detects objects of different sizes in the input image. The detected objects are returned as a list of rectangles.//@param image Matrix of the type CV_8U containing an image where objects are detected.//@param objects Vector of rectangles where each rectangle contains the detected object, the  rectangles may be partially outside the original image.//@param scaleFactor Parameter specifying how much the image size is reduced at each image scale.//@param minNeighbors Parameter specifying how many neighbors each candidate rectangle should have to retain it.//@param flags Parameter with the same meaning for an old cascade as in the function  cvHaarDetectObjects. It is not used for a new cascade.//@param minSize Minimum possible object size. Objects smaller than that are ignored.//@param maxSize Maximum possible object size. Objects larger than that are ignored. If `maxSize == minSize` model is evaluated on single scale.//实现多尺度检测,检测物体返回一组矩形;//image:输入CV_8U的待检测图像//objects:返回vector<Rect>&类型的检测结果,一组包含检测目标的矩形,其中的矩形可能会部分的在原始图像外侧//scaleFactor:指定在每个图像缩放时图像大小减少了多少,搜索前后两次窗口大小比例系数//minNeighbors:指定每一个候选矩形至少保留着多少相邻矩形//flags:对于旧级联分类器与cvHaarDetectObjects中有相同的含义,不作用于新的级联分类器//目标可检测的最小尺寸,小于该尺寸的目标将被忽略//目标可检测的最大尺寸,大于该尺寸的目标将被忽略CV_WRAP void detectMultiScale( InputArray image,CV_OUT std::vector<Rect>& objects,double scaleFactor = 1.1,int minNeighbors = 3,int flags=0,Size minSize=Size(),Size maxSize=Size())//@param numDetections Vector of detection numbers for the corresponding objects.//numDetections:vector<int>&,返回对应目标的检测数目的vectorCV_WRAP_AS(detectMultiScale2) void detectMultiScale( InputArray image,CV_OUT std::vector<Rect>& objects,CV_OUT std::vector<int>& numDetections,double scaleFactor=1.1,int minNeighbors=3, int flags=0,Size minSize=Size(),Size maxSize=Size() );// if `outputRejectLevels` is `true` returns `rejectLevels` and `levelWeights`CV_WRAP_AS(detectMultiScale2) void detectMultiScale( InputArray image,CV_OUT std::vector<Rect>& objects,CV_OUT std::vector<int>& numDetections,double scaleFactor=1.1,int minNeighbors=3, int flags=0,Size minSize=Size(),Size maxSize=Size() );CV_WRAP bool isOldFormatCascade() const;CV_WRAP Size getOriginalWindowSize() const;CV_WRAP int getFeatureType() const;void* getOldCascade();CV_WRAP static bool convert(const String& oldcascade, const String& newcascade);void setMaskGenerator(const Ptr<BaseCascadeClassifier::MaskGenerator>& maskGenerator);Ptr<BaseCascadeClassifier::MaskGenerator> getMaskGenerator();Ptr<BaseCascadeClassifier> cc;}

一般检测步骤(视频取帧):

1.load()加载xml级联分类器

CascadeClassifier g_cascade
g_cascade.load("XXX/YYY.xml");

2.从视频中取帧,导出image;
3.图像灰度化;
4.图像resize;
5.调用detectMultiScale()实现多尺度检测:

g_cascade.detectMultiScale(InputArray image,	//输入图像CV_OUT std::vector<Rect>& objects,	//输出检测到的目标区域double scaleFactor =1.1,			//搜索前后两次窗口大小比例系数,默认1.1,即每次搜索窗口扩大10%int minNeighbors = 3,				//构成检测目标的相邻矩形的最小个数 如果组成检测目标的小矩形的个数和小于minneighbors - 1 都会被排除,如果minneighbors为0 则函数不做任何操作就返回所有被检候选矩形框int flags = 0,						//若设置为CV_HAAR_DO_CANNY_PRUNING 函数将会使用Canny边缘检测来排除边缘过多或过少的区域 Size minSize = Size(),				//能检测的最小尺寸Size maxSize = Size()				//能检测的最大尺寸);

注:detectMultiScale的检测过程是从最大的size逐步缩小,而不是从最小尺寸逐步扩大(在之前的一个项目中,我需要继续缩小最小框的检测尺寸,因此尝试修改函数的最小尺寸,却并没能影响检测结果;其实应该在减小最小框的检测尺寸的同时,调整scaleFactor,让函数可以继续缩小检测框而不到达下限)


关于对级联分类器理解的一个误区:
之前一直以为流程是这样的,从最大尺寸开始,每次根据scaleFactor进行缩小,直到缩小到下限。。。
后来发现不管怎么缩小下限,都会输出同一个结果:
比如原先输出到尺寸为24,然而24的尺寸不能检测到我希望捕捉到更小目标,不断地调节级联分类器的最小尺寸和每次缩放比例,并不能继续减小输出框的尺寸,始终是24.
不断摸索查资料,最终才知道检测框的尺寸必须比训练样本的尺寸大,训练模型的样本尺寸就是24,因此不可能低于24,调整原图像的缩放比例才是解决之道。


关于minNeighbors的直观感受:
minNeighbors过小会出现大量误检;minNeighbors过大则会有一些目标检测不出;
调节minNeighbors类似于调节一个阈值,来判断是否为目标;

如果需要利用cascade训练模型,可以参考:opencv级联分类器训练过程记载

这篇关于关于opencv-CascadeClassifier(级联分类器)的初步认识的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/322662

相关文章

opencv实现像素统计的示例代码

《opencv实现像素统计的示例代码》本文介绍了OpenCV中统计图像像素信息的常用方法和函数,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 统计像素值的基本信息2. 统计像素值的直方图3. 统计像素值的总和4. 统计非零像素的数量

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

每天认识几个maven依赖(ActiveMQ+activemq-jaxb+activesoap+activespace+adarwin)

八、ActiveMQ 1、是什么? ActiveMQ 是一个开源的消息中间件(Message Broker),由 Apache 软件基金会开发和维护。它实现了 Java 消息服务(Java Message Service, JMS)规范,并支持多种消息传递协议,包括 AMQP、MQTT 和 OpenWire 等。 2、有什么用? 可靠性:ActiveMQ 提供了消息持久性和事务支持,确保消

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

opencv 滚动条

参数介绍:createTrackbar( trackbarname , "hello" , &alpha_slider ,alpha_max ,  on_trackbar )  ;在标签中显示的文字(提示滑动条的用途) TrackbarName创建的滑动条要放置窗体的名字 “hello”滑动条的取值范围从 0 到 alpha_max (最小值只能为 zero).滑动后的值存放在

android-opencv-jni

//------------------start opencv--------------------@Override public void onResume(){ super.onResume(); //通过OpenCV引擎服务加载并初始化OpenCV类库,所谓OpenCV引擎服务即是 //OpenCV_2.4.3.2_Manager_2.4_*.apk程序包,存

OpenCV结构分析与形状描述符(11)椭圆拟合函数fitEllipse()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C++11 算法描述 围绕一组2D点拟合一个椭圆。 该函数计算出一个椭圆,该椭圆在最小二乘意义上最好地拟合一组2D点。它返回一个内切椭圆的旋转矩形。使用了由[90]描述的第一个算法。开发者应该注意,由于数据点靠近包含的 Mat 元素的边界,返回的椭圆/旋转矩形数据

理解分类器(linear)为什么可以做语义方向的指导?(解纠缠)

Attribute Manipulation(属性编辑)、disentanglement(解纠缠)常用的两种做法:线性探针和PCA_disentanglement和alignment-CSDN博客 在解纠缠的过程中,有一种非常简单的方法来引导G向某个方向进行生成,然后我们通过向不同的方向进行行走,那么就会得到这个属性上的图像。那么你利用多个方向进行生成,便得到了各种方向的图像,每个方向对应了很多

树莓派5_opencv笔记27:Opencv录制视频(无声音)

今日继续学习树莓派5 8G:(Raspberry Pi,简称RPi或RasPi)  本人所用树莓派5 装载的系统与版本如下:  版本可用命令 (lsb_release -a) 查询: Opencv 与 python 版本如下: 今天就水一篇文章,用树莓派摄像头,Opencv录制一段视频保存在指定目录... 文章提供测试代码讲解,整体代码贴出、测试效果图 目录 阶段一:录制一段