第14期(六月)组队学习 Task2:LBP特征描述算子-人脸检测

2023-10-12 23:20

本文主要是介绍第14期(六月)组队学习 Task2:LBP特征描述算子-人脸检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

LBP特征描述算子-人脸检测

    • Task2:LBP特征描述算子-人脸检测
      • 1 LBP特征描述算子简介
      • 2 圆形LBP算子
      • 3 LBP算子旋转不变性及等价模式
      • 4 人脸检测流程
      • 5参考代码

Task2:LBP特征描述算子-人脸检测

1 LBP特征描述算子简介

LBP(Local Binary Pattern)是一种用来描述图像局部特征的算子,具有灰度不变性和旋转不变性等优点。LBP可以用于人脸识别和目标检测,OpenCV中相关LBP特征进行人脸识别的接口,另外有LBP特征训练目标检测器的方法,虽然OpenCV实现了LBP特征的计算,但是没有提供一个单独的计算LBP特征的接口,即OpenCV中使用了LBP算法,却没有函数接口。

LBP特征用图像的局部邻域的联合分布 T T T来描述图像纹理特征,假设局部邻域中像素点个数为 P ( P > 1 ) P(P>1) P(P>1),则纹理特征的联合分布 T T T如下式所示。
T = t ( g c , g 0 , . . . , g p − 1 ) p = 1 , 2 , . . . , P T=t(g_c,g_0,...,g_p-1) \qquad p=1,2,...,P T=t(gc,g0,...,gp1)p=1,2,...,P

其中 g c g_c gc表示相应局部邻域中心像素点灰度值, g p g_p gp表示以中心像素点为圆心,以 R R R为半径的圆内像素点灰度值。
假设中心像素点和局部邻域像素点相互独立,则纹理特征的联合分布 T T T如下式所示。
T = t ( g c , g 0 , . . . , g p − 1 ) p = 1 , 2 , . . . , P ≈ t ( g c ) t ( g 0 − g c , . . . , g p − 1 − g c ) T=t(g_c,g_0,...,g_p-1) \qquad p=1,2,...,P \\ \approx t(g_c)t(g_0-g_c,...,g_p-1-g_c) T=t(gc,g0,...,gp1)p=1,2,...,Pt(gc)t(g0gc,...,gp1gc)
式中 t ( g c ) t(g_c) t(gc)决定局部邻域的整体亮度。处理纹理特征时可以忽略它,则
T ≈ t ( g 0 − g c , . . . , g p − 1 − g c ) p = 1 , 2 , . . . , P T \approx t(g_0-g_c,...,g_p-1-g_c) p=1,2,...,P Tt(g0gc,...,gp1gc)p=1,2,...,P
纹理特征为邻域像素点和中心像素点灰度差值的联合分布函数,由于 g p − 1 − g c g_p-1-g_c gp1gc 不受亮度均值影响,即统计量 T T T与灰度值无关。
特征函数如下式所示。
T ≈ t ( g 0 − g c , . . . , g p − 1 − g c ) p = 1 , 2 , . . . , P T \approx t(g_0-g_c,...,g_p-1-g_c) p=1,2,...,P Tt(g0gc,...,gp1gc)p=1,2,...,P
s ( x ) = { 1 , x ≤ 0 0 , x > 0 s(x)=\begin{cases} 1,\quad x\leq 0 \\\\ 0,\quad x>0 \end{cases} s(x)=1,x00,x>0
LBP为二进制编码公式如下式所示
L B P P R = ∑ p = 0 P − 1 s ( g p − g c ) 2 p LBP_P^R=\sum_{p=0}^{P-1}s(g_p-g_c)2^p LBPPR=p=0P1s(gpgc)2p
原始的LBP算子定义在一个 3 ∗ 3 3*3 33邻域内,以邻域中心像素点灰度值为阈值,相邻的8个像素点的灰度值与邻域中心像素点灰度值进行比较,如果周围像素点灰度值大于中心像素点灰度值,周围像素点的位置就被标记为1,反之,标记为0.即邻域内8个像素点与中心像素点灰度值比较后得到一个8位二进制数,将8位二进制数依次排列形成一个二进制数字,该二进制数字就是中心像素点的LBP值,LBP值反映邻域中心像素点周围区域的纹理信息。
注意只有灰度图才能计算LBP特征,彩色图需要转换为灰度图。

在这里插入图片描述

2 圆形LBP算子

基本LBP算子最大缺陷是只能覆盖固定半径范围内想区域,不能满足不同尺寸和频率纹理的要求,为了适应不同尺度的纹理特征,并满足灰度级和旋转不变性要求,对LBP算子进行改进,将 3 ∗ 3 3*3 33邻域扩展到任意邻域,使用圆形邻域代替了正方形邻域,改进后的LBP算子允许在半径为 R R R的圆形邻域内有任意多个像素点。 L B P P R LBP^R_P LBPPR表示半径为 R R R的圆形区域内含有 P P P个采样点的LBP算子。
在这里插入图片描述
对于给定中心点 ( x c , y c ) (x_c,y_c) (xc,yc),其邻域像素点位置为 ( x p , y p ) (x_p,y_p) (xp,yp) p ϵ P p\epsilon P pϵP,其采样点 ( x p , y p ) (x_p,y_p) (xp,yp)计算过程如下式。
x p = x c + R c o s ( 2 π p / P ) y p = y c + R s i n ( 2 π p / P ) x_p= x_c+Rcos({2\pi p/P}) \\ y_p= y_c+Rsin({2\pi p/P}) xp=xc+Rcos(2πp/P)yp=yc+Rsin(2πp/P)
其中 R R R为采样半径, p p p是第 p p p个采样点, P P P是采样数目,如果近邻点不在整数位置上,就需要进行插值运算。

3 LBP算子旋转不变性及等价模式

由于LBP算子具有灰度不变性,不具有旋转不变性,即同一幅图像,进行旋转以后,其特征会有很大的差别,影响匹配精度,对LBP算子进行改进得到具有旋转不变性的LBP特征。
改进方法是不断旋转圆形邻域得到一系列初始定义的LBP值,取最小值作为该邻域的值。
在这里插入图片描述
在这里插入图片描述
一个LBP算子可以产生不同的二进制模式,对于 L B P P R LBP^R_P LBPPR将会产生 2 p 2^p 2p种模式。如果邻域是 7 ∗ 7 7*7 77,就有 2 36 2^{36} 236种模式。二进制模式太多是不利于信息的提取和识别。
实际图像中,大部分LBP模式最多只包含两次从1到0或从0到1的跳变。
等价模式是当某个局部二进制模式所对应的循环二进制数从0到1或从1到0最多有两次跳变时,该局部二进制模式所对应的二进制就是一个等价模式,例如00000000,11111111,11100111是等价模式。
混合模式是除了等价模式之外的称为混合模式。

4 人脸检测流程

人脸检测过程采用多尺度滑窗搜索方式,每个尺度通过一定步长截取大小为 20 ∗ 20 20*20 2020的窗口,然后将窗口放到分类器中判断是不是人脸,如果是人脸,该窗口就通过所有分类器,否则该窗口会在某一级分类器被排除。
在这里插入图片描述

5参考代码

#coding:utf-8
import cv2 as cv
# 读取原始图像
img= cv.imread('test.jpg')
face_cascade=cv.CascadeClassifier('haarcascade_frontalface_default.xml')
face_cascade.load('D:/binchen/tkinter1/txzq1/Lib/site-packages/cv2/data/haarcascade_frontalface_default.xml')
# 检测⼈脸
# 灰度处理
gray = cv.cvtColor(img, code=cv.COLOR_BGR2GRAY)
# 检查⼈脸 按照1.1倍放到 周围最⼩像素为5
face_zone = face_cascade.detectMultiScale(gray, scaleFactor = 2, minNeighbors = 2) # maxSize =
(55,55)
print ('识别⼈脸的信息: \n',face_zone)
# 绘制矩形和圆形检测⼈脸
for x, y, w, h in face_zone:cv.rectangle(img, pt1 = (x, y), pt2 = (x+w, y+h), color = [0,0,255], thickness=2) ##绘制矩形⼈脸区域
# 绘制圆形⼈脸区域 radius表示半径
cv.circle(img, center = (x + w//2, y + h//2), radius = w//2, color = [0,255,0], thickness = 2)
# 设置图⽚可以⼿动调节⼤⼩
cv.namedWindow("result", 0)
# 显示图⽚
cv.imshow("result", img)
# 等待显示 设置任意键退出程序
cv.waitKey(0)
cv.destroyAllWindows()

在这里插入图片描述

这篇关于第14期(六月)组队学习 Task2:LBP特征描述算子-人脸检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/199152

相关文章

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X