OpenCV-Python(25):Hough直线变换

2024-01-05 19:12

本文主要是介绍OpenCV-Python(25):Hough直线变换,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目标

  • 理解霍夫变换的概念
  • 学习如何在一张图片中检测直线
  • 学习函数cv2.HoughLines()和cv2.HoughLinesP()

原理

        霍夫变换在检测各种形状的的技术中非常流行。如果你要检测的形状可以用数学表达式写出来,你就可以是使用霍夫变换检测它。即使检测的形状存在一点破坏或者扭曲也可以使用。我们下面就看看如何使用霍夫变换检测直线。

        一条直线可以用数学表达式y = mx + c 或者ρ = x cos θ + y sin θ 表示。ρ 是从原点到直线的垂直距离,θ 是直线的垂线与横轴顺时针方向的夹(如果你使用的坐标系不同方向也可能不同,我是按OpenCV 使用的坐标系描述的)。如下图所示:

        所以如果一条线在原点下方经过,ρ 的值就应该大于0度小于180。但是如果从原点上方经过的话,角度不是大于180也是小于180,但ρ 的值小于0。垂直的线角度为0 度,水平线的角度为90 度。 

        让我们来看看霍夫变换是如何工作的。每一条直线都可以用(ρ, θ) 表示。所以我们先创建一个2D 数组(累加器),初始化累加器,所有的值都为0。行表示ρ,列表示θ。这个数组的大小决定了最后结果的准确性。如果你希望角度精确到1 度,你就需要180 列。对于ρ,最大值为图片对角线的距离。所以如果精确度要到一个像素的级别,行数就应该与图像对角线的距离相等。

        想象一下我们有一个大小为100x100 的直线位于图像的中央。取直线上的第一个点,我们知道此处的(x,y)值。把x 和y 带入上面的方程组,然后遍历θ 的取值:0、1、2􈙽、3、. . .180。分别求出与其对应的ρ 的值,这样我们就得到一系列(ρ, θ)的数值对,如果这个数值对在累加器中也存在相应的位置对,就在这个位置上加1。所以现在累加器中的(50,90)=1。(一个点可能存在与多条直线中,所以对于直线上的每一个点可能是累加器中的多个值同时加1)。

        现在取直线上的第二个点。重复上面的过程。更新累加器中的值。现在累加器中(50,90)的值为2。你每次做的就是更新累加器中的值。对直线上的每个点都执行上面的操作,每次操作完成之后,累加器中的值就加1,但其他地方有时会加1, 有时不会。按照这种方式下去得到最后累加器中(50,90)的值肯定是最大的。如果你搜索累加器中的最大值,并找到其位置(50,90)就说明图像中有一条直线,这条直线到原点的距离为50,它的垂线与横轴的夹角为90 度。下面的动画很好的演示了这个过程。

这就是霍夫直线变换工作的方式。下图显示了一个累加器。其中最亮的两个点代表了图像中两条直线的参数 。

OpenCV中的霍夫变换 

        上面介绍的整个过程原理在OpenCV 中被封装成一个函数cv2.HoughLines()。函数是OpenCV中用于检测图像中直线的函数,它是基于霍夫变换的一种实现。

函数原型如下:

lines = cv2.HoughLines(image, rho, theta, threshold[, lines[, srn[, stn[, min_theta[, max_theta]]]]])

参数说明:

  • image:输入图像,通常为二值图像(边缘检测后的图像)。
  • rho:距离分辨率,表示以像素为单位的距离精度。
  • theta:角度分辨率,表示以弧度为单位的角度精度。
  • threshold:累加器阈值,表示直线被检测到所需的最小投票数,高于该值时才被认为是一条直线,也可以把它看成能检测到的直线的最短长度,以像素点为单位。
  • lines:可选参数,用于存储检测到的直线的输出数组。
  • srn:可选参数,表示距离rho的累加器的分割数。
  • stn:可选参数,表示角度theta的累加器的分割数。
  • min_theta:可选参数,表示直线角度的最小值。
  • max_theta:可选参数,表示直线角度的最大值。

函数返回值:

  • lines:检测到的直线的数组,每个直线由rho和theta表示

cv2.HoughLines()函数会在输入图像中应用霍夫变换来检测直线,然后返回检测到的直线的rho和theta值。这些直线可以通过在输入图像上进行绘制来可视化。

import cv2
import numpy as np# 加载图像
image = cv2.imread('image.jpg')
# 灰度转换
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 边缘检测
edges = cv2.Canny(gray, 50, 150, apertureSize=3)# 执行霍夫直线变换
lines = cv2.HoughLines(edges, 1, np.pi/180, 200)# 绘制检测到的直线
if lines is not None:for rho, theta in lines[0]:a = np.cos(theta)b = np.sin(theta)x0 = a * rhoy0 = b * rhox1 = int(x0 + 1000 * (-b))y1 = int(y0 + 1000 * (a))x2 = int(x0 - 1000 * (-b))y2 = int(y0 - 1000 * (a))cv2.line(image, (x1, y1), (x2, y2), (0, 255, 0), 2)# 显示结果
cv2.imshow('Hough Lines', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这个示例中,首先加载图像并将其转换为灰度图像。然后使用Canny边缘检测算法检测图像的边缘。接下来,使用cv2.HoughLines函数执行霍夫直线变换,并设置了一些参数,例如距离分辨率、角度分辨率和阈值。最后,根据检测到的直线参数绘制直线,并显示结果图像。

结果如下:

概率霍夫变换(Probabilistic Hough Transform) 

        从上面的检测过程我们可以发现:仅仅是一条直线都需要两个参数,这需要大量的计算。Probabilistic_Hough_Transform 是对霍夫变换的一种优化。它不会对每一个点都进行计算,而是从一幅图像中随机选取(是不是也可以使用图像金字塔呢,一个点集计算对于直线检测来说已经足够了。但是使用这种变换我们必须降低低阈值,因为总的点数变少了阈值值肯定也要小呀。下图是对两种方法的对比。

OpenCV 中使用的Matas, J. Galambos, C. 和Kittler, J.V. 提出的Progressive Probabilistic Hough Transform。这个函数是cv2.HoughLinesP()。函数原型如下:

lines = cv2.HoughLinesP(image, rho, theta, threshold[, lines[, minLineLength[, maxLineGap]]])

参数说明:

  • image:输入图像,通常为二值图像(边缘检测后的图像)。
  • rho:距离分辨率,表示以像素为单位的距离精度。
  • theta:角度分辨率,表示以弧度为单位的角度精度。
  • threshold:累加器阈值,表示直线被检测到所需的最小投票数。
  • lines:可选参数,用于存储检测到的直线的输出数组。
  • minLineLength:可选参数,表示直线的最小长度阈值,比这个短的都会忽略。
  • maxLineGap:可选参数,表示直线上的最大间隙,小于此值得看做是直线。

函数返回值:

  • lines:检测到的直线的数组,每个直线由起点和终点表示。

cv2.HoughLinesP()函数会在输入图像中应用霍夫变换来检测直线,然后返回检测到的直线的起点和终点坐标,这些直线可以通过在输入图像上进行绘制来可视化,而在前面的例子中,我们只得到了直线的参数,而且你必须找到所有的直线。而在这里一切变得很直接很简单。

import cv2
import numpy as npimg = cv2.imread('dave.jpg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray,50,150,apertureSize = 3)minLineLength = 100
maxLineGap = 10lines = cv2.HoughLinesP(edges,1,np.pi/180,100,minLineLength,maxLineGap)for x1,y1,x2,y2 in lines[0]:cv2.line(img,(x1,y1),(x2,y2),(0,255,0),2)
cv2.imwrite('houghlines5.jpg',img)

结果如下:

这篇关于OpenCV-Python(25):Hough直线变换的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/573886

相关文章

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

opencv图像处理之指纹验证的实现

《opencv图像处理之指纹验证的实现》本文主要介绍了opencv图像处理之指纹验证的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、简介二、具体案例实现1. 图像显示函数2. 指纹验证函数3. 主函数4、运行结果三、总结一、

Python如何使用__slots__实现节省内存和性能优化

《Python如何使用__slots__实现节省内存和性能优化》你有想过,一个小小的__slots__能让你的Python类内存消耗直接减半吗,没错,今天咱们要聊的就是这个让人眼前一亮的技巧,感兴趣的... 目录背景:内存吃得满满的类__slots__:你的内存管理小助手举个大概的例子:看看效果如何?1.

Python+PyQt5实现多屏幕协同播放功能

《Python+PyQt5实现多屏幕协同播放功能》在现代会议展示、数字广告、展览展示等场景中,多屏幕协同播放已成为刚需,下面我们就来看看如何利用Python和PyQt5开发一套功能强大的跨屏播控系统吧... 目录一、项目概述:突破传统播放限制二、核心技术解析2.1 多屏管理机制2.2 播放引擎设计2.3 专

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Python实现无痛修改第三方库源码的方法详解

《Python实现无痛修改第三方库源码的方法详解》很多时候,我们下载的第三方库是不会有需求不满足的情况,但也有极少的情况,第三方库没有兼顾到需求,本文将介绍几个修改源码的操作,大家可以根据需求进行选择... 目录需求不符合模拟示例 1. 修改源文件2. 继承修改3. 猴子补丁4. 追踪局部变量需求不符合很

python+opencv处理颜色之将目标颜色转换实例代码

《python+opencv处理颜色之将目标颜色转换实例代码》OpenCV是一个的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上,:本文主要介绍python+ope... 目录下面是代码+ 效果 + 解释转HSV: 关于颜色总是要转HSV的掩膜再标注总结 目标:将红色的部分滤

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1