用 OpenCV 实现图像中水平线检测与校正

2024-06-04 02:28

本文主要是介绍用 OpenCV 实现图像中水平线检测与校正,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

在本文中,我们将探讨如何使用 Python 和 OpenCV 库来检测图像中的水平线,并对图像进行旋转校正以使这些线条水平。这种技术可广泛应用于文档扫描、建筑摄影校正以及机器视觉中的各种场景。

环境准备

首先,确保您的环境中安装了 OpenCV 库。如果还没有安装,可以通过以下命令安装,要注意尽管代码里我们都是使用的cv2,但是安装包要选opencv-python:

pip install opencv-python

试验效果

原始图像

在这里插入图片描述

找出水平线

在这里插入图片描述

基于统计角度旋转

在这里插入图片描述

步骤概述

  1. 图像加载与预处理:加载图像,转换为灰度图,然后使用 Canny 算法检测边缘。
  2. 线条检测:应用霍夫变换来识别图像中的线条。
  3. 水平线条筛选:过滤出接近水平的线条。
  4. 线条可视化:在图像上绘制检测到的水平线。
  5. 计算需要的旋转角度:计算线条的加权平均角度,以确定图像应旋转的角度。
  6. 图像旋转校正:根据计算出的角度旋转图像,以校正线条至水平。

详细实现

  1. 图像加载与预处理
    加载图像并将其转换为灰度图,这是大多数图像处理任务的常见做法,因为它简化了接下来的处理步骤。
image = cv2.imread('test.png') # 读取图片
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 转换成灰度图像
  1. 边缘检测
    使用 Canny 算法进行边缘检测,这是一种广泛使用的边缘检测算法,因为它有效地识别图像中的线条和边缘。
edges = cv2.Canny(gray, 50, 150, apertureSize=3)

参数详解
gray:这是输入图像,Canny 边缘检测通常在灰度图像上进行,因为边缘检测是基于图像亮度变化的。
50:第一个阈值用于边缘检测的低阈值。这是用于Canny算法中的双阈值过程的较低边界。低于此阈值的像素点不会被视为边缘。
150:第二个阈值用于边缘检测的高阈值。这是用于Canny算法中的双阈值过程的较高边界。高于此阈值的像素点将被视为边缘的强候选者。
apertureSize=3:这是用于内部边缘检测的Sobel算子的大小。apertureSize定义了计算图像梯度所用的Sobel核的大小。常用的尺寸是3,但也可以使用更大的尺寸如5或7,这在处理较大的边缘时可以提供更平滑的结果。

  1. 线条检测与筛选
    通过霍夫变换检测线条,然后筛选出接近水平的线条。我们定义了一个函数 filter_horizontal_lines,它计算每条线的角度,并筛选出角度小于设定阈值的线条。
	def filter_horizontal_lines(lines, angle_threshold=10):horizontal_lines = []if lines is not None:for line in lines:x1, y1, x2, y2 = line[0]angle = np.degrees(np.arctan2(y2 - y1, x2 - x1))if abs(angle) < angle_threshold:horizontal_lines.append(line)return horizontal_lineslines = cv2.HoughLinesP(edges, 1, np.pi / 180, 100, minLineLength=100, maxLineGap=10)horizontal_lines = filter_horizontal_lines(lines)

HoughLinesP参数说明

# HoughLinesP使用概率霍夫变换检测图像中的线段 (注意HoughLines和HoughLinesP是两个函数方法)
lines = cv2.HoughLinesP(edges,             # 边缘图像,通常是Canny边缘检测的输出1,                 # rho - 累加器的距离精度,以像素为单位np.pi / 180,       # theta - 累加器的角度精度,以弧度为单位100,               # threshold - 累加器的阈值,仅返回大于此阈值的线段minLineLength=100, # minLineLength - 线段的最小长度maxLineGap=10      # maxLineGap - 同一线条上允许的最大间隙
)
  1. 计算旋转角度
    我们定义了一个函数 calculate_average_angle,它计算所有检测到的水平线条的加权平均角度。这个角度将用于图像旋转校正。注意这里的np.average(angles, weights=lengths)使用了加权,也就是这个函数会基于找到的线段长度,进行角度的加权平均,如果你只是单纯的关注线段的所有角度,可以删掉weights这个参数。
def calculate_average_angle(lines):"""计算线条的加权平均角度。参数:lines (list): 包含线条的列表,每条线条由两个点的坐标表示,格式为 [x1, y1, x2, y2]。返回:float: 线条的加权平均角度,以度为单位。如果没有符合条件的线条,则返回 0。"""angles = []lengths = []if lines:for line in lines:x1, y1, x2, y2 = line[0]# 计算线条的长度length = np.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)# 计算线条的角度,以度为单位angle = np.degrees(np.arctan2(y2 - y1, x2 - x1))# 角度校正,确保处理的角度是接近水平的if abs(angle) > 90:angle -= 180# 只考虑接近水平的线条if abs(angle) < 20:  # 可调整此阈值以更好地适应具体情况angles.append(angle)lengths.append(length)# 计算加权平均角度if lengths:average_angle = np.average(angles, weights=lengths)else:average_angle = 0return average_angleaverage_angle = calculate_average_angle(horizontal_lines) # 调用函数完成平均角度计算
  1. 图像旋转校正
    最后,我们基于返回的角度,旋转图像,使线条尽可能水平。我们使用 OpenCV 提供的仿射变换函数 cv2.warpAffine 来完成这个任务。
def rotate_image(image, angle):(h, w) = image.shape[:2]center = (w // 2, h // 2)M = cv2.getRotationMatrix2D(center, angle, 1.0)rotated = cv2.warpAffine(image, M, (w, h))return rotatedrotated_image = rotate_image(image, average_angle)
cv2.imwrite('rotated_image.jpg', rotated_image)

代码纯享版

import cv2
import numpy as npdef filter_horizontal_lines(lines, angle_threshold=10):horizontal_lines = []if lines is not None:for line in lines:x1, y1, x2, y2 = line[0]angle = np.degrees(np.arctan2(y2 - y1, x2 - x1))if abs(angle) < angle_threshold:horizontal_lines.append(line)return horizontal_lines
#
#
def calculate_average_angle(lines):angles = []lengths = []if lines:for line in lines:x1, y1, x2, y2 = line[0]length = np.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)angle = np.degrees(np.arctan2(y2 - y1, x2 - x1))# 角度校正,确保处理的角度是接近水平的if abs(angle) > 90:angle -= 180# 只考虑接近水平的线条if abs(angle) < 20:  # 可调整此阈值以更好地适应具体情况angles.append(angle)lengths.append(length)# 计算加权平均角度if lengths:average_angle = np.average(angles, weights=lengths)else:average_angle = 0return average_angle# def calculate_average_angle(lines):
#     angles = []
#     lengths = []
#     filtered_lines = []
# 
#     if lines:
#         # 计算每条线的长度和角度
#         for line in lines:
#             x1, y1, x2, y2 = line[0]
#             length = np.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)
#             angle = np.degrees(np.arctan2(y2 - y1, x2 - x1))
# 
#             # 角度校正,确保处理的角度是接近水平的
#             if abs(angle) > 90:
#                 angle -= 180
#             if abs(angle) < 20:  # 只考虑接近水平的线条
#                 filtered_lines.append((angle, length))
# 
#         # 按长度排序,并取最长的前9条线
#         filtered_lines.sort(key=lambda x: x[1], reverse=True)
#         top_lines = filtered_lines[:9]
# 
#         # 分割角度和长度
#         angles, lengths = zip(*top_lines) if top_lines else ([], [])
# 
#     # 计算加权平均角度
#     if lengths:
#         average_angle = np.average(angles, weights=lengths)
#     else:
#         average_angle = 0
# 
#     return average_angle# 使用此函数时,确保传入的lines是过滤后只包含接近水平的线条def draw_lines(image, lines):for line in lines:x1, y1, x2, y2 = line[0]cv2.line(image, (x1, y1), (x2, y2), (0, 255, 0), 3)return imagedef rotate_image(image, angle):(h, w) = image.shape[:2]center = (w // 2, h // 2)M = cv2.getRotationMatrix2D(center, angle, 1.0)rotated = cv2.warpAffine(image, M, (w, h))return rotated# 加载图像
image = cv2.imread('test.png')# 转换为灰度图
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 边缘检测
edges = cv2.Canny(gray, 50, 150, apertureSize=3)# 使用霍夫变换检测线条
lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100, minLineLength=100, maxLineGap=10)# 过滤出横向线条
horizontal_lines = filter_horizontal_lines(lines)# 在原图上绘制检测到的横向线条
image_with_lines = draw_lines(np.copy(image), horizontal_lines)# 保存带线条的图像
cv2.imwrite('image_with_horizontal_lines.jpg', image_with_lines)# 计算线条的加权平均角度
average_angle = calculate_average_angle(horizontal_lines)
print("计算得到的加权平均角度为:", average_angle)# 旋转整个图像使线条水平
rotated_image = rotate_image(image, average_angle)  # 根据角度旋转 正角度表示逆时针旋转,而负角度表示顺时针旋转# 保存旋转后的图像
cv2.imwrite('rotated_image.jpg', rotated_image)print("旋转后的图像已保存为 'rotated_image.jpg'")

结论

通过上述步骤,我们能够自动检测并校正图像中的水平线,这对于许多自动化处理任务来说是非常有用的。本文介绍的方法仅依赖于 OpenCV,易于实现且效果显著。了解相关函数,通过适当调整参数,该技术可以适应不同的应用需求和条件。

这篇关于用 OpenCV 实现图像中水平线检测与校正的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1028803

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X