图像边缘检测之精确定位

2023-10-07 19:50

本文主要是介绍图像边缘检测之精确定位,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 边缘位置定义
  • 图像预处理
    • 1. 边缘区域图像粗定位(模版匹配)
    • 2. 边缘y坐标粗定位(水平投影)
    • 3. 边缘区域的x坐标定位(leetcode算法应用)
  • 计算边缘位置
  • 亚像素定位
  • 参考文献

前言

现如今,计算机视觉中关于边缘检测已经有许多算子的出现,但对于精密检测往往不能取得较好的效果。

在这里插入图片描述
如图所示,需要计算图中黑色部分右侧曲线边缘的位置。虽然黑色部分和灰色部分的灰度值差异较大,但由于图中噪声较多,图像边缘处灰度值变化较为缓和,使用图像滤波会让边缘更加模糊,不利于精确检测。
使用Sobel算子检测效果有大量噪声出现,使用阈值较高的canny算子检测01,会出现关键部分边缘检测不到,使用阈值较低的canny算子检测02,也会出现大量噪声。
在这里插入图片描述
针对这种情况,本文结合博主经历的具体的工业项目,提出一种先粗定位,再提取边缘位置区域,最后精定位的方法,能够精确检测出边缘位置。

边缘位置定义

实际的成像系统中,感光元不但接收照射到自身感光面的光,还接收照射到相邻感光元的光,尤其是对边缘点,物体和背景的不同反射特性以及器件的积分效应,造成器件对阶跃边缘的响应产生由明到暗(或由暗到明)的渐变过程,所以边缘在图像中表征为一种灰度分布,如图所示:

在这里插入图片描述
通常情况下,我们认为灰度值变化速度最快的地方为边缘位置,可以通过计算像素灰度值的梯度来确定边缘。对于精度要求较高的场景,可以使用曲线拟合的方式,拟合出类似图中连续边缘的曲线,连续边缘曲线上梯度最大处对应的x坐标值即为边缘位置。本文所选的题目是洗衣瓶厂家针对洗衣瓶标签粘贴效果检测提出的,需要检测出洗衣瓶标签粘贴是否有偏移或褶皱的情况。因篇幅问题,仅针对标签上边缘位置检测进行讨论。

在这里插入图片描述

图像预处理

为了计算灰度值变化最快的像素位置,我们需要先定位出能够真实代表标签上边缘的ROI区域,类似于下图尺寸大小的区域,用于计算边缘梯度。

在这里插入图片描述
由于标签可能是偏移的,不能通过确定的数值抠出代表标签上边缘区域的图片,因此,我们分为一下3个步骤:
(1)边缘区域图像粗定位;
(2)边缘y坐标粗定位;
(3)边缘区域的x坐标定位。

1. 边缘区域图像粗定位(模版匹配)

使用opencv中模版匹配的方法,与标准图像中的模版进行匹配,效果如下:

在这里插入图片描述
关于opencv中模版匹配的原理及代码,网上有大量的说明,这里不再详细介绍。

2. 边缘y坐标粗定位(水平投影)

首先选取合适的阈值,对图像进行二值化。
在这里插入图片描述
因数字识别中垂直投影带来的灵感,这里我们将二值化后的黑白图进行水平投影,再从上到下计算每行黑色像素数,当检测到有连续的黑色像素,且长度大于一定值时(避免噪声影响),认为该行是边缘y坐标的大概位置。(因为这里的二值化后图片的边缘并不等同于实际的边缘,因此是y坐标大概的位置

//二值化
Mat threshRect;
threshold(matchRect, threshRect, 40, 255, THRESH_BINARY);//水平投影的数组结果
vector<double> v1 = picshadow_y(threshRect, 0.1); //查找第一次出现黑色像素的行位置 (当 黑色像素数/每行像素数 > 0.05 时,认为是边缘行)
for (int i = 0; i < threshRect.rows; i++) {if (v1[i] >= 0.05 && y1 == 0) { y1 = i;break;}
}
//对 Mat图像进行水平投影,统计每行的(黑色像素数/每行像素总数),以vector的形式返回
vector<double> picshadow_y(Mat binary, double ratio) {vector<double> v;double sum = 0;for (int i = 0; i < binary.rows; i++) {for (int j = 0; j < binary.cols; j++) {if (int(binary.at<uchar>(i, j)) == 0) {sum++;}}v.push_back(sum / binary.cols);sum = 0;}return v;
}

3. 边缘区域的x坐标定位(leetcode算法应用)

由于标签可能是倾斜的,如图所示:
在这里插入图片描述
图中红框区域的像素最能代表边缘位置,为了提取到红框区域,需要找到可以代表红框的x坐标大致位置。我们先提取出粗定位的y坐标对应的行,再找出其中最长的连续黑色像素的位置。
在这里插入图片描述
一时不知道如何写代码实现这个功能,突然想起以前刷过的leetcode算法题中的 找字符串中连续相同字符 题目,便参考相应代码,写出下面的函数,函数返回值为连续黑色像素的中间坐标 x_mean

//容器中长度最大的"0"串的位置
int black_center(vector<int> s) {int ans = 1, cnt = 1, site = 0;bool change = false;for (int i = 1; i < s.size(); ++i) {if (s[i] == 0 && s[i - 1] == 0) {cnt++;if (cnt > ans) {ans = max(ans, cnt);site = i;}}else {cnt = 1;}}return (site + 1 - ans / 2);
}

计算边缘位置

根据 图像预处理 中 2、3 步得到的x,y值,从图中截取 20 x 40 大小尺寸的图片,来计算梯度最大位置。对于本项目拍摄的图片,边缘处的过度像素数大概在6个左右,因此,20 x 40 大小尺寸能够确保能够完整提取到边缘变化位置的像素。
再以每行像素灰度值的平均值,作为该行像素的灰度值,计算梯度最大处,即为上边缘位置 upsite

//计算最大梯度的区域Mat edge = matchRect(Range(y1-10, y1+10), Range(middle_x - 20, middle_x + 20));       double mean[20] = {0};vector<double> grad;           //grad为每行平均像素值的梯度for (int i = 0; i < edge.rows; i++) {for (int j = 0; j < edge.cols; j++) {mean[i] += int(edge.at<uchar>(i, j));}mean[i] /= edge.cols;if (i > 0) { grad.push_back(abs(mean[i - 1] - mean[i])); }}auto maxp = max_element(grad.begin(), grad.end());            //计算梯度最大值int maxsite = maxp - grad.begin();                            //计算梯度最大值的位置upsite = 600 + maxLoc.y + y1 - 10 + (maxsite + 1);            //上边缘位置(int)

亚像素定位

对于精确度要求较高,或者相机分辨率较低的场合,需要对边缘进行亚像素定位。这里参考了论文《图像测量中快速边缘亚像素定位研究》中灰度矩的亚像素定位法,根据n个位置的像素值(边缘近似在中间位置),计算出精确的边缘位置。这篇论文是博主以前《数字图像处理》课程的老师在2009年发表的,行文思路清晰,论证严谨,读起来也倍感亲切。

在这里插入图片描述
文中对比了3种方法,当所选区域的中心与实际边缘位置偏差较大时,使用灰度矩法受该偏差的影响最小,所以选用此方法。以 图像预处理 中的 **(x_mean, upsite)**为中心,提取尺寸为 6*20 的像素区域,统计每行像素灰度平均值代表该行像素灰度值,根据上图公式,使用6个灰度值计算亚像素位置。
在这里插入图片描述
这部分内容只要根据论文结论,编写计算公式即可,不再贴出代码。
类似的还有基于拟合曲线的方法来计算边缘的亚像素位置,知网上也有大量论文可以参考。

参考文献

《图像测量中快速边缘亚像素定位研究》
《基于Sigmoid函数拟合的亚像素边缘检测方法》

这篇关于图像边缘检测之精确定位的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/160070

相关文章

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

基于WinForm+Halcon实现图像缩放与交互功能

《基于WinForm+Halcon实现图像缩放与交互功能》本文主要讲述在WinForm中结合Halcon实现图像缩放、平移及实时显示灰度值等交互功能,包括初始化窗口的不同方式,以及通过特定事件添加相应... 目录前言初始化窗口添加图像缩放功能添加图像平移功能添加实时显示灰度值功能示例代码总结最后前言本文将

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2757 标注数量(xml文件个数):2757 标注数量(txt文件个数):2757 标注类别数:4 标注类别名称:["Platelets","RBC","WBC","sickle cell"] 每个类别标注的框数: