图像边缘检测之精确定位

2023-10-07 19:50

本文主要是介绍图像边缘检测之精确定位,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 边缘位置定义
  • 图像预处理
    • 1. 边缘区域图像粗定位(模版匹配)
    • 2. 边缘y坐标粗定位(水平投影)
    • 3. 边缘区域的x坐标定位(leetcode算法应用)
  • 计算边缘位置
  • 亚像素定位
  • 参考文献

前言

现如今,计算机视觉中关于边缘检测已经有许多算子的出现,但对于精密检测往往不能取得较好的效果。

在这里插入图片描述
如图所示,需要计算图中黑色部分右侧曲线边缘的位置。虽然黑色部分和灰色部分的灰度值差异较大,但由于图中噪声较多,图像边缘处灰度值变化较为缓和,使用图像滤波会让边缘更加模糊,不利于精确检测。
使用Sobel算子检测效果有大量噪声出现,使用阈值较高的canny算子检测01,会出现关键部分边缘检测不到,使用阈值较低的canny算子检测02,也会出现大量噪声。
在这里插入图片描述
针对这种情况,本文结合博主经历的具体的工业项目,提出一种先粗定位,再提取边缘位置区域,最后精定位的方法,能够精确检测出边缘位置。

边缘位置定义

实际的成像系统中,感光元不但接收照射到自身感光面的光,还接收照射到相邻感光元的光,尤其是对边缘点,物体和背景的不同反射特性以及器件的积分效应,造成器件对阶跃边缘的响应产生由明到暗(或由暗到明)的渐变过程,所以边缘在图像中表征为一种灰度分布,如图所示:

在这里插入图片描述
通常情况下,我们认为灰度值变化速度最快的地方为边缘位置,可以通过计算像素灰度值的梯度来确定边缘。对于精度要求较高的场景,可以使用曲线拟合的方式,拟合出类似图中连续边缘的曲线,连续边缘曲线上梯度最大处对应的x坐标值即为边缘位置。本文所选的题目是洗衣瓶厂家针对洗衣瓶标签粘贴效果检测提出的,需要检测出洗衣瓶标签粘贴是否有偏移或褶皱的情况。因篇幅问题,仅针对标签上边缘位置检测进行讨论。

在这里插入图片描述

图像预处理

为了计算灰度值变化最快的像素位置,我们需要先定位出能够真实代表标签上边缘的ROI区域,类似于下图尺寸大小的区域,用于计算边缘梯度。

在这里插入图片描述
由于标签可能是偏移的,不能通过确定的数值抠出代表标签上边缘区域的图片,因此,我们分为一下3个步骤:
(1)边缘区域图像粗定位;
(2)边缘y坐标粗定位;
(3)边缘区域的x坐标定位。

1. 边缘区域图像粗定位(模版匹配)

使用opencv中模版匹配的方法,与标准图像中的模版进行匹配,效果如下:

在这里插入图片描述
关于opencv中模版匹配的原理及代码,网上有大量的说明,这里不再详细介绍。

2. 边缘y坐标粗定位(水平投影)

首先选取合适的阈值,对图像进行二值化。
在这里插入图片描述
因数字识别中垂直投影带来的灵感,这里我们将二值化后的黑白图进行水平投影,再从上到下计算每行黑色像素数,当检测到有连续的黑色像素,且长度大于一定值时(避免噪声影响),认为该行是边缘y坐标的大概位置。(因为这里的二值化后图片的边缘并不等同于实际的边缘,因此是y坐标大概的位置

//二值化
Mat threshRect;
threshold(matchRect, threshRect, 40, 255, THRESH_BINARY);//水平投影的数组结果
vector<double> v1 = picshadow_y(threshRect, 0.1); //查找第一次出现黑色像素的行位置 (当 黑色像素数/每行像素数 > 0.05 时,认为是边缘行)
for (int i = 0; i < threshRect.rows; i++) {if (v1[i] >= 0.05 && y1 == 0) { y1 = i;break;}
}
//对 Mat图像进行水平投影,统计每行的(黑色像素数/每行像素总数),以vector的形式返回
vector<double> picshadow_y(Mat binary, double ratio) {vector<double> v;double sum = 0;for (int i = 0; i < binary.rows; i++) {for (int j = 0; j < binary.cols; j++) {if (int(binary.at<uchar>(i, j)) == 0) {sum++;}}v.push_back(sum / binary.cols);sum = 0;}return v;
}

3. 边缘区域的x坐标定位(leetcode算法应用)

由于标签可能是倾斜的,如图所示:
在这里插入图片描述
图中红框区域的像素最能代表边缘位置,为了提取到红框区域,需要找到可以代表红框的x坐标大致位置。我们先提取出粗定位的y坐标对应的行,再找出其中最长的连续黑色像素的位置。
在这里插入图片描述
一时不知道如何写代码实现这个功能,突然想起以前刷过的leetcode算法题中的 找字符串中连续相同字符 题目,便参考相应代码,写出下面的函数,函数返回值为连续黑色像素的中间坐标 x_mean

//容器中长度最大的"0"串的位置
int black_center(vector<int> s) {int ans = 1, cnt = 1, site = 0;bool change = false;for (int i = 1; i < s.size(); ++i) {if (s[i] == 0 && s[i - 1] == 0) {cnt++;if (cnt > ans) {ans = max(ans, cnt);site = i;}}else {cnt = 1;}}return (site + 1 - ans / 2);
}

计算边缘位置

根据 图像预处理 中 2、3 步得到的x,y值,从图中截取 20 x 40 大小尺寸的图片,来计算梯度最大位置。对于本项目拍摄的图片,边缘处的过度像素数大概在6个左右,因此,20 x 40 大小尺寸能够确保能够完整提取到边缘变化位置的像素。
再以每行像素灰度值的平均值,作为该行像素的灰度值,计算梯度最大处,即为上边缘位置 upsite

//计算最大梯度的区域Mat edge = matchRect(Range(y1-10, y1+10), Range(middle_x - 20, middle_x + 20));       double mean[20] = {0};vector<double> grad;           //grad为每行平均像素值的梯度for (int i = 0; i < edge.rows; i++) {for (int j = 0; j < edge.cols; j++) {mean[i] += int(edge.at<uchar>(i, j));}mean[i] /= edge.cols;if (i > 0) { grad.push_back(abs(mean[i - 1] - mean[i])); }}auto maxp = max_element(grad.begin(), grad.end());            //计算梯度最大值int maxsite = maxp - grad.begin();                            //计算梯度最大值的位置upsite = 600 + maxLoc.y + y1 - 10 + (maxsite + 1);            //上边缘位置(int)

亚像素定位

对于精确度要求较高,或者相机分辨率较低的场合,需要对边缘进行亚像素定位。这里参考了论文《图像测量中快速边缘亚像素定位研究》中灰度矩的亚像素定位法,根据n个位置的像素值(边缘近似在中间位置),计算出精确的边缘位置。这篇论文是博主以前《数字图像处理》课程的老师在2009年发表的,行文思路清晰,论证严谨,读起来也倍感亲切。

在这里插入图片描述
文中对比了3种方法,当所选区域的中心与实际边缘位置偏差较大时,使用灰度矩法受该偏差的影响最小,所以选用此方法。以 图像预处理 中的 **(x_mean, upsite)**为中心,提取尺寸为 6*20 的像素区域,统计每行像素灰度平均值代表该行像素灰度值,根据上图公式,使用6个灰度值计算亚像素位置。
在这里插入图片描述
这部分内容只要根据论文结论,编写计算公式即可,不再贴出代码。
类似的还有基于拟合曲线的方法来计算边缘的亚像素位置,知网上也有大量论文可以参考。

参考文献

《图像测量中快速边缘亚像素定位研究》
《基于Sigmoid函数拟合的亚像素边缘检测方法》

这篇关于图像边缘检测之精确定位的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/160070

相关文章

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别

转发来源:https://swift.ctolib.com/ooooverflow-chinese-ocr.html chinese-ocr 基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别 环境部署 sh setup.sh 使用环境: python 3.6 + tensorflow 1.10 +pytorch 0.4.1 注:CPU环境

基于深度学习的轮廓检测

基于深度学习的轮廓检测 轮廓检测是计算机视觉中的一项关键任务,旨在识别图像中物体的边界或轮廓。传统的轮廓检测方法如Canny边缘检测和Sobel算子依赖于梯度计算和阈值分割。而基于深度学习的方法通过训练神经网络来自动学习图像中的轮廓特征,能够在复杂背景和噪声条件下实现更精确和鲁棒的检测效果。 深度学习在轮廓检测中的优势 自动特征提取:深度学习模型能够自动从数据中学习多层次的特征表示,而不需要

自动驾驶---Perception之Lidar点云3D检测

1 背景         Lidar点云技术的出现是基于摄影测量技术的发展、计算机及高新技术的推动以及全球定位系统和惯性导航系统的发展,使得通过激光束获取高精度的三维数据成为可能。随着技术的不断进步和应用领域的拓展,Lidar点云技术将在测绘、遥感、环境监测、机器人等领域发挥越来越重要的作用。         目前全球范围内纯视觉方案的车企主要包括特斯拉和集越,在达到同等性能的前提下,纯视觉方

YOLOv9摄像头或视频实时检测

1、下载yolov9的项目 地址:YOLOv9 2、使用下面代码进行检测 import torchimport cv2from models.experimental import attempt_loadfrom utils.general import non_max_suppression, scale_boxesfrom utils.plots import plot_o

音视频开发基础知识(1)——图像基本概念

像素 **像素是图像的基本单元,一个个像素就组成了图像。你可以认为像素就是图像中的一个点。**在下面这张图中,你可以看到一个个方块,这些方块就是像素。 分辨率 图像(或视频)的分辨率是指图像的大小或尺寸。我们一般用像素个数来表示图像的尺寸。比如说一张1920x1080的图像,前者1920指的是该图像的宽度方向上有1920个像素点,而后者1080指的是图像的高 度方向上有1080个像素点。

【Python机器学习】NMF——将NMF应用于人脸图像

将NMF应用于之前用过的Wild数据集中的Labeled Faces。NMF的主要参数是我们想要提取的分量个数。通常来说,这个数字要小于输入特征的个数(否则的话,将每个像素作为单独的分量就可以对数据进行解释)。 首先,观察分类个数如何影响NMF重建数据的好坏: import mglearn.plotsimport numpy as npimport matplotlib.pyplot as

Java内存泄漏检测和分析介绍

在Java中,内存泄漏检测和分析是一个重要的任务,可以通过以下几种方式进行:   1. 使用VisualVM VisualVM是一个可视化工具,可以监控、分析Java应用程序的内存消耗。它可以显示堆内存、垃圾收集、线程等信息,并且可以对内存泄漏进行分析。 2. 使用Eclipse Memory Analyzer Eclipse Memory Analyzer(MAT)是一个强大的工具,可

AIGC-Animate Anyone阿里的图像到视频 角色合成的框架-论文解读

Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation 论文:https://arxiv.org/pdf/2311.17117 网页:https://humanaigc.github.io/animate-anyone/ MOTIVATION 角色动画的

基于CDMA的多用户水下无线光通信(3)——解相关多用户检测

继续上一篇博文,本文将介绍基于解相关的多用户检测算法。解相关检测器的优点是因不需要估计各个用户的接收信号幅值而具有抗远近效应的能力。常规的解相关检测器有运算量大和实时性差的缺点,本文针对异步CDMA的MAI主要来自干扰用户的相邻三个比特周期的特点,给出了基于相邻三个匹配滤波器输出数据的截断解相关检测算法。(我不知道怎么改公式里的字体,有的字母在公式中重复使用了,请根据上下文判断字母含义) 1