Machine Vision Technology:Lecture2 Linear filtering

2024-03-01 04:36

本文主要是介绍Machine Vision Technology:Lecture2 Linear filtering,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Machine Vision Technology:Lecture2 Linear filtering

    • Types of Images
    • Image denoising图像去噪
    • Defining convolution卷积的定义
    • Key properties卷积的关键属性
    • 卷积的其它属性
    • Annoying details
    • 卷积练习
    • Sharpening锐化
    • Gaussian Kernel
    • Noise噪声 分类
    • Gaussian noise高斯噪声
    • Reducing salt-and-pepper noise:Median filtering中值滤波
    • Sharpening revisited:再看锐化
    • Edge detection | Origin of edges
    • Characterzing edges描述边缘
    • Image gradient图像梯度

计算机视觉(本科) 北京邮电大学 鲁鹏


Types of Images

二进制图像Binary:黑白图像。0表示Black,1表示White。

灰度图像Grayscale:每个像素用范围在0-255的灰度值表示。

彩色图像Color:RGB三通道。

Image denoising图像去噪

Moving average移动平均:一种通过使用过去若干时间段的平均值计算得出的平均值。移动平均值会定期变化,最早的数值会被基于最新数据的数值所替代。

  • 用邻域的加权平均值替换每个像素
  • 权重被称为滤波器核 filter kernel

一个3x3的权重为平均值的滤波核:

在这里插入图片描述

Defining convolution卷积的定义

Let f be the image and g be the kernel. The output of convolving fwith g is denoted f * g.

f f f 为图像, g g g 为核, f f f g g g 的卷积输出定义为 f ∗ g f*g fg
( f ∗ g ) [ m , n ] = ∑ k , l f [ m − k , n − l ] g [ k , l ] (f*g)[m,n] = \sum_{k,l}{f[m-k, n-l]g[k,l]} (fg)[m,n]=k,lf[mk,nl]g[k,l]
对卷积进一步展开:
( f ∗ g ) [ m , n ] = ∑ k , l f [ m − k , n − l ] g [ k , l ] = ∑ k = − 1 k = 1 ∑ l = − 1 l = 1 f [ m − k , n − l ] g [ k , l ] \begin{align} (f*g)[m,n] &= \sum_{k,l}{f[m-k, n-l]g[k,l]} \\ &= \sum_{k=-1}^{k=1} \sum_{l=-1}^{l=1} {f[m-k, n-l]g[k,l]} \end{align} (fg)[m,n]=k,lf[mk,nl]g[k,l]=k=1k=1l=1l=1f[mk,nl]g[k,l]

假设有f为7x7,g为3x3的卷积核,此时k取-1、0、1,l取-1、0、1。

卷积示意图如下:

请添加图片描述

当m=2,n=2时:卷积操作如下
( f ∗ g ) [ 2 , 2 ] = ∑ k , l f [ 2 − k , 2 − l ] g [ k , l ] = ∑ k = − 1 k = 1 ∑ l = − 1 l = 1 f [ 2 − k , 2 − l ] g [ k , l ] = f [ 3 , 3 ] g [ − 1 , − 1 ] + f [ 3 , 2 ] g [ − 1 , 0 ] + f [ 3 , 1 ] g [ − 1 , 1 ] + f [ 2 , 3 ] g [ 0 , − 1 ] + f [ 2 , 2 ] g [ 0 , 0 ] + f [ 2 , 1 ] g [ 0 , 1 ] + f [ 1 , 3 ] g [ 1 , − 1 ] + f [ 1 , 2 ] g [ 1 , 0 ] + f [ 1 , 1 ] g [ 1 , 1 ] \begin{align} (f*g)[2,2] &= \sum_{k,l}{f[2-k, 2-l]g[k,l]} \\ &= \sum_{k=-1}^{k=1} \sum_{l=-1}^{l=1} {f[2-k, 2-l]g[k,l]} \\ &= f[3,3]g[-1,-1] + f[3,2]g[-1,0] + f[3,1]g[-1,1] \\ &+ f[2,3]g[0,-1] + f[2,2]g[0,0] + f[2,1]g[0,1] \\ &+ f[1,3]g[1,-1] + f[1,2]g[1,0] + f[1,1]g[1,1] \end{align} (fg)[2,2]=k,lf[2k,2l]g[k,l]=k=1k=1l=1l=1f[2k,2l]g[k,l]=f[3,3]g[1,1]+f[3,2]g[1,0]+f[3,1]g[1,1]+f[2,3]g[0,1]+f[2,2]g[0,0]+f[2,1]g[0,1]+f[1,3]g[1,1]+f[1,2]g[1,0]+f[1,1]g[1,1]

示意图如下:
请添加图片描述

卷积核是翻转的:ppt中的图给成了镜像翻转,但上面推导怎么是旋转180度?

请添加图片描述

Key properties卷积的关键属性

  • 线性性质Linearity: f i l t e r ( f 1 + f 2 ) = f i l t e r ( f 1 ) + f i l t e r ( f 2 ) filter(f_1 + f_2) = filter(f_1) + filter(f_2) filter(f1+f2)=filter(f1)+filter(f2)
  • 平移不变性Shift invariance: f i l t e r ( s h i f t ( f ) ) = s h i f t ( f i l t e r ( f ) ) filter(shift(f)) = shift(filter(f)) filter(shift(f))=shift(filter(f))
  • 理论结果Theoretical result:通过理论分析和计算得出的预测性结果:任何线性平移不变算子都可以表示为卷积

卷积的其它属性

  • 交换律Commutative: a ∗ b = b ∗ a a * b = b * a ab=ba

    从概念上讲,滤波器和信号没有区别

  • 结合律Associative: a ∗ ( b ∗ c ) = ( a ∗ b ) ∗ c a*(b*c)=(a*b)*c a(bc)=(ab)c

  • 分配律Distributes over addition: a ∗ ( b + c ) = a ∗ b + a ∗ c a*(b+c) = a*b + a*c a(b+c)=ab+ac

  • 标量因子提出Scalars factor out: k a ∗ b = a ∗ k b = k ( a ∗ b ) ka*b = a*kb = k(a*b) kab=akb=k(ab)

  • 同一性Identity:单位脉冲unit impulse e = [ . . . , 0 , 0 , 1 , 0 , 0 , . . . ] e = [..., 0,0,1,0,0,...] e=[...,0,0,1,0,0,...] a ∗ e = a a*e=a ae=a

Annoying details

卷积的输出结果与填充方式有关:在MATLAB中

filter2(g, f, shape)
  • shape='full':输出大小是f和g的和
  • shape='same':输出大小和f相同
  • shape='valid':输出大小是f和g的差

请添加图片描述

图像进行外推填充方式:

  • clip filter (black): imfilter(f, g, 0) 周围补一圈黑色,像素为0的黑边
  • wrap around: imfilter(f, g, ‘circular’) 图像右侧边缘补到左边,左侧边缘补到右边,类似圆筒,上下类似。
  • copy edge: imfilter(f, g, ‘replicate’) 拉伸边缘像素
  • reflect across edge: imfilter(f, g, ‘symmetric’) 镜像边缘像素

卷积练习

请添加图片描述

用右侧像素替代当前像素,相当于左移。

请添加图片描述

用box滤波器进行Blur模糊:

请添加图片描述

锐化滤波器Sharpening filter:突出和平均值的差异

请添加图片描述

Sharpening锐化

请添加图片描述

假设用 I I I 表示原图, e e e 表示单位脉冲,g表示box filter,上述过程表示如下:

原图减去滤波后的图: I ∗ e − I ∗ g = I ∗ ( e − g ) I*e - I*g = I*(e-g) IeIg=I(eg)

然后: I ∗ e + I ∗ ( e − g ) = I ∗ ( 2 e − g ) I*e + I*(e-g) = I*(2e - g) Ie+I(eg)=I(2eg)

所以可以用新的滤波器 2 e − g 2e-g 2eg 与原图进行卷积,直接得到sharpened图像。

请添加图片描述

Gaussian Kernel

为了消除边缘影响,根据邻近像素与中心的接近程度对其权重贡献。
G σ = 1 2 π σ 2 e − ( x 2 + y 2 ) 2 σ 2 G_{\sigma} = \frac{1}{2 \pi \sigma^2} e^{- \frac{(x^2 + y^2)}{2 \sigma^2}} Gσ=2πσ21e2σ2(x2+y2)
请添加图片描述

5x5高斯模版生成过程:

  • 中心坐标为(0,0),右边为(1,0),其余以此类推。
  • 将坐标的x和y带入高斯函数得到值。
  • 所有值还需要进行归一化(某个值除以所有值的和)。

模版的所有值加和为1,使模版操作不改变图像亮度。


  • 标准偏差 σ \sigma σ 决定平滑程度
  • 当固定模版的大小时:

σ \sigma σ 越小,模版的中间值越大,所占比重较大,被平滑的不那么厉害。

σ \sigma σ 越大,模版的中间值越小,所占权重变小,被平滑的厉害。

请添加图片描述

  • σ \sigma σ 固定时,模版大小改变:

请添加图片描述

当size为10时,模版有100个值,size为30时,模版有900个值,再归一化后,size小的模版权重相对更大些。

因此size较小时,被平滑的不那么厉害;size较大时,平滑的厉害。

  • 模版大小选取遵循原则:将滤波器半宽度设置为约 3 σ 3\sigma 3σ。滤波器大小为 3 σ + 3 σ + 1 3\sigma + 3\sigma + 1 3σ+3σ+1。例如 σ = 1 \sigma=1 σ=1 时,滤波器大小为3x3

高斯滤波器特点:

  • 从图像中去除“高频”成分(低通滤波器)

  • 高斯滤波与自身的卷积是另一个高斯滤波器。

    例如连续两个标准差为 σ \sigma σ 的高斯核进行卷积,等价于一个标准差为 2 σ \sqrt{2} \sigma 2 σ 高斯核进行卷积。遵循勾股定理。

    1.将原图进行参数为 σ \sigma σ 的高斯滤波: I ′ = I ∗ g σ I' = I * g_{\sigma} I=Igσ

    2.将上面结果进行参数为 σ \sigma σ 的高斯滤波: I ′ ′ = I ′ ∗ g σ I'' = I' * g_{\sigma} I′′=Igσ

    3.等价与直接将原图进行参数为 2 σ \sqrt{2} \sigma 2 σ 的高斯滤波: I ′ ′ = I ∗ g 2 σ I'' = I * g_{\sqrt{2} \sigma} I′′=Ig2 σ

  • 可分离核Separable Kernel:二维高斯函数可以被表示为两个一维高斯函数的乘积。

G σ ( x , y ) = 1 2 π σ 2 e − ( x 2 + y 2 ) 2 σ 2 = ( 1 2 π σ e − x 2 2 σ 2 ) ( 1 2 π σ e − y 2 2 σ 2 ) \begin{align} G_{\sigma}(x,y) &= \frac{1}{2 \pi \sigma^2} e^{- \frac{(x^2 + y^2)}{2 \sigma^2}} \\ &= (\frac{1}{2 \pi \sigma} e^{- \frac{x^2}{2 \sigma^2}})(\frac{1}{2 \pi \sigma} e^{- \frac{y^2}{2 \sigma^2}}) \\ \end{align} Gσ(x,y)=2πσ21e2σ2(x2+y2)=(2πσ1e2σ2x2)(2πσ1e2σ2y2)

可分离性的例子:Separability example

首先使用2D高斯滤波器对中心位置进行卷积:求得结果是65。

请添加图片描述

2D高斯滤波器可以分解为两个一维高斯滤波器的乘积:

请添加图片描述

使用分解的两个一维高斯滤波器原原图像依次卷积:行卷积核列卷积。最终得到结果仍然是65.

请添加图片描述

请添加图片描述

Separability分离性的用途:

n × n n \times n n×n 的图像,使用 m × m m \times m m×m 的核进行卷积的复杂度: O ( n 2 m 2 ) O(n^2 m^2) O(n2m2)

如果使用分离的卷积的复杂度: O ( n 2 m ) + O ( n m ) = O ( n 2 m ) O(n^2 m) + O(n m) = O(n^2 m) O(n2m)+O(nm)=O(n2m)

Noise噪声 分类

  • 椒盐噪声Salt and pepper noise:包含随机出现的黑色和白色像素。
  • 脉冲噪声Impulse noise:包含随机出现的白色像素。
  • 高斯噪声Gaussian noise:从高斯正态分布得出的强度变化

请添加图片描述

Gaussian noise高斯噪声

高斯噪声图 f ( x , y ) f(x,y) f(x,y) 的产生如下:
f ( x , y ) = f ˉ ( x , y ) + η ( x , y ) f(x, y) = \bar{f}(x, y) + \eta(x,y) f(x,y)=fˉ(x,y)+η(x,y)
其中 f ˉ ( x , y ) \bar{f}(x,y) fˉ(x,y) 为理想的图像, η ( x , y ) \eta(x,y) η(x,y) 为噪声处理,所有噪声iid于正态分布:
η ( x , y ) ∼ N ( μ , σ ) \eta(x,y) \sim \mathbf{N}(\mu, \sigma) η(x,y)N(μ,σ)
假设:独立,均值为0的噪声

请添加图片描述

  • 减少高斯噪声Reducing Gaussian noise:使用高斯滤波器

请添加图片描述

上图中第一行是 σ \sigma σ 取 0.05、0.1、0.2 产生的高斯噪声图。也就对应没有平滑的图。

第二行是使用 σ = 1 \sigma = 1 σ=1 的高斯滤波结果,此时高斯核大小为 7 × 7 7 \times 7 7×7

第三行是使用 σ = 2 \sigma = 2 σ=2 的高斯滤波结果,此时高斯核大小为 13 × 13 13 \times 13 13×13

结论:使用较大标准差的平滑可以抑制噪声, 但也会使图像模糊。

Reducing salt-and-pepper noise:Median filtering中值滤波

中值滤波器通过选择窗口中的中值强度对窗口进行操作。

请添加图片描述

中值滤波是非线性滤波。对异常值具有稳健性的优点:Robustness to outliers

请添加图片描述

下面是有椒盐噪声的图和均值滤波后的图:

请添加图片描述

Sharpening revisited:再看锐化

请添加图片描述

拉普拉斯高斯:

请添加图片描述

Edge detection | Origin of edges

  • 边缘检测目标:识别图像中的突变(不连续)。直观地说,大多数来自图像的语义和形状信息都可以编码在边缘中。

各种边的起源(种类):边缘是由多种因素造成的

请添加图片描述

  • surface normal discontinuity表面法向不连续:也就是面上的不连续,两个面的交界处产生的边。
  • depth discontinuity间断面深度:深度上的边缘,上面瓶子因为是圆形的,本身没有边,但图像只能显示其中的一部分,由于深度上的不连续形成的边。
  • surface color discontinuity表面颜色不连续:文字。
  • illumination discontinuity照明不连续:阴影产生的边。

Characterzing edges描述边缘

边缘是图像强度函数中快速变化的地方:一阶导的极值点。

请添加图片描述

对于2D函数 f ( x , y ) f(x,y) f(x,y) 的偏导数定义:
∂ f ( x , y ) ∂ x = lim ⁡ ϵ → 0 f ( x + ϵ , y ) − f ( x , y ) ϵ \frac{\partial f(x,y)}{\partial x} = \lim_{\epsilon \to 0} \frac{f(x + \epsilon,y) - f(x,y)}{\epsilon} xf(x,y)=ϵ0limϵf(x+ϵ,y)f(x,y)
对于离散数据,我们可以使用有限差分进行近似:
∂ f ( x , y ) ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) 1 \frac{\partial f(x,y)}{\partial x} \approx \frac{f(x + 1,y) - f(x,y)}{1} xf(x,y)1f(x+1,y)f(x,y)
为了实现上面的卷积,相关的过滤器如何设计?

请添加图片描述

左图的滤波器: [ − 1 , 1 ] [-1,1] [1,1] 。水平方向卷积,求得垂直方向边缘。

右图的滤波器: [ − 1 , 1 ] T [-1,1]^T [1,1]T [ 1 , − 1 ] T [1,-1]^T [1,1]T 。垂直方向卷积,求得水平方向边缘。

Image gradient图像梯度

图像的梯度是由偏导数组成的向量:
∇ f = [ ∂ f ∂ x , ∂ f ∂ y ] \nabla f = [\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}] f=[xf,yf]

  • 梯度方向指向信号变化最大的方向,也就是指向图像强度增加最快的方向。
  • 梯度方向与边缘垂直。

请添加图片描述

梯度方向定义:
θ = t a n − 1 ( ∂ f ∂ y / ∂ f ∂ x ) \theta = tan^{-1} (\frac{\partial f}{\partial y} / \frac{\partial f}{\partial x}) θ=tan1(yf/xf)
边缘强度由梯度幅度给出:The edge strength is given by the gradient magnitude
∣ ∣ ∇ f ∣ ∣ = ( ∂ f ∂ x ) 2 + ( ∂ f ∂ y ) 2 || \nabla f || = \sqrt{(\frac{\partial f}{\partial x})^2 + (\frac{\partial f}{\partial y})^2} ∣∣∇f∣∣=(xf)2+(yf)2

  • 使用梯度幅值来描述是否是边的可能性,幅值越大,偏导数越大,偏导数越有可能是极值点,则该点越有可能是边。这也叫做边缘强度。

请添加图片描述

这篇关于Machine Vision Technology:Lecture2 Linear filtering的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/761237

相关文章

理解分类器(linear)为什么可以做语义方向的指导?(解纠缠)

Attribute Manipulation(属性编辑)、disentanglement(解纠缠)常用的两种做法:线性探针和PCA_disentanglement和alignment-CSDN博客 在解纠缠的过程中,有一种非常简单的方法来引导G向某个方向进行生成,然后我们通过向不同的方向进行行走,那么就会得到这个属性上的图像。那么你利用多个方向进行生成,便得到了各种方向的图像,每个方向对应了很多

ZOJ 3324 Machine(线段树区间合并)

这道题网上很多代码是错误的,由于后台数据水,他们可以AC。 比如这组数据 10 3 p 0 9 r 0 5 r 6 9 输出应该是 0 1 1 所以有的人直接记录该区间是否被覆盖过的方法是错误的 正确方法应该是记录这段区间的最小高度(就是最接近初始位置的高度),和最小高度对应的最长左区间和右区间 开一个sum记录这段区间最小高度的块数,min_v 记录该区间最小高度 cover

复盘高质量Vision Pro沉浸式视频的制作流程与工具

在探索虚拟现实(VR)和增强现实(AR)技术的过程中,高质量的沉浸式体验是至关重要的。最近,国外开发者Dreamwieber在其作品中展示了如何使用一系列工具和技术,创造出令人震撼的Vision Pro沉浸式视频。本文将详细复盘Dreamwieber的工作流,希望能为从事相关领域的开发者们提供有价值的参考。 一、步骤和工作流 构建基础原型 目的:快速搭建起一个基本的模型,以便在设备

一键部署Phi 3.5 mini+vision!多模态阅读基准数据集MRR-Benchmark上线,含550个问答对

小模型又又又卷起来了!微软开源三连发!一口气发布了 Phi 3.5 针对不同任务的 3 个模型,并在多个基准上超越了其他同类模型。 其中 Phi-3.5-mini-instruct 专为内存或算力受限的设备推出,小参数也能展现出强大的推理能力,代码生成、多语言理解等任务信手拈来。而 Phi-3.5-vision-instruct 则是多模态领域的翘楚,能同时处理文本和视觉信息,图像理解、视频摘要

【硬刚ES】ES基础(十九) Query Filtering 与多字符串多字段查询

本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的ES部分补充。

【CSS渐变】背景中的百分比:深入理解`linear-gradient`,进度条填充

在现代网页设计中,CSS渐变是一种非常流行的视觉效果,它为网页背景或元素添加了深度和动态感。linear-gradient函数是实现线性渐变的关键工具,它允许我们创建从一种颜色平滑过渡到另一种颜色的视觉效果。在本篇博客中,我们将深入探讨linear-gradient函数中的百分比值,特别是像#C3002F 50%, #e8e8e8 0这样的用法,以及它们如何影响渐变效果。 什么是linear-g

【ZOJ】2071 Technology Trader 最大权闭合子图

传送门:【ZOJ】2071 Technology Trader 题目分析:最大权闭合子图问题。源点向订单建边,容量为利益,汇点向组件建边,容量为成本,原图所有边变成容量无穷大的边,最后跑一遍最小割,订单利益和减去最小割容量就是最大净利润。 输出方案就从源点跑一遍dfs,能从源点到达的所有点都标记上。然后看从源点出发的边的弧尾是否被标记,被标记表示被使用,然后再看从汇点出发的点,如果被标记

HOW DO VISION TRANSFORMERS WORK

HOW DO VISION TRANSFORMERS WORK Namuk Park1,2, Songkuk Kim1 1Yonsei University, 2NAVER AI Lab{namuk.park,songkuk}@yonsei.ac.kr 总结 MSA 改善模型泛化能力: MSA 不仅提高了模型的准确性,还通过平滑损失景观来提高泛化能力。损失景观的平坦化使得模型更容易优化,表现

IPKISS 服务器部署环境如何找到 get_technology() 目录

IPKISS 服务器部署环境如何找到 get_technology 目录 引言正文 引言 随着对 IPKISS 了解的加深,作者本人逐渐开始探索 IPKISS 的 TECH 目录,IPKISS 版图绘制中所有重要的参数几乎都被收集在了这个目录下。本文,我们将介绍如何进入到这个目录中查看对应的参数。 正文 首先我们需要明确,get_technology() 方法实际上进入的是

BM3D--Image Denoising by Sparse 3-D Transform-Domain Collaborative Filtering

系列文章目录 文章目录 系列文章目录前言稀疏三维变换域协同滤波图像去噪摘要1 引言2 分组和协作过滤A.分组B.按匹配分组C.协同过滤D.基于变换域收缩的协同过滤 3 算法结论 前言 论文地址 如果下载不了可以从 https://download.csdn.net/download/m0_70420861/89708940 获取 参考博客 :图像去噪算法:NL-Me