GRADIENT BASED THRESHOLD FREE COLOR FILTER ARRAY INTERPOLATION

2023-10-11 07:45

本文主要是介绍GRADIENT BASED THRESHOLD FREE COLOR FILTER ARRAY INTERPOLATION,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ABSTRACT

彩色滤波器阵列(CFA)插值是单传感器数字相机图像处理管道的组成部分。多年来,许多CFA算法被提出以提高图像质量。其中一个算法就是非常成功的定向线性最小均方误差估计(Directional Linear Minimum Mean-Square Error Estimation, DLMMSE)方法。我们对该算法做了一些观察,并提出了一种新的方法来解决这些问题。本文提出的方法产生了视觉上令人满意的结果,在PSNR方面优于最近一篇调查论文中包含的所有CFA插值算法。

1. INTRODUCTION

大多数数码相机使用单一传感器阵列与彩色滤光片来捕捉图像数据。颜色滤波器阵列的布局决定了在每个像素位置记录哪个颜色通道。为了获得完整的彩色图像,需要从单通道拼接图像中插值缺失的彩色通道信息。这个过程被称为颜色滤镜阵列(CFA)插值或马赛克。虽然有许多不同的CFA模式,但最常见的是拜耳CFA[1],如图1所示。

简单的插值技术,如最近邻插值或双线性插值可以应用于马赛克问题。然而,忽略边缘结构和通道间相关性的解决方案会导致颜色伪影和模糊输出。早期提出了一种著名的图像马赛克方法,即在初始绿通道插值[2]中使用红色和蓝色像素的二阶导数。这个想法成为后来许多算法的基本组成部分。[3]的作者提出利用颜色差异的方差来决定插值的方向。[4]中的方向滤波和后验决策(DFPD)算法提出在水平方向和垂直方向上进行插值,然后根据每个方向上的梯度和进行硬方向决策。

DLMMSE算法[5]首先计算水平和垂直方向的(G-R)和(G-B)色差。然后,这些计算被视为实际色差的噪声估计,并使用线性最小均方误差框架进行最优组合。绿色通道插值完成后,利用原色差信号和简单的双线性插值填充缺失的红色和蓝色通道像素。[6]作者在DLMMSE算法的基础上,提出了采用方向各向异性尺度自适应滤波进一步提高图像拼接性能。

在本文中,我们提出了一种新的马赛克方法,解决了我们在DLMMSE算法中观察到的一些局限性。首先,由于其方向性,DLMMSE算法只使用目标像素的相邻像素(与目标像素共用一列或一行的像素)的一个子集来确定每个方向对色差计算的贡献。虽然该解决方案在其自己的领域是最优的,但未考虑的邻居像素可能提供额外的信息,可以改善色差估计。这就是为什么我们想要在决策过程中包含一个给定的局部窗口内的每个相邻像素。然而,由于每个像素上可用的色差不是(G-R)就是(G-B),我们不能像DLMMSE方法那样应用方差度量。出于这个原因,我们使用颜色差异的梯度来获得每个方向的权重。

其次,DLMMSE方法与其他方向方法一样,在水平方向和垂直方向上都有作用。然而,对于一个给定的方向,对于落在目标像素的相反两侧的像素,特别是靠近边缘或在纹理区域的像素,条件可能是不同的。这就是为什么我们要把南北和东西两个方向分开来考虑。我们结合了各个方向的估计,从而消除了设置阈值的需要,而不是做出艰难的方向决定。

本文的其余部分组织如下。第2节详细描述了所提出的demosaicing方法,第3节给出了客观和主观的比较结果,第4节给出了简要的讨论和结论。

2. ALGORITHM OVERVIEW

拜耳CFA模式中绿色通道样本是红色和蓝色通道样本的两倍。这就是为什么绿色通道不受混叠的影响,这使得它成为马赛克过程的起点的自然选择。提出的算法首先在一次运行中插值绿色通道,然后使用其结果填充红色和蓝色通道。

2.1. Green Channel Interpolation

算法的第一步是将Hamilton和Adams的[2]插值公式应用于垂直和水平方向的所有像素。对于红色像素位置,水平和垂直的绿色通道估计计算如下:

同样,对于垂直相邻为红色的绿色像素,垂直红色通道估计为:

对于绿色像素的水平红色通道,

蓝色像素的估计也以同样的方式计算,只需在上面的公式中用B替换R即可。下一步是使用原始和定向估计的像素值找到水平和垂直色差估计。

同样,水平和垂直(G-B)差异估计的计算也是类似的。在这一步结束时,我们有了两个差分图,一个用于水平估计,另一个用于垂直估计,如图2所示。

然后结合方向色差,对目标像素进行最终的差值估计:

可以修改向量f,使接近目标像素的颜色差异具有更大的权重。每个方向(wN,wS,wE,wW)的权重是通过在一个局部窗口上向该方向添加色差梯度来计算的。对于5 * 5的窗口大小:

其中梯度定义为:

最后,将估计的色差与可用的(红色或蓝色)目标像素相加,计算目标绿色像素值:

2.2. Red and Blue Channel Interpolation

蓝色位置的红色像素值和红色位置的蓝色像素值使用[6]中提出的以下过滤器进行插值:

其中⊗表示元素的矩阵乘法,然后是元素的求和。

对于位于绿色位置的红色和蓝色像素,我们使用双线性插值在最近的四个邻居上。绿色像素的垂直相邻点要么是红色像素,要么是蓝色像素。对于红色像素的情况,将绿色像素位置的红色和蓝色像素值插值如下:

插值公式与蓝色垂直邻居的情况相似。在这一点上,我们为每个通道插值缺失的像素,并重建我们的彩色图像。

3. EXPERIMENTAL RESULTS

在最近的一篇调查论文[7]中使用的柯达测试集的前12张图像上测试了所提出的算法。这份调查报告比较了11种最先进的方法,其中我们报告了4种表现最好的方法。这些方法分别是局部多项式逼近(Local Polynomial Approximation, LPA)[6]、定向线性最小均方误差估计(Directional Linear Minimum Mean Square-Error Estimation, DLMMSE)[5]、色差方差(Variance of color difference, VCD)[3]和边缘加权改进逐次逼近(逐次逼近,SA)[8]。PSNR比较结果如表1所示。该算法总体平均PSNR最好,比最近邻法(LPA)和DLMMSE法分别高出0.14 dB和0.64 dB。图3为灯塔图像中常用的栅栏区域进行主观质量比较。

4. CONCLUSION

本文提出了一种易于实现的、非迭代的、基于梯度的马赛克算法。实验结果表明,该算法在客观PSNR比较方面优于其他常用的马赛克算法。在绿色通道插补阶段采用自适应尺寸滤波器代替固定滤波器,可以提高算法的性能。引入一个温和的后期处理步骤也可能改善它的结果。然而,额外的计算成本和质量权衡总是与后期处理步骤有关。

这篇关于GRADIENT BASED THRESHOLD FREE COLOR FILTER ARRAY INTERPOLATION的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/186581

相关文章

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

三色标记(Tri-color marking)

维基百科部分 原文 https://en.wikipedia.org/wiki/Tracing_garbage_collection#TRI-COLOR Because of these performance problems, most modern tracing garbage collectors implement some variant of the tri-color ma

Nn criterions don’t compute the gradient w.r.t. targets error「pytorch」 (debug笔记)

Nn criterions don’t compute the gradient w.r.t. targets error「pytorch」 ##一、 缘由及解决方法 把这个pytorch-ddpg|github搬到jupyter notebook上运行时,出现错误Nn criterions don’t compute the gradient w.r.t. targets error。注:我用

Hbase Filter+Scan 查询效率优化

Hbase Filter+Scan 查询效率问题 众所周知,Hbase利用filter过滤器查询时候会进行全表扫描,查询效率低下,如果没有二级索引,在项目中很多情况需要利用filter,下面针对这种情况尝试了几种优化的方案,仅供参考,欢迎交流。 根据业务要求,作者需要根据时间范围搜索所需要的数据,所以作者设计的rowKey是以时间戳为起始字符串的。 正确尝试: 1.scan 设置 开始行和结

HumanNeRF:Free-viewpoint Rendering of Moving People from Monocular Video 翻译

HumanNeRF:单目视频中运动人物的自由视点绘制 引言。我们介绍了一种自由视点渲染方法- HumanNeRF -它适用于一个给定的单眼视频ofa人类执行复杂的身体运动,例如,从YouTube的视频。我们的方法可以在任何帧暂停视频,并从任意新的摄像机视点或甚至针对该特定帧和身体姿势的完整360度摄像机路径渲染主体。这项任务特别具有挑战性,因为它需要合成身体的照片级真实感细节,如从输入视频中可能

Filter基本原理和使用

https://www.cnblogs.com/xdp-gacl/p/3948353.html 一、Filter简介   Filter也称之为过滤器,它是Servlet技术中最激动人心的技术,WEB开发人员通过Filter技术,对web服务器管理的所有web资源:例如Jsp, Servlet, 静态图片文件或静态 html 文件等进行拦截,从而实现一些特殊的功能。例如实现URL级别的权限访问控

【uva】11536-Smallest Sub-Array(区间移动问题)

一个区间移动的问题,1A了,感觉没什么好说的。。 13975926 11536 Smallest Sub-Array Accepted C++ 0.809 2014-08-01 11:00:20 #include<cstdio>#include<cstring>#include<iostream>using namespace std;#define INF 1 << 30

leetCode#448. Find All Numbers Disappeared in an Array

Description Given an array of integers where 1 ≤ a[i] ≤ n (n = size of array), some elements appear twice and others appear once. Find all the elements of [1, n] inclusive that do not appear in this

MACS bdgdiff: Differential peak detection based on paired four bedGraph files.

参考原文地址:[http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html](http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html) 文章目录 一、MACS bdgdiff 简介DESCRIPTION 二、用法

Neighborhood Homophily-based Graph Convolutional Network

#paper/ccfB 推荐指数: #paper/⭐ #pp/图结构学习 流程 重定义同配性指标: N H i k = ∣ N ( i , k , c m a x ) ∣ ∣ N ( i , k ) ∣ with c m a x = arg ⁡ max ⁡ c ∈ [ 1 , C ] ∣ N ( i , k , c ) ∣ NH_i^k=\frac{|\mathcal{N}(i,k,c_{