Joint Bilateral Upsampling

2023-11-29 15:12
文章标签 joint bilateral upsampling

本文主要是介绍Joint Bilateral Upsampling,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Abstract

图像分析和增强任务(例如色调映射、着色、立体深度和蒙太奇)通常需要在像素网格上计算解决方案(例如,曝光、色度、视差、标签)。计算和内存成本通常要求在下采样图像上运行较小的解决方案。尽管通用上采样方法可用于将低分辨率解插值到全分辨率,但这些方法通常假设插值先验平滑。

我们证明,在上述情况下,可用的高分辨率输入图像可以在联合双边上采样过程中用作先验,以产生更好的高分辨率解决方案。我们展示了上述每个应用程序的结果,并将它们与传统的上采样方法进行比较。

1 Introduction

最近,计算机图形和计算机视觉文献中展示了各种新的图像分析和图像处理方法,包括自动的和用户引导的。这些包括立体深度计算 [Scharstein 和 Szeliski 2002]、图像着色 [Levin 等人2004年; Yatziv 和 Sapiro 2006],高动态范围 (HDR) 图像的色调映射 [Reinhard 等人2005],以及最小图割在图像合成中的应用[Agarwala 等人2004]。所有这些方法都有一个共同的问题,即寻找全局解决方案:描述输入图像像素网格上的某些感兴趣值(深度、色度、曝光、标签等)的分段平滑函数。

数字图像的尺寸不断增长,从 25 万像素视频帧到数百万像素数码照片,再到最近由专用相机产生的千兆像素图像 [Flint 2007] 以及将多个图像拼接成全景图 [Kopf 等人,2007 年]。如此高分辨率对上述方法提出了艰巨的挑战,这些方法通常至少需要线性时间,更重要的是,需要线性空间来计算全局解。因此,为了对如此高分辨率的图像进行操作,必须首先将它们下采样到较低的分辨率以使计算易于处理。这对于交互式应用程序尤其重要。

一旦找到了适用于较小的下采样图像的解决方案,问题就变成了如何将解决方案上采样到输入图像的完整原始分辨率。上采样是一种基本的图像处理操作,通常通过将低分辨率图像与插值内核进行卷积,然后在新的(高分辨率)网格上对结果进行重新采样来实现。 Wolberg [1990] 对常见插值核进行了很好的调查。由于线性插值滤波器固有的平滑先验,以这种方式上采样的图像通常会出现锐边模糊的情况。

然而,对于上面引用的应用,可以以原始高分辨率输入图像的形式获得附加信息。忽略这些信息并单独依赖平滑先验显然不是最好的策略。我们建议利用除了低分辨率解决方案之外我们还拥有高分辨率图像的事实。特别是,我们证明联合双边上采样(JBU)操作可以从以非常低的分辨率计算的解决方案中产生非常好的全分辨率结果。我们展示了立体深度、图像着色、自适应色调映射和基于图形切割的图像合成的结果。

2 Bilateral Filters

双边滤波器是一种边缘保留滤波器,最初由 Tomasi 和 Manduchi [1998] 提出。它与更广泛的非线性滤波器相关,例如各向异性扩散和鲁棒估计[Barash 2002;杜兰德和多西 2002;埃拉德 2002]。双边滤波器使用空间(或域)滤波器内核和根据数据值本身评估的范围滤波器内核。更正式地说,对于某个位置 p,过滤结果为:

其中 f 是空间滤波器内核,例如以 p 为中心的高斯滤波器,g 是范围滤波器内核,以 p 处的图像值为中心。 Ω 是核 f 的空间支持度,kp 是归一化因子,即 f·g 滤波器权重之和。由于双边滤波器 f·g 随着范围距离和/或空间距离的增加而呈现更小的值,所以边缘被保留。

最近,我们看到了联合(或交叉)双边滤波器的引入,其中范围滤波器应用于第二个引导图像,例如\tilde{I},当尝试组合来自一个图像的高频和来自另一图像的低频时[佩奇尼格等人2004年;艾斯曼和杜兰德 2004]。因此,

与 (1) 的唯一区别是范围过滤器使用\tilde{I}而不是 I。

2.1 Previous Work

双边滤波器之前已用于各种图像处理任务。 Durand 和 Dorsey [2002] 将双边滤波器应用于 HDR 色调映射,并描述了一种快速近似,该近似最近在 [Paris 和 Durand 2006;韦斯 2006]。

Ramanath 和 Snyder [2003] 在去马赛克的背景下使用双边滤波器来提高边缘灵敏度。他们的方法仅限于具有固定的小上采样因子的拜耳模式,并且不像我们那样使用引导图像。

杜兰德等人[2005] 提到使用双边滤波器对光线追踪器的着色结果进行上采样。然而,论文中没有给出细节,也没有探索其他应用。

索尼等人[2001] 对立体图像进行上采样,其中一个视图比另一个视图具有更高的分辨率。他们的方法估计对齐映射,然后使用相邻电影帧的变形和填充来对低分辨率图像进行上采样。

3 Joint Bilateral Upsampling

与通用图像上采样相比,在我们感兴趣的问题中,我们可以原始高分辨率输入图像的形式获得附加信息。给定高分辨率图像\tilde{I} 和针对图像的下采样版本计算的低分辨率解 S,我们提出了一种简单的方法,应用联合双边滤波器对解进行上采样。

这个想法是将空间滤波器(通常是截断高斯滤波器)应用于低分辨率解 S,同时将类似的范围滤波器联合应用于全分辨率图像 \tilde{I}。令 p 和 q 表示 \tilde{I}中像素的(整数)坐标,p↓ 和 q↓ 表示低分辨率解 S 中对应的(可能是小数)坐标。然后获得上采样解\tilde{S} 为:

这与等式(2) 几乎相同。 例外的是,我们正在构建与图像相反的高分辨率解决方案,并同时在两种不同的分辨率下运行。

请注意,q↓ 在低分辨率解中仅采用整数坐标。因此,引导图像仅被稀疏采样,并且性能不依赖于上采样因子(参见第 5 节)。

4 Applications

在本节中,我们将演示联合双边上采样操作对于各种应用的有用性。

Tone Mapping:

随着高动态范围 (HDR) 成像的日益普及和实用 [Reinhard 等人2005],需要色调映射方法来在普通设备上显示 HDR 图像。多年来已经提出了多种此类方法(有关广泛的调查,请参阅 [Reinhard et al. 2005])。其中一些方法可以产生高质量的结果,但需要求解非常大的线性方程组 [Fattal 等人2002年;利钦斯基等人2006]。尽管这些系统很稀疏,并且可以使用多分辨率求解器有效地求解[Szeliski 2006],但处理当今的数百万像素图像仍然是一个挑战:一旦数据超出可用的物理内存,迭代扫描数据就会导致抖动。

我们如下应用联合双边上采样滤波器。令 I 为低分辨率 HDR 图像,T(I) 为由某个色调映射算子生成的色调映射图像。然后,相应的低分辨率解被定义为像素商 S = T(I)/I。换句话说,解决方案是一张曝光图,它说明了要在每个像素上应用的曝光校正量。这样的曝光图通常是平滑的,但可能沿着重要的图像边缘具有不连续性[Lischinski et al. 2006]。因此,它们是我们上采样技术的理想候选者。请注意,曝光图可能具有单个通道(如果仅调整了亮度)或多个通道(以支持任意色调操作)。图 2 显示了使用我们的技术上采样的曝光图与许多标准上采样方法的比较。联合双边上采样产生的结果在视觉上和数值上更接近真实情况。

5 Performance and Accuracy

联合双边上采样操作的复杂度为 O(Nr^{2}),其中 N 是输出图像大小,r 是域滤波器半径。性能与输出大小成正比,而不与上采样因子成正比,因为域滤波器始终应用于低分辨率解决方案。对于所有结果,我们使用了 5×5 高斯,它速度非常快,但仍然具有足够的空间支持来从一定距离拉取解值。我们的实现每百万像素输出大约需要 2 秒。

这比在全分辨率图像上运行原始算法要快得多。例如,色调映射器需要 80 秒才能处理 3.1 兆像素的图像,而我们的上采样只需要 6 秒即可对较小的解决方案进行上采样,而计算速度要快得多。 Levin 等人的彩色解算器[2004] 甚至更慢,需要几分钟才能获得百万像素大小的图像。如上所述,由于内存问题,我们无法运行非常高分辨率的解决方案,因此对低分辨率解决方案进行上采样是我们处理如此大图像的唯一方法。

JBU 完全是本地的,内存占用非常小。大图像可以在单次扫描中计算,其中任何时候仅分页。我们已经成功地将我们的方法应用于十亿像素图像的上采样色调映射解决方案 [Kopf 等人2007]。

在我们的实验中,我们通常将域滤波器的高斯 σd 设置为 0.5,并支持 5×5。范围滤波器高斯 σr 与应用密切相关。以下默认值对于我们尝试的图像效果很好:着色、立体深度和图形切割标签使用颜色值归一化为 [0,1] 区间的图像。 σr = 0.1 在大多数图像上效果良好。色调映射应用程序适用于无限的亮度值。我们发现将 σr 设置为值的标准差总是能给出良好的结果。

图 1 显示了 JBU 与其他上采样方法相比的 MSE 误差曲线。为了计算误差,我们计算了全分辨率解决方案(或者简单地使用全分辨率彩色图像或深度图进行着色和立体深度)作为地面实况。然后,我们在每个方向上按 2、4、8、16 和 32 倍进行下采样。然后,我们使用各种方法进行上采样并绘制与真实情况的差异。我们的滤波器在所有下采样级别上都表现良好,并且正如预期的那样,随着每增加一个下采样级别,相对改进都会增加。

毫不奇怪,MSE 误差随着上采样因子的增加而增加。但在实践中,应用程序常常会限制对问题进行下采样的程度。我们展示的结果是针对非常小的下采样图像的解决方案。由于某些应用程序需要一些 UI,因此您需要留下足够的图像,例如,在色调映射或着色的提示上涂鸦。

6 Conclusion

我们已经证明了当高分辨率先验可用于指导从低分辨率到高分辨率的插值时,联合双边上采样策略的好处。我们展示的四个应用程序相对于以前的“盲”上采样方法都有所改进。我们相信该策略适用于图像处理内外的许多其他领域。例如,通过粗简化网格计算的全局照明解决方案可以上采样为更精细的网格。域滤波器的内核可以用测地距离来测量,而范围内核将在高斯球上(法线的差异)。我们期待尝试对计算机图形学中的这个问题和其他感兴趣的问题进行联合双边上采样。

这篇关于Joint Bilateral Upsampling的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/433305

相关文章

Unity --hinge joint

关节介绍 关节一共分为5大类:链条关节,固定关节,弹簧关节,角色关节和可配置关节。 链条关节(hinge joint):将两个物体以链条的形式绑在一起,当力量大于链条的固定力矩时,两个物体就会产生相互的拉力。固定关节(fixed joint):将两个物体永远以相对的位置固定在一起,即使发生物理改变,它们之间的相对位置也将不变。弹簧关节(spring joint):将两个物体以弹簧的形式绑

DS简记1-Real-time Joint Object Detection and Semantic Segmentation Network for Automated Driving

创新点 1.更小的网络,更多的类别,更复杂的实验 2. 一体化 总结 终于看到一篇检测跟踪一体化的文章 网络结构如下: ResNet10是共享的Encoder,yolov2 是检测的Deconder,FCN8 是分割的Deconder。 其实很简单,论文作者也指出:Our work is closest to the recent MultiNet. We differ by focus

NLP-文本匹配-2017:BiMPM【Bilateral Multi-Perspective Matching for Natural Language Sentences】

NLP-文本匹配-2016:BiMPM【Bilateral Multi-Perspective Matching for Natural Language Sentences】

论文笔记 HyperNet: Towards Accurate Region Proposal Generation and Joint Object Detection

提出的HyperNet网络基于设计的Hyper特征,这种特征主要先集合分等级的特征图,然后将其压缩到一个空间。这种Hyper特征同时具有足够深和很好的语义信息,在PASCAL VOC 2007和2012上可以通过每张图产生仅仅100个proposal,而达到很好的精度和效果,同时可以达到实时,GPU下 5 fps的速度。 Hyper方法主要的贡献有: (1)在仅仅 50 proposal情况下

图像处理之双边滤波效果(Bilateral Filtering for Gray and Color Image)

- created by gloomyfish 图像处理之双边滤波效果(Bilateral Filtering for Gray and Color Image) 基本介绍: 普通的时空域的低通滤波器,在像素空间完成滤波以后,导致图像的边缘部分也变得不那么明显, 整张图像都变得同样的模糊,图像边缘细节丢失。双边滤波器(ABilateral Filter)可以很好的保 留边缘

BERT for Joint Intent Classification and Slot Filling 论文阅读

BERT for Joint Intent Classification and Slot Filling 论文阅读 Abstract1 Introduction2 Related work3 Proposed Approach3.1 BERT3.2 Joint Intent Classification and Slot Filling3.3 Conditional Random Fiel

论文《Joint Cascade Face Detection and Alignment》笔记

论文:Joint Cascade Face Detection and Alignment.pdf 实现:https://github.com/FaceDetect/jointCascade_py 部分内容引用自:http://www.cnblogs.com/sciencefans/p/4394861.html#!comments 首先是简介: 论文首先介绍了一些当今人脸检测的技

Joint Cascade Face Detection and Alignment(JDA)文档

地址:https://github.com/luoyetx/JDA 一、算法流程图: 训练过程: 检测过程: 二、类图: 从上图可以看出整个系统主要分为两大模块,数据存储模块与CART模块,两个模块集中于JDA分类器上,整个系统只实例化一个JDA分类器,存储于Config中。 三、细节实现: 训练分为5个stage,每个stage训练一个cart森林,这里采用的是Real

Fast Bilateral Filteringfor the Display of High-Dynamic-Range Images

1 Title         Fast Bilateral Filtering for the Display of High-Dynamic-Range Images(Fr´edo Durand and Julie Dorsey)【SIGGRAPH '02】 2 Conclusion         This paper presents a new technique for the

论文阅读:Agreement-Based Joint Training for Bidirectional Attention-Based Neural Machine Translation

双向注意力模型,尽可能使注意力在两个方向上保持一致 模型的中心思想就是对于相同的training data,使source-to-target和target-to-source两个模型在alignment matrices上保持一致。这样能够去掉一些注意力噪声,使注意力更加集中、准确。 这篇文章胜在idea,很巧妙地想到了让正反向的注意力一致来改进attention。