【真实世界图像超分】《Frequency Consistent Adaptation for Real World Super Resolution》2012 Nanjing University

本文主要是介绍【真实世界图像超分】《Frequency Consistent Adaptation for Real World Super Resolution》2012 Nanjing University,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘要:最近的基于深度学习的超分方法在已知退化核图像上已经展现出卓越的性能。但是这些方法往往在真实世界场景下表现不尽如人意,因为作为训练样本的LR图像通常来自于理想退化核(bicubic下采样),它们不同于真实源图像域。训练样本的LR图像和真实源图像的领域差异在频率密度上被明显观察到。这一点启示我们显示地缩小由不正确的退化造成的领域差异。我们设计了一个频率一致性模块,确保在真实世界场景应用已经存在的超分方法时频率一致。我们从无监督图像中评估退化核然后产生对应的低分辨率图像。为了提供核评估中的有用梯度信息,我们提出了用于区分不同尺度图像的频率密度的频率密度比较器(Frequency Density Comparator)。

 

paper地址:https://arxiv.org/abs/2012.10102

 

主要贡献点:

(1)我们为真实世界超分任务提供了一个新颖的频率一致适应模块,它保证了真实退化过程中的频率一致。

(2)我们设计了频率密度比较器去引导精确的模糊核评估过程。我们的无监督策略在真实场景下非常灵活。

 

方法

1. 频率一致适应。我们观察到低分辨图像的频率密度与对应的退化过程相关,如下图所示

定义频率密度  F_X=\frac{1}{N}\sum _{x\epsilon X}\left | F_l(x) \right | ,其中F_X(l)表示在N张图像的域X上,频率l的密度。退化过程与频率密度之间的关系启示我们保持低分辨图像I_{LR}和源图像x之间的频率一致。我们聚焦于使用频率域正则化评估模糊核k,方程如下:

k^*=arg min_k\Phi( (I_{HR}\triangledown _s)\otimes k,x), 其中x表示来自源域的图像,\Phi表示频率正则。但是,在网络中直接应用傅里叶变换非常困难。通过频率一致性损失的指导,FCA生成了与源域S频率一致的低分辨率图像,高分辨率图像直接从源域图像x\epsilon S获得。完整的网络结构如下图所示,主网络结构主要包含三大模块:适应产生器、频率密度比较器(FDC)和小波判别器。适应产生器生成与输入图像频率密度相同的退化LR图像,然后在频率密度比较器和小波判别器模块的引导下优化。

1.1 适应产生器    对于一副源输入图像x,适应产生器首先分析退化过程,然后输出一个各向异性高斯核。然后利用这个高斯核与降采样s倍后的x图像产生LR图像G(x)。公式如下:

G(x)=(x\triangledown s)\otimes k(x),其中k(.)表示核评估器。更精确地,我们使用三个参数描述核评估器 k(x)=g(r_1(x),r_2(x),\theta (x)),其中r_1,r_2,\theta分别表示水平直径、垂直直径和旋转角。g(.)表示各向异性高斯核。

1.2 频率密度比较器(FDC) 频率密度比较器示意图如下图所示。FDC用来捕捉两个输入patch的频率密度相关性。

对于一张真实世界图像x,上采样和下采样都可能改变它的频率分布(上述证明)。频率密度关系如下式所示:

                                                                       C\left ( x^D, x \right ) > 0

                                                                       C\left ( x^{'} , x \right ) = 0

                                                                       C\left ( x^{U}, x \right ) < 0

其中D和U分别表示下采样和上采样,C表示所提的比较器。x^{'}表示源图像中的另外一个patch块。比较器C的优化过程可以由下式表示:

                                                                   arg min_{C}\left \{ E_{x\epsilon S}\left [ \left \| C(x^D, x) -1\right \| +\left \| C(x^{'},x) \right \|+\left \| C(x^U, x)+1 \right \| \right ] \right \}

其中S表示源域中的图像。在此基础上,我们定义频率一致性损失:

                                                                                                         L_{FDC}=E_{x\epsilon S}\left [ \left \| C(G(x), x^D)+1 \right \| +\left \| C(G(x),x) \right \|+\left \| C(G(x), x^U)-1 \right \|\right ]

频率一致性损失L_{FDC}保证G(x)介于频率上界x^D和下界x^U之间。进一步来说,度量G(x)和x之间的距离让核评估接近真实退化过程。

1.3 课程学习策略   为了给适应产生器提供稳定和精确的梯度信息,我们采用课程学习策略。频率密度比较器的训练过程分为不同的阶段,逐步增加学习难度。FDC训练过程中的上采样和下采样比例动态地设为多个中间值(接近1.0)。我们同时训练FDC和适应产生器,确保它们在一个小batch中的输入patch共享相同的频率域。

1.4 小波判别器   维持高频信息在恢复图像细节任务中非常重要。我们采用对抗损失网络,只作用于高频空间。通过小波转换分离图像的高频部分和低频部分,只有高频部分被送入判别器。因为只需要捕捉图像的非语义信息,我们的判别器网络只有4层的深度。我们使用LS-GAN作为判别器。假设用WD表示它,WD的优化公式如下:

                                                                                                         arg min_{WD}\left \{ E_{x\epsilon S}\left [ (WD(G(x)))^2+(WD(x)-1)^2 \right ] \right \}

对抗损失为 L_{WD}=E_{x\epsilon S}\left [ (WD(x)-1)^2 \right ]

1.5 整个网络的损失L_{total}包含两个部分:频率一致损失L_{FDC}和对抗损失L_{WD},公式如下:

                                                                                                          L_{total}=\lambda _{1}*L_{FDC}+\lambda _{2}*L_{WD}

其中\lambda _1,\lambda _2分别表示L_{FDC}/F_{WD}的权重。

 

实验

实验数据处理过程如下:

实验结果

消融实验结果

 

这篇关于【真实世界图像超分】《Frequency Consistent Adaptation for Real World Super Resolution》2012 Nanjing University的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/961899

相关文章

音视频开发基础知识(1)——图像基本概念

像素 **像素是图像的基本单元,一个个像素就组成了图像。你可以认为像素就是图像中的一个点。**在下面这张图中,你可以看到一个个方块,这些方块就是像素。 分辨率 图像(或视频)的分辨率是指图像的大小或尺寸。我们一般用像素个数来表示图像的尺寸。比如说一张1920x1080的图像,前者1920指的是该图像的宽度方向上有1920个像素点,而后者1080指的是图像的高 度方向上有1080个像素点。

【Python机器学习】NMF——将NMF应用于人脸图像

将NMF应用于之前用过的Wild数据集中的Labeled Faces。NMF的主要参数是我们想要提取的分量个数。通常来说,这个数字要小于输入特征的个数(否则的话,将每个像素作为单独的分量就可以对数据进行解释)。 首先,观察分类个数如何影响NMF重建数据的好坏: import mglearn.plotsimport numpy as npimport matplotlib.pyplot as

windows server 2012 R2 安装桌面体验,安装ActiveSync时提示缺少Windows组件

第一步:启动《服务器管理器》 右键桌面上的"计算机",管理,打开服务器管理器 第二步:选择所有服务器,右键显示出来的服务器,添加角色和功能 第三步,在弹出的弹窗,一直点下一步下一步,到功能位置。 注意安装类型:选择“基于角色或基于功能安装” 然后 点击一下步 服务器选择 :操作: 无需配置,选择下一步 服务器角色:操作: 无需配置,选择下一步 功能 操作 选择 “用户界面和基础结构

AIGC-Animate Anyone阿里的图像到视频 角色合成的框架-论文解读

Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation 论文:https://arxiv.org/pdf/2311.17117 网页:https://humanaigc.github.io/animate-anyone/ MOTIVATION 角色动画的

什么是图像频率?

经常听到图像低频成份、高频成份等等,没有细想过,今天突然一想发现真的不明白是怎么回事,在知乎上发现某答案,引用如下: 首先说说图像频率的物理意义。图像可以看做是一个定义为二维平面上的信号,该信号的幅值对应于像素的灰度(对于彩色图像则是RGB三个分量),如果我们仅仅考虑图像上某一行像素,则可以将之视为一个定义在一维空间上信号,这个信号在形式上与传统的信号处理领域的时变信号是相似的。不过是一个是

【LocalAI】(13):LocalAI最新版本支持Stable diffusion 3,20亿参数图像更加细腻了,可以继续研究下

最新版本v2.17.1 https://github.com/mudler/LocalAI/releases Stable diffusion 3 You can use Stable diffusion 3 by installing the model in the gallery (stable-diffusion-3-medium) or by placing this YAML fi

matplotlib之常见图像种类

Matplotlib 是一个用于绘制图表和数据可视化的 Python 库。它支持多种不同类型的图形,以满足各种数据可视化需求。以下是一些 Matplotlib 支持的主要图形种类: 折线图(Line Plot): 用于显示数据随时间或其他连续变量的变化趋势。特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)plt.plot() 函数用于创建折线图。  示例:

细粒度图像分类论文阅读笔记

细粒度图像分类论文阅读笔记 摘要Abstract1. 用于细粒度图像分类的聚合注意力模块1.1 文献摘要1.2 研究背景1.3 本文创新点1.4 计算机视觉中的注意力机制1.5 模型方法1.5.1 聚合注意力模块1.5.2 通道注意力模块通道注意力代码实现 1.5.3 空间注意力模块空间注意力代码实现 1.5.4 CBAM注意力机制CBAM注意力代码实现 1.5.5 本文模型整体架构 1.6

修复漏洞Windows 2012 Server R2(CVE-2016-2183)、(CVE-2015-2808)、(CVE-2013-2566)

修复漏洞 漏洞风险等级评定标准主机风险等级评定标准漏洞概括利用注册表修复漏洞查看修复后的漏洞 漏洞风险等级评定标准 危险程度危险值区域危险程度说明高7 <=漏洞风险值<= 10攻击者可以远程执行任意命令或者代码,或对系统进行远程拒绝服务攻击。中4 <=漏洞风险值< 7攻击者可以远程创建、修改、删除文件或数据,或对普通服务进行拒绝服务攻击。低0 <=漏洞风险值< 4攻击者可以获取

动手学深度学习(Pytorch版)代码实践 -计算机视觉-36图像增广

6 图片增广 import matplotlib.pyplot as pltimport numpy as npimport torch import torchvisionfrom d2l import torch as d2lfrom torch import nn from PIL import Imageimport liliPytorch as lpfrom tor