NBNet: Noise Basis Learning for Image Denoising with Subspace Projection(CVPR,2021)阅读笔记

本文主要是介绍NBNet: Noise Basis Learning for Image Denoising with Subspace Projection(CVPR,2021)阅读笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文链接:https://arxiv.org/pdf/2012.15028v2.pdf

摘要:本文介绍了一种新的图像去噪框架NBNet。与以前的工作不同,我们建议从一个新的角度来解决这个具有挑战性的问题:通过图像自适应投影来降低噪声。具体来说,我们提出通过在特征空间中学习一组重构基来训练一个能够分离信号和噪声的网络。随后,可以通过选择信号子空间的相应基并将输入投影到这样的空间中来实现图像去噪。我们的关键见解是,投影可以自然地保持输入信号的局部结构,尤其是对于光线较弱或纹理较弱的区域。为此,我们提出了SSA,这是一个非局部注意模块,我们设计它来明确地学习基生成以及子空间投影。我们进一步将SSA与NBNet结合起来,NBnet是一个UNet结构化网络,旨在基于端到端图像去噪。我们对包括SIDD和DND在内的基准进行评估,NBNet在PSNR和SSIM实现了最先进的性能,计算成本显著降低。

贡献:

1、我们从子空间投影的新角度来分析图像去噪问题。我们进一步设计了一个简单有效的SSA模块来学习子空间投影,该模块可以插入到正常的中枢神经系统中。

2、我们提出了NBNet,一个带有SSA模块的用于投影图像去噪的UNet。

3、NBNet在许多受欢迎的基准测试中取得了PSNR和SSIM最先进的表现。

4、我们对基于投影的图像去噪进行了深入的分析,证明这是一个很有前途的探索方向。

图像投影的基本概念:

        其中从输入图像生成一组图像基向量,然后我们在这些基向量所跨越的子空间内重建图像。由于自然图像通常位于低秩信号子空间中,通过适当地学习和生成基向量,重建的图像可以保留大部分原始信息并且抑制与生成的基集无关的噪声。

        通过子空间投影去噪:我们的神经网络学习为信号子空间生成一组基,通过将输入投影到这个空间,信号可以在重建后得到增强,以便于与噪声分离。

模型:

 Figure 3:NBNet的整体架构和关键构件的结构。NBNet基于深度为5的UNet架构,我们的SSA模块(subspace attention module,子空间注意力模块)用于从编码器投射跳过连接的特征。

与使用注意模块进行区域或特征选择不同,SSA设计用于学习子空间基础和图像投影。

SSA结构:

1、生成基向量:

 其中x1和x2是图像特征图,V=[v1,v2,,vK]是由基向量组成的矩阵。首先沿着信道轴将x1和x2连接为X\in R^{H*W*2C},然后将其馈送到具有K输出通道的浅残差卷积块中。然后,输出可以重新整形为HW ×K。基础生成块的权重和偏差在训练期间以端到端的方式更新。

2、投影

理论推导参考:线性代数系列(十)--子空间投影和最小二乘法_Thincor的博客-CSDN博客

N=HW,

给定上述矩阵V\in R^{N*K},它的列是k维信号子空间V\subset R^{N}的基向量,我们可以将图像特征图x1通过正交线性投影投影到V上。最后,图像特征图X1能在信号子空间中被重构为Y。

损失函数:

一个解码器的输出通过线性3×3卷积层作为噪声输入的全局残差,并输出去噪结果。网络是用干净和有噪声的图像对训练的,我们使用简单的“L1干净图像和去噪结果之间的距离”作为损失函数,写成:

x,y,G(.)分别表示干净图像,噪声图像,NBNet

实验:

我们评估了我们的方法在合成数据集和真实数据集上的性能,并将其与以前的方法进行了比较。接下来,我们描述实现细节。然后我们在五个真实图像数据集上报告结果。最后,我们进行消融研究以验证所提出方法的优越性。

1、训练设置

        建议的体系结构不需要预先培训,可以通过端到端策略进行培训。对于所有模块,经验将子空间K的数量设置为16。在训练阶段,根据kaiming初始化整个网络的权重。我们使用带有动量项(0.9,0.999)的Adam 优化器。初始学习速率设置为2×104,降低学习速率的策略是余弦退火。训练过程需要700000次小批量迭代。在训练期间,从每个训练对中裁剪出128 ×128大小的补丁作为一个实例,32个实例堆叠成一个小批量。我们对图像应用随机旋转、裁剪和翻转来增加训练数据。

2、合成高斯噪声上的实验

使用Variational Denoising Network: Toward Blind Noise Modeling and Removal (VDN)中提到的训练方法:训练数据集包括来自BSD的432幅图像,来自ImageNet验证集的400幅图像,以及 Waterloo Exploration Database的4744幅图像。评估测试数据集由set5 、LIVE1 和BSD68 生成。为了实现公平的比较,我们使用与VDN相同的噪声生成算法,其中非整数高斯噪声通过以下方式生成:

 其中M是空间变化的掩模。生成四种类型的掩码,一种用于训练,三种用于测试。通过这种方式,可以很好地测试降噪模型的泛化能力。

3、SIDD基准测试实验

智能手机图像去噪数据集(SIDD) 是使用五个具有代表性的智能手机相机在不同照明条件下从10个场景获得的大约30,000幅噪声图像,并通过系统的过程生成它们的地面真实图像。SIDD可以用来衡量智能手机摄像头的降噪性能。作为基准,SIDD分割了1280张彩色图像进行验证。在本节中,我们使用SIDD基准来验证我们的方法在真实世界降噪任务中的性能。 

 

4、DND基准测试实验

 DND数据集由50对真实噪声图像和相应的地面真实图像组成,对于每一对,源图像以基本的ISO水平拍摄,而有噪声的图像以较高的ISO和适当调整的曝光时间拍摄。参考图像经过仔细的后处理,包括小的相机偏移调整、线性强度缩放和低频偏差的消除。经过后处理的图像作为DND基准的基础事实。

我们在包含50幅测试图像的DND数据集上评估了我们的方法的性能。它提供了边界框,用于从每个图像中提取20个面片,总共得到1000个面片。请注意,DND数据集不提供任何训练数据,因此我们通过组合SIDD和Renoir的数据集来采用训练策略。通过使用在SIDD基准上提供最佳验证性能的同一模型,将结果提交给DND基准。

下载链接:Darmstadt Noise Dataset – Darmstadt Noise Dataset

切除研究:

我们检查了我们模型的三个主要决定因素:a)另一个网络的SSA模块,以及b)信号子空间的维数,即基向量的数量K . c) 关于投影的选项。

1、集成到DnCNN

为了评估我们提出的SSA模块的有效性,我们考虑了另一个经典架构DnCNN作为基线。为了使用等式2中所示的X1和 x2,我们将第一个卷积的特征视为x1,将最后一个卷积之前的特征视为X2。

 2、不同k值的影响

3、关于投影的选项

 

 

这篇关于NBNet: Noise Basis Learning for Image Denoising with Subspace Projection(CVPR,2021)阅读笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/206058

相关文章

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue:

操作系统实训复习笔记(1)

目录 Linux vi/vim编辑器(简单) (1)vi/vim基本用法。 (2)vi/vim基础操作。 进程基础操作(简单) (1)fork()函数。 写文件系统函数(中等) ​编辑 (1)C语言读取文件。 (2)C语言写入文件。 1、write()函数。  读文件系统函数(简单) (1)read()函数。 作者本人的操作系统实训复习笔记 Linux

LVGL快速入门笔记

目录 一、基础知识 1. 基础对象(lv_obj) 2. 基础对象的大小(size) 3. 基础对象的位置(position) 3.1 直接设置方式 3.2 参照父对象对齐 3.3 获取位置 4. 基础对象的盒子模型(border-box) 5. 基础对象的样式(styles) 5.1 样式的状态和部分 5.1.1 对象可以处于以下状态States的组合: 5.1.2 对象

DDS信号的发生器(验证篇)——FPGA学习笔记8

前言:第一部分详细讲解DDS核心框图,还请读者深入阅读第一部分,以便理解DDS核心思想 三刷小梅哥视频总结! 小梅哥https://www.corecourse.com/lander 一、DDS简介         DDS(Direct Digital Synthesizer)即数字合成器,是一种新型的频率合成技术,具有低成本、低功耗、高分辨率、频率转换时间短、相位连续性好等优点,对数字信

数据库原理与安全复习笔记(未完待续)

1 概念 产生与发展:人工管理阶段 → \to → 文件系统阶段 → \to → 数据库系统阶段。 数据库系统特点:数据的管理者(DBMS);数据结构化;数据共享性高,冗余度低,易于扩充;数据独立性高。DBMS 对数据的控制功能:数据的安全性保护;数据的完整性检查;并发控制;数据库恢复。 数据库技术研究领域:数据库管理系统软件的研发;数据库设计;数据库理论。数据模型要素 数据结构:描述数据库

【软考】信息系统项目管理师(高项)备考笔记——信息系统项目管理基础

信息系统项目管理基础 日常笔记 项目的特点:临时性(一次性)、独特的产品、服务或成果、逐步完善、资源约束、目的性。 临时性是指每一个项目都有确定的开始和结束日期独特性,创造独特的可交付成果,如产品、服务或成果逐步完善意味着分步、连续的积累。例如,在项目早期,项目范围的说明是粗略的,随着项目团队对目标和可交付成果的理解更完整和深入时,项目的范围也就更具体和详细。 战略管理包括以下三个过程

【软考】信息系统项目管理师(高项)备考笔记——信息化与信息系统

信息化与信息系统 最近在备考信息系统项目管理师软考证书,特记录笔记留念,也希望可以帮到有需求的人。 因为这是从notion里导出来的,格式上可能有点问题,懒的逐条修改了,还望见谅! 日常笔记 核心知识 信息的质量属性:1.精确性 2.完整性 3.可靠性 4.及时性 5.经济性 6.可验证下 7.安全性 信息的传输技术(通常指通信、网络)是信息技术的核心。另外,噪声影响的是信道

flex布局学习笔记(flex布局教程)

前端笔试⾯试经常会问到:不定宽⾼如何⽔平垂直居中。最简单的实现⽅法就是flex布局,⽗元素加上如下代码即 可: display: flex; justify-content: center; align-items :center; 。下⾯详细介绍下flex布局吧。   2009年,W3C提出了 Flex布局,可以简便⼂完整⼂响应式地实现各种页⾯布局。⽬前已得到了所有浏览器的⽀持,这意味着,现