图像超分:HAN(Single Image Super-Resolution via a Holistic Attention Network)

本文主要是介绍图像超分:HAN(Single Image Super-Resolution via a Holistic Attention Network),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
论文:Single Image Super-Resolution via a Holistic Attention Network
文章检索出处:2020 ECCV

看点

通道注意已被证明在每一层能有效的保存丰富的特征信息。然而,它将每个卷积层试做一个单独的过程,忽略了不同层之间的联系。为了解决这一问题,本文提出了整体注意网络(HAN),主要贡献如下:
1)引入了一个层注意模块(LAM),通过考虑层间相关性来学习不同层特征的权重。同时,提出了通道空间注意模块(CSAM)来学习各层特征的通道和空间相关性。
2)提出的两个注意模块通过对层、通道和位置之间的特征信息进行建模,实现了SOTA。
在这里插入图片描述

方法

overview

如下图所示,HAN由四部分组成:特征提取、层注意模块、通道空间注意模块和最终的重构模块。
给定LR,HAN的第一个卷积层提取一组浅层特征图,然后一系列残差组进一步提取LR的深层特征。其间,利用所提出的LAM来学习残差组输出的特征图的相关性,以及一个CSAM来研究通道和像素之间的相互依赖关系。最后,通过上采样模块产生HR。
在这里插入图片描述

层注意模块

尽管稠密连接和跳层连接允许浅层信息绕过深层,但这些操作没有利用不同层之间的相关性。相反,LAM可以通过获取不同深度特征之间的依赖关系,对不同层的特征分配不同的注意权重,提高提取到的特征的表示能力,结构如下图所示。
在这里插入图片描述
输入为N个残差组(使用共10个RCAN结构)中提取到的中间特征 F G s FG_s FGs,其维数为N×H×W×C。然后将特征组reshape到一个N×HWC的二维矩阵,并应用矩阵乘法和相应的转置来计算不同层之间的相关性
在这里插入图片描述
其中,δ(·)表示Softmax,φ(·)代表reshape。最后,将reshape后的特征组乘以关联矩阵和一个比例因子α,并和输入特征相加
在这里插入图片描述
其中,α初始化为0。

通道空间注意

现有的注意机制没有同时兼顾尺度维度和通道维度。为此,本文提出了CSAM,它包含了所有维度的特征图。注意,尽管可以对从RCAN中提取的所有特征组都执行CSAM,但只调整最后一个特征组,以在精度和速度之间进行权衡,结构如下图所示。
在这里插入图片描述
给定最后一层特征图 F N ∈ R H × W × C F_N∈R^{H×W×C} FNRH×W×C,将 F N F_N FN输入到三维卷积层,通过捕捉通道和空间特征来生成 W c s a W_{csa} Wcsa,具体如下:
在这里插入图片描述
其中 F C S F_{CS} FCS为CSAM的输出,σ(·)为sigmoid激活函数,β是权重,初始化为0。

实验

数据集

使用DIV2K作为训练集,采用双线性插值和BD退化处理。

消融实验

LAM和CSAM模块的消融实验
在这里插入图片描述

不同数量RG组的消融实验
在这里插入图片描述
不同数量CSAM的消融实验
在这里插入图片描述

量化评估

另提出了自集成模型,并将命名为HAN+
BI处理后的测试集x2,x4量化
在这里插入图片描述
在这里插入图片描述
BD处理后的测试集x3量化
在这里插入图片描述

这篇关于图像超分:HAN(Single Image Super-Resolution via a Holistic Attention Network)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/654120

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

什么是 Flash Attention

Flash Attention 是 由 Tri Dao 和 Dan Fu 等人在2022年的论文 FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness 中 提出的, 论文可以从 https://arxiv.org/abs/2205.14135 页面下载,点击 View PDF 就可以下载。 下面我

lvgl8.3.6 控件垂直布局 label控件在image控件的下方显示

在使用 LVGL 8.3.6 创建一个垂直布局,其中 label 控件位于 image 控件下方,你可以使用 lv_obj_set_flex_flow 来设置布局为垂直,并确保 label 控件在 image 控件后添加。这里是如何步骤性地实现它的一个基本示例: 创建父容器:首先创建一个容器对象,该对象将作为布局的基础。设置容器为垂直布局:使用 lv_obj_set_flex_flow 设置容器

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

图神经网络框架DGL实现Graph Attention Network (GAT)笔记

参考列表: [1]深入理解图注意力机制 [2]DGL官方学习教程一 ——基础操作&消息传递 [3]Cora数据集介绍+python读取 一、DGL实现GAT分类机器学习论文 程序摘自[1],该程序实现了利用图神经网络框架——DGL,实现图注意网络(GAT)。应用demo为对机器学习论文数据集——Cora,对论文所属类别进行分类。(下图摘自[3]) 1. 程序 Ubuntu:18.04

问:Super与this在Java中有什么区别?

this: this 关键字用于引用当前对象。它通常用于区分成员变量和方法参数或局部变量。在实例方法中,this 指向调用该方法的对象。在构造函数中,this 指向正在被初始化的对象。 super: super 关键字用于引用父类(超类)的构造函数、方法或变量。在子类的构造函数中,super() 用于调用父类的构造函数。在子类的方法中,super.methodName() 用于调用父类的方法。

HalconDotNet中的图像特征与提取详解

文章目录 简介一、边缘特征提取二、角点特征提取三、区域特征提取四、纹理特征提取五、形状特征提取 简介   图像特征提取是图像处理中的一个重要步骤,用于从图像中提取有意义的特征,以便进行进一步的分析和处理。HalconDotNet提供了多种图像特征提取方法,每种方法都有其特定的应用场景和优缺点。 一、边缘特征提取   边缘特征提取是图像处理中最基本的特征提取方法之一,通过检