阅读RFDN-Residual Feature Distillation Network for Lightweight Image Super-Resolution

本文主要是介绍阅读RFDN-Residual Feature Distillation Network for Lightweight Image Super-Resolution,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Residual Feature Distillation Network for Lightweight Image Super-Resolution

Abstract. 单图像超分辨率(SISR)的最新进展探索了卷积神经网络(CNN)的力量,以获得更好的性能。尽管基于cnn的方法取得了巨大的成功,但为了解决高计算量的问题,人们提出了各种快速和轻量级的CNN模型。信息蒸馏网络是目前最先进的方法之一,它采用信道分裂操作来提取提取特征。在本文中,我们提出了 feature distillation connection(FDC),它在功能上等同于信道分裂操作,同时更轻量级和灵活。多亏了FDC,我们可以重新考虑信息多蒸馏网络(IMDN),并提出了一个轻量级和精确的SISR模型,称为 residual feature distillation network(RFDN)。RFDN使用多个FDC来学习更多有区别的特征表示。我们还提出了一个 shallow residual block(SRB)作为RFDN的主要构件,这样网络就可以从residual learning中获益最大,同时仍然足够轻量级。

Introduction. 本文主要关注lightweight图像SR,这是需要在时间敏感的应用程序,如视频推流。介绍常用的SR模型:SRCNN,EDSR;接着引出lightweight SR模型:IDN和IMDN(本文即基于IMDN进行改进)。IMDN在PSNR和推理时间方面都有良好的性能,然而,IMDN的参数数量超过了大多数轻量级的SR模型。网络中的关键设计是information distillation mechanism (IDM),给网络设计带来了不灵活性。很难将identity connection与之合并。

我们选取IMDN作为baseline模型,因为它在重建质量和推理速度之间做了很好的权衡,这非常适合用于移动设备。但是IMDN还不够lightweight,SR的性能还可以进一步提高。通过使用 feature distillation connection(FDC),我们的RFDN更加轻量级。此外,我们提出了 shallow residual block(SRB),作为RFDN的构建块,以进一步提高SR性能。SRB由一个卷积层、一个恒等连接和在末端的一个激活单元组成。与普通卷积相比,它可以在不引入额外参数的情况下从residual learning中获益。

本文贡献点如下:

  1. 提出了一种轻量级的residual feature distillation network(RFDN),用于快速和准确的SR,它在使用比竞争对手更少的参数的同时,实现了最先进的SR性能。
  2. 对信息蒸馏机制(IDM)进行了更全面的分析,并重新思考了IMDN网络。基于这些新的理解,我们提出了比IDM更轻量级和更灵活的feature distillation network(FDC)。
  3. 我们提出了shallow residual block(SRB),它将identity connection与一个卷积块相结合,以在不引入任何额外参数的情况下进一步提高SR性能。
    网络流程图
    在这里插入图片描述

这篇关于阅读RFDN-Residual Feature Distillation Network for Lightweight Image Super-Resolution的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/642069

相关文章

1_Image和Matrix的使用

参考博文: https://www.cnblogs.com/bomo/archive/2013/03/28/2986573.html

C++20中的Feature Test Mocros

C++20定义了一组预处理器宏,用于测试各种语言和库的feature。       Feature Test Mocros(特性测试宏)是C++20中引入的一种强大机制,用于应对兼容性问题。Feature Test Mocros作为预处理器指令(preprocessor directives)出现,它使你能够在编译过程中仔细检查特定语言或库功能(particular language

【QML】用 Image(QQuickPaintedItem) 显示图片

大体功能: 频繁地往界面推送图片,帧率达到视频效果。捕获画布上的鼠标事件和键盘事件。 代码如下: // DrawImageInQQuickPaintedItem.pro 代码如下:QT += quick# You can make your code fail to compile if it uses deprecated APIs.# In order to do so, uncom

ssh在本地虚拟机中的应用——解决虚拟机中编写和阅读代码不方便问题的一个小技巧

虚拟机中编程小技巧分享——ssh的使用 事情的起因是这样的:前几天一位工程师过来我这边,他看到我在主机和虚拟机运行了两个vscode环境,不经意间提了句:“这么艰苦的环境写代码啊”。 后来我一想:确实。 我长时间以来都是直接在虚拟机里写的代码,但是毕竟是虚拟机嘛,有时候编辑器没那么流畅,在文件比较多的时候跳转很麻烦,容易卡住。因此,我当晚简单思考了一下,想到了一个可行的解决方法——即用ssh

芯片后端之 PT 使用 report_timing 产生报告如何阅读

今天,就PT常用的命令,做一个介绍,希望对大家以后的工作,起到帮助作用。 在PrimeTime中,使用report_timing -delay max命令生成此报告。switch -delay max表示定时报告用于设置(这是默认值)。 首先,我们整体看一下通过report_timing 运行之后,报告产生的整体样式。 pt_shell> report_timing -from start_

论文阅读--Efficient Hybrid Zoom using Camera Fusion on Mobile Phones

这是谷歌影像团队 2023 年发表在 Siggraph Asia 上的一篇文章,主要介绍的是利用多摄融合的思路进行变焦。 单反相机因为卓越的硬件性能,可以非常方便的实现光学变焦。不过目前的智能手机,受制于物理空间的限制,还不能做到像单反一样的光学变焦。目前主流的智能手机,都是采用多摄的设计,一般来说一个主摄搭配一个长焦,为了实现主摄与长焦之间的变焦,目前都是采用数字变焦的方式,数字变焦相比于光学

【LLM之KG】CoK论文阅读笔记

研究背景 大规模语言模型(LLMs)在许多自然语言处理(NLP)任务中取得了显著进展,特别是在零样本/少样本学习(In-Context Learning, ICL)方面。ICL不需要更新模型参数,只需利用几个标注示例就可以生成预测。然而,现有的ICL和链式思维(Chain-of-Thought, CoT)方法在复杂推理任务上仍存在生成的推理链常常伴随错误的问题,导致不真实和不可靠的推理结果。

细粒度图像分类论文阅读笔记

细粒度图像分类论文阅读笔记 摘要Abstract1. 用于细粒度图像分类的聚合注意力模块1.1 文献摘要1.2 研究背景1.3 本文创新点1.4 计算机视觉中的注意力机制1.5 模型方法1.5.1 聚合注意力模块1.5.2 通道注意力模块通道注意力代码实现 1.5.3 空间注意力模块空间注意力代码实现 1.5.4 CBAM注意力机制CBAM注意力代码实现 1.5.5 本文模型整体架构 1.6

GIM: Learning Generalizable Image Matcher From Internet Videos

【引用格式】:Shen X, Yin W, Müller M, et al. GIM: Learning Generalizable Image Matcher From Internet Videos[C]//The Twelfth International Conference on Learning Representations. 2023. 【网址】:https://arxiv.or

springboot源码阅读

一、准备阶段 配置maven(3.5以上)下载springboot源码及编译导入idea 二、开始阅读