Blind Image Super-Resolution: A Survey and Beyond

2024-04-18 22:15

本文主要是介绍Blind Image Super-Resolution: A Survey and Beyond,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

TPAMI2023
问题定义

  • 未知图像的退化过程(和之前假定bicubic等一个固定且已知的退化过程相对比),由LR恢复HR;
  • 退化来源(不同的图像采集设备,数字信号处理成可见图像的过程中图像处理算法引入的噪声,在图像储存和传输过程中引入的噪声和胶片腐蚀等)
  • 方法分类:
    – 基于经典退化模型及其变体的显式建模;
    – 利用外部数据集的数据分布的隐式建模;

EXPLICIT DEGRADATION MODELLING

with external dataset

wo degradation estimation

  • 由外部的模型来进行degradation estimation;
  • SRMD(super resolution for mutiple degradations)输入LR和degradation map,degradation map是blur kernel被PCA编码为vector然后和噪声 σ \sigma σconcate之后扩展到LR的尺寸,之后UDVD也采用了degradation map;
  • DPSR不需要生成degradation map,而是通过最小化基于 y = ( x ↓ s ⊗ k ) + n y = (x\downarrow_s \otimes k) + n y=(xsk)+n的目标函数(分解为两个子问题,但是没看懂咋解的),两个子问题分别是deblur, SR + denoising;
  • USRNet也是map framework,也是两个子问题,但是所基于的退化建模是 y = ( x ⊗ k ) ↓ s + n y = (x \otimes k)\downarrow_s + n y=(xk)s+n,两个子问题是SR + deblur, denoising
  • 这类方法主要存在的问题是需要一个准确的模型来进行退化估计,模型的结果比较依赖于准确的估计;

with degradation estimation

  • 将SR和degradation estimation统一到一个框架当中;
  • IKC提出以迭代的方式进行核估计,首先一个预测网络来初始化kernel,之后一个corrector网络在输入(以当前kernel为条件的SR)的情况下输出kernel residual,之后修正后的kernel重复这个修正的过程;
  • DAN提出对IKC的改进,叫corrector和SR网络统一训练,而不是像IKC一样分开单独训练;
  • 上面的两种方法可以从domain adaptation的角度进行解释;
  • 还有一些方法试图解决迭代耗时的问题;
  • DRL-DASR使用无监督学习的方法来训练degradation encoder,获得的degradation representation供SR使用;
  • KOALAnet使用dynamic kernel strategy

complex degradation modeling

  • 经典的退化模型不能很好的涵盖现实的情况,一些工作采用更大的degradation空间;
  • BSRGAN还是使用经典的退化算子,但是顺序是打乱的;
  • Real-ESRGAN使用高阶的退化模型,也就是传统的退化模型重复多次,文章中阶数为2;

with internal statistics

  • 基于的点是patches of a single image tend to recur within and across different scales of this image;
  • 之前的方法:提出MAP framework来估计SR blur kernel,最佳的kernel k是最大化不同尺度的recuring patches的相似度的那个;
  • gan-based: KernelGAN将相似度的最大化建模成数据分布;
  • flow-based: FKP在latent space进行kernel的求解,而不是pixel space,更加efficiency;
  • ZSSR和DGDML-SR自监督的进行训练;

IMPLICIT DEGRADATION MODELLING

  • 假如有成对的HR-LR图片对数据集,现在的监督学习可以得到比较好的效果,但是有更加挑战的情况,有两个数据集,HR和不成对的LR,问题变为domain adaptation;
    在这里插入图片描述
  • CinCGAN包含两个cycle,LR-Cycle首先将LR转换到Bicubic LR domain(Clean LR),bicubic LR domain的数据认为是从HR下采样得到的,认为是没有噪声的,两个cycle使用的都是cycle gan,此时训练只能靠discriminator,不能靠成对数据的reconstruction loss,训练不稳定;
  • b中的训练策略是将L2H和H2L统一到一个框架当中,其中L2H使用的是成对的数据,H2L使用的是不成对的数据;
  • 上面的方法生成的LR和真实的LR可能会存在较大的差异,DASR将生成的LR和真实的LR都加入到SR模型的训练当中,使用domain distance weighted supervision来对生成的LR赋予不同的权重,权重基于LR discriminator;

dataset

这篇关于Blind Image Super-Resolution: A Survey and Beyond的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/915961

相关文章

【机器学习】自然语言处理的新前沿:GPT-4与Beyond

📝个人主页:哈__ 期待您的关注  目录 🔥引言 背景介绍 文章目的 一、GPT-4简介 GPT-4概述 主要特性 局限性和挑战 二、自监督学习的新进展 自监督学习的原理 代表性模型和技术 三、少样本学习和零样本学习 少样本学习的挑战 先进方法 四、跨模态学习 跨模态学习的概念 代表性技术 应用场景 第五部分:可解释性和透明性 AI的可解释

1_Image和Matrix的使用

参考博文: https://www.cnblogs.com/bomo/archive/2013/03/28/2986573.html

Retrieval-Augmented Generation for Large Language Models A Survey

Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 文章目录 Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 Abstract背景介绍 RAG概述原始RAG先进RAG预检索过程后检索过程 模块化RAGMo

【QML】用 Image(QQuickPaintedItem) 显示图片

大体功能: 频繁地往界面推送图片,帧率达到视频效果。捕获画布上的鼠标事件和键盘事件。 代码如下: // DrawImageInQQuickPaintedItem.pro 代码如下:QT += quick# You can make your code fail to compile if it uses deprecated APIs.# In order to do so, uncom

GIM: Learning Generalizable Image Matcher From Internet Videos

【引用格式】:Shen X, Yin W, Müller M, et al. GIM: Learning Generalizable Image Matcher From Internet Videos[C]//The Twelfth International Conference on Learning Representations. 2023. 【网址】:https://arxiv.or

U-Net for Image Segmentation

1.Unet for Image Segmentation 笔记来源:使用Pytorch搭建U-Net网络并基于DRIVE数据集训练(语义分割) 1.1 DoubleConv (Conv2d+BatchNorm2d+ReLU) import torchimport torch.nn as nnimport torch.nn.functional as F# nn.Sequential

微信小程序-获取swiper-item中image的值(item-id)

滑过一个图片获取该图片的id,或者打印其他的item值 只需要加:item-id="{{item.id}}" <swiper bindchange="swiperchange"><block wx:for="{{photos}}" wx:key='{{item.id}}'><swiper-item item-id="{{item.id}}"><image src='{{item.url}

PHPWord 又拍云图片导出被识别为 image/webp 无法导出的问题

1.解决办法读取图片转jpg 存储在windows 临时目录中,然后读取图片 if (!empty($v['goods_img'])) {foreach ($v['goods_img'] as $imgs) {if (!empty($imgs)) {$imageUrl = trim('http://cdn.wowo.com' . '/' . $imgs . '!/fh/100');$image

Android开发系列(五)Jetpack Compose之Icon Image

Icon是用于在界面上显示矢量图标的组件。它提供了很多内置的矢量图标,也支持自定义图标。要使用Icon组件,可以通过指定图标资源的名称或引用来创建一个Icon对象。例如,使用Icons.Default.Home来创建一个默认风格的首页图标。可以通过设置图标的大小、颜色、和点击事件等属性来自定义Icon的外观和行为。     Image是用于在界面上显示位图图像的组件。它支持从本地资源、网络

AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读

Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文!受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。 在本文中,作者通过标记不可信或与文本不对齐的图像区域,以及注释文本提示中的哪些单词在图像上被歪曲或丢失来丰富反馈信号。 在 18K 生成图像 (R