视频超分:FFCVSR(Frame and Feature-Context Video Super-Resolution)

2024-01-28 16:08

本文主要是介绍视频超分:FFCVSR(Frame and Feature-Context Video Super-Resolution),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
论文:帧和特征上下文的视频超分辨率
文章检索出处:AAAI 2019

摘要

对于视频超分辨率,当前的方法要么是以滑动窗口的方式去处理多个相邻帧,要么是利用先前估计的HR帧来超分下一帧。这些方法的主要缺点是:1)单独生成每个输出帧可以获得高质量的HR帧,但是会导致令人不满意的伪影;2)组合先前生成的HR帧可以产生时间上一致的结果,但是,由于之前的超分误差不断累积到后续帧中,会造成明显的抖动和锯齿状伪影。本文提出了基于帧和特征上下文的视频超分辨率网络(FFCVSR),该网络由两个子网络组成:局部网络和上下文网络。局部网络显式地利用连续的LR帧序列生成局部特征和局部SR帧。上下文网络结合局部网络的输出和先前估计的HR帧和特征,对后续帧进行超分。该方法充分利用了多个LR帧的帧间信息和先前预测的HR帧的上下文信息,通过直接重用先前的特征和帧,在保持实时速度的同时产生了时间一致的高质量结果。
在这里插入图片描述

方法

overview

FFCVSR由两个可训练组件组成:局部网络 N E T L NET_L NETL和上下文网络 N E T C NET_C NETC。给定一个LR帧序列,局部网络利用帧间固有的局部相关性信息,输出局部帧 S R t L o c a l SR_t^{Local} SRtLocal和局部特征 F t L o c a l F^{Local}_t FtLocal,帮助后续的上下文网络恢复丢失的高频细节。考虑到超分结果应保持时间一致性,上下文网络不仅利用了局部帧和之前生成的SR帧,而且结合了局部特征和之前的SR特征,得到了视觉上令人满意的时间一致性结果。需要注意的是,FFCVSR框架没有以前方法中常用的运动补偿模块,这在降低计算成本方面有额外的优势。
在这里插入图片描述

局部网络

局部网络以局部相关的形式利用帧间固有的信息,通过对LR帧序列的处理输出局部帧和特征。simple N E T L NET_L NETL由5个卷积(核大小=3×3,步长=1)、1个反卷积(核大小=8×8,步长=4)和8个残差块组成。使用反卷积结果和LR帧的双三次插值结果之和作为输出局部SR帧。局部特征输出是通过带有两个卷积运算的方式来产生的,如下图所示。
在这里插入图片描述

上下文网络

利用来自先前预测的HR帧和特征和局部网络的输出来预测HR帧。其中,上下文信息意味着生成HR帧将参考先前的HR帧和特征以保持时间一致性。我们的 N E T C NET_C NETC由5个卷积(核大小=3×3,步长=1)、1个反卷积(核大小=8×8,步长=4)、4个残差块和2个space-to-depth变换。在这使用space-to-depth的转换来减少计算量。使用反卷积的结果和局部网络输出的SR帧的和作为最终输出。此外,还通过添加带有两个卷积运算的输出,为后续超分提供特征,如下如所示。
在这里插入图片描述

抑制更新算法

一个关键的观察结果是,当使用先前推断的HR帧作为参考信息来生成后续帧时,超分辨率视频具有显著的抖动和锯齿伪影,因为先前的超分辨率误差不断累积到后续帧。针对这一问题,本文提出了一种简单的抑制更新算法。具体来说,将 N E T C NET_C NETC的输入 S R t − 1 SR_{t−1} SRt1 F t − 1 F_{t−1} Ft1替换 S R t L o c a l SR_t^{Local} SRtLocal F t L o c a l F_t^{Local} FtLocal。因为经过多次迭代之后, N E T C NET_C NETC的输出积累了大量的超分辨误差,而 N E T L NET_L NETL的输出仍然保持了当前LR帧的准确信息,而没有引入先前SR帧的累积误差。在实验中观察到T=50可以产生良好的结果。

损失函数

在FFCVSR框架中,提议的局部网络和上下文网络是无缝结合和联合训练的,损失函数定义为:
在这里插入图片描述

实验

数据集

训练数据集包括两个高分辨率视频:从harmonic下载的Venice和Myanmar。这两段视频的长度分别为1077秒和527秒。选择它们作为训练集是因为它们包含了140多个不同的场景,包括人类场景、自然场景、建筑场景、交通场景等。为了生成HR视频,首先将原始视频按4(960×540)、6(640×360)、8(480×270)、12(320×180)和16(240×135)的因子进行降尺度,以获得各种各样的高分辨率地面真实感感受野。然后提取大小为128×128的补丁来生成HR视频,使用BI降质降采样四倍生成LR。

消融实验

对于所提出的组件的消融实验
在这里插入图片描述

量化评估

在这里插入图片描述

这篇关于视频超分:FFCVSR(Frame and Feature-Context Video Super-Resolution)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/654124

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

《x86汇编语言:从实模式到保护模式》视频来了

《x86汇编语言:从实模式到保护模式》视频来了 很多朋友留言,说我的专栏《x86汇编语言:从实模式到保护模式》写得很详细,还有的朋友希望我能写得更细,最好是覆盖全书的所有章节。 毕竟我不是作者,只有作者的解读才是最权威的。 当初我学习这本书的时候,只能靠自己摸索,网上搜不到什么好资源。 如果你正在学这本书或者汇编语言,那你有福气了。 本书作者李忠老师,以此书为蓝本,录制了全套视频。 试

Apple quietly slips WebRTC audio, video into Safari's WebKit spec

转自:http://www.zdnet.com/article/apple-quietly-slips-webrtc-audio-video-into-safaris-webkit-spec/?from=timeline&isappinstalled=0 http://www.zdnet.com/article/apple-quietly-slips-webrtc-audio-video-

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

树莓派5_opencv笔记27:Opencv录制视频(无声音)

今日继续学习树莓派5 8G:(Raspberry Pi,简称RPi或RasPi)  本人所用树莓派5 装载的系统与版本如下:  版本可用命令 (lsb_release -a) 查询: Opencv 与 python 版本如下: 今天就水一篇文章,用树莓派摄像头,Opencv录制一段视频保存在指定目录... 文章提供测试代码讲解,整体代码贴出、测试效果图 目录 阶段一:录制一段

基于树梅派的视频监控机器人Verybot

最近这段时间做了一个基于树梅派 ( raspberry pi ) 的视频监控机器人平台 Verybot ,现在打算把这个机器人的一些图片、视频、设计思路进行公开,并且希望跟大家一起研究相关的各种问题,下面是两张机器人的照片:         图片1:                   图片2                    这个平台的基本组成是:

PC与android平板通过浏览器监控Verybot的视频

下面这个视频是PC与android平板通过浏览器监控Verybot的视频:           http://v.youku.com/v_show/id_XNjYzNzYyMTIw.html

Verybot的几个视频

1、Verybot的运动控制                 http://v.youku.com/v_show/id_XNjYxNjg4MTM2.html           2、Verybot比较初步的网络视频监控           http://v.youku.com/v_show/id_XNjYxNjkyMjg0.html           3、V

java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频)

这是什么系统? 资源获取方式在最下方 java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频) 停车管理信息系统是为了提升停车场的运营效率和管理水平而设计的综合性平台。系统涵盖用户信息管理、车位管理、收费管理、违规车辆处理等多个功能模块,旨在实现对停车场资源的高效配置和实时监控。此外,系统还提供了资讯管理和统计查询功能,帮助管理者及时发布信息并进行数据分析,为停车场的科学