【视频超分】《Frame and Feature-Context Video Super-Resolution》Fudan University 2019

本文主要是介绍【视频超分】《Frame and Feature-Context Video Super-Resolution》Fudan University 2019,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘要:对于视频超分任务,当前的SOTA方法要么通过处理一个滑动窗口中的低分辨率(LR)视频帧产生高分辨率(HR)视频帧,要么递归地利用之前输出的HR视频帧超分子序列帧。这些方法的主要缺点是:(1)虽然独立产生每一个视频帧可能获得高质量的HR视频帧,但是它会产生不满意的闪烁结果。(2)虽然递归利用之前的评估HR视频帧在短时间段的信息流中获得时间连续性较好的结果,但是它会产生明显的晃动和锯齿状异常。在这篇文章中,我们提出一种端到端训练的帧和特征上下文视频超分网络,该网络包含两个关键子网络:局部网络(local network)和特征上下文网络(feature-context network)。前者利用一系列的LR视频帧产生局部特征和局部超分辨率(SR)帧。后者利用局部网络的输出和之前的评估HR帧以及特征,超分子序列帧。我们的方法充分利用了多帧LR帧的帧间信息和之前的评估HR帧的上下文信息,在产生时间连续的高质量结果的同时保持实时的速度(通过直接利用之前的特征和评估帧)。

 

主要贡献点

1. 所提局部网络能够有效利用多帧LR帧的帧间信息,产生高质量的超分辨率帧(局部SR帧)和参考特征(局部特征)。这些局部特征为特征上下文网络提供了高质量的数据。

2. 通过利用之前评估(HR)帧的上下文信息和特征以及局部网络的输出,我们的网络框架自然引导视频超分网络产生时间一致性较好的结果和学习输出SR帧之间的对齐。

3.得益于递归利用之前的评估帧和特征以及没有显示地运动补偿模块,我们的方法不需要很高的计算代价。

综合性能如下,我们的方法PSNR比SOTA的DUF和FRVSR方法高0.5dB左右,并且速度比它们更快,比DUF快20ms左右。

一、方法

主网络结构图如下

其中NET_L为局部网络(local network),NET_C为上下文网络。NET_L产生局部超分辨率帧SR_t^{Locl}和局部特征F_t^{Local}NET_C输出超分结果SR_t和附加特征F_t

SR_t^{Local},F_t^{Local}=NET_L\left ( LR_{t-1}, LR_t, LR_{t+1}, W_L} \right )

特别地,在实际训练过程中,特征更新使用抑制更新算法(Suppression Update Algorithm)。如下图所示

每隔T=50个时间步, 使用SR_{t-1}=SR_t^{Local}F_{t-1}=F_t^{Local}。该策略的主要作用是解决递归方案中的误差累积效应。

1.1 局部网络

1.2 上下文网络

其中 SR_t,F_t=NET_C\left ( SR_{t-1},F_{t-1},SR_t^{Local}, F_t^{Local};W_C \right )

1.3 损失函数  Loss\left ( W_L, W_C \right )=\left \| SR_t^{Local}-HR_t \right \|_2^2+\left \| SR_t-HR_t \right \|_2^2.

 

二、实验结果,与SOTA比较。注:本文实验的LR图像由BI(bilinear interpolation) 4倍下采样获得。

 

这篇关于【视频超分】《Frame and Feature-Context Video Super-Resolution》Fudan University 2019的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/961897

相关文章

Python视频处理库VidGear使用小结

《Python视频处理库VidGear使用小结》VidGear是一个高性能的Python视频处理库,本文主要介绍了Python视频处理库VidGear使用小结,文中通过示例代码介绍的非常详细,对大家的... 目录一、VidGear的安装二、VidGear的主要功能三、VidGear的使用示例四、VidGea

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

BUUCTF靶场[web][极客大挑战 2019]Http、[HCTF 2018]admin

目录   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 [web][HCTF 2018]admin 考点:弱密码字典爆破 四种方法:   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 访问环境 老规矩,我们先查看源代码

2014 Multi-University Training Contest 8小记

1002 计算几何 最大的速度才可能拥有无限的面积。 最大的速度的点 求凸包, 凸包上的点( 注意不是端点 ) 才拥有无限的面积 注意 :  凸包上如果有重点则不满足。 另外最大的速度为0也不行的。 int cmp(double x){if(fabs(x) < 1e-8) return 0 ;if(x > 0) return 1 ;return -1 ;}struct poin

2014 Multi-University Training Contest 7小记

1003   数学 , 先暴力再解方程。 在b进制下是个2 , 3 位数的 大概是10000进制以上 。这部分解方程 2-10000 直接暴力 typedef long long LL ;LL n ;int ok(int b){LL m = n ;int c ;while(m){c = m % b ;if(c == 3 || c == 4 || c == 5 ||

2014 Multi-University Training Contest 6小记

1003  贪心 对于111...10....000 这样的序列,  a 为1的个数,b为0的个数,易得当 x= a / (a + b) 时 f最小。 讲串分成若干段  1..10..0   ,  1..10..0 ,  要满足x非递减 。  对于 xi > xi+1  这样的合并 即可。 const int maxn = 100008 ;struct Node{int

《x86汇编语言:从实模式到保护模式》视频来了

《x86汇编语言:从实模式到保护模式》视频来了 很多朋友留言,说我的专栏《x86汇编语言:从实模式到保护模式》写得很详细,还有的朋友希望我能写得更细,最好是覆盖全书的所有章节。 毕竟我不是作者,只有作者的解读才是最权威的。 当初我学习这本书的时候,只能靠自己摸索,网上搜不到什么好资源。 如果你正在学这本书或者汇编语言,那你有福气了。 本书作者李忠老师,以此书为蓝本,录制了全套视频。 试

Apple quietly slips WebRTC audio, video into Safari's WebKit spec

转自:http://www.zdnet.com/article/apple-quietly-slips-webrtc-audio-video-into-safaris-webkit-spec/?from=timeline&isappinstalled=0 http://www.zdnet.com/article/apple-quietly-slips-webrtc-audio-video-

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室