基于HEVC的码率控制的相关提案的文献综述

2024-01-09 07:30

本文主要是介绍基于HEVC的码率控制的相关提案的文献综述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

开博首篇,以下我自己翻译的HEVC提案中有关码率控制的最新几篇文章的摘要和介绍,个人水平有限,还望不吝赐!

=======================================================================================


Novel coding tree unitlayer scheme for rate control in HEVC( JCTVC-K0295)

Abstract

  本提案[1]提供了一种基于HEVC的新型CTU层码率控制结构。此提案中提出了一种确定GOP中第一帧图像QP的算法,接着描述了一种分配目标帧码率的改进策略,最后,基于一种新型的率失真代价模型(DQ模型)预测了一帧中CTU层的QP值,以及该帧中剩余CTU的目标码率。与HM8.0码率控制相比,重建视频的平均PSNR在RA-main、LB-main和 LP-main条件下分别能够提升1.10 dB、 0.67 dB和0.62 dB ,能够实现更加平滑的PSNR性能。

Introduction

     JCTVC-I0094中编码单元层码率控制结构为CTU分配目标码率,而采取了一种基于像素的unifiedrate quantization (URQ)模型来为CTU预测QP值。然而,JCTVC-I0094中率失真性能并不如 JCTVC-J0057在 X.264中基于帧级别的码率控制算法表现好。为了实现良好的重建视频的主观质量,在一帧中针对不同复杂度的CTU应该采取不同的QP值[4]。然后, JCTVC-J0057中的结构在一帧中对于所有的CTU都采取同一个QP值,因此这种结构不能提供很好的主观质量。

      本提案提供了一种基于HEVC的新型CTU层码率控制结构。此提案中提出了一种确定GOP中第一帧图像QP的算法,接着描述了一种分配目标帧码率的改进策略,最后,基于一种新型的率失真代价模型(DQ模型)预测了一帧中CTU层的QP值,以及该帧中剩余CTU的目标码率。与HM8.0码率控制相比,重建视频的平均PSNR在RA-main、LB-main和 LP-main条件下分别能够提升1.10 dB、 0.67 dB和0.62 dB ,能够实现更加平滑的PSNR性能。

References

[1] Wei Wu, Bin Song,  “Novel coding tree unit layer scheme for rate control in HEVC,” JCT-VC of ITU-T SG 16 WP 3 andISO/IEC JTC1/SC 29/WG11, JCTVC-K0295, Shanghai, CN, Oct. 2012

[2] H. Choi, J. Nam, J. Yoo, D. Sim, and I. V. Bajić, “Improvement of the rate control based on pixel-based URQ model for HEVC,” JCT-VCof ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, JCT-VC I0094, Geneva, CH, Apr. 2012.

[3] J. Si, S. Ma, W. Gao, and M. Yang, “Adaptive rate control for HEVC,” JCT-VC of ITU-T SG16 WP3 and ISO/IECJTC1/SC29/WG11, JCT-VC J0057, Stockholm, SE, July 2012.

[4] K. Sato, “On LBS and Quantization,” JCT-VC of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, JCTVC-D308r1, Daegu, KR, Jan. 2011.

 

Improvement of the rate control for HEVCJCTVC-K0229

Abstract

该提案建议一种针对随机访问(RA)条件下提高HM8.0码率控制模型的压缩性能,同时能够降低低延时(LD)条件下码率波动的方法。对RA而言,通过率失真和比特率来确定评估帧复杂度的权重因子,从而精确地实现目标比特的计算。此外,为了提高RD性能,对所有随机访问指针进行了缓冲区的控制。对LD而言,为了降低比特率的波动,采取在一个GOP中仅在第一个编码帧中进行码率控制,同时采用一个单一的λ值来实现率失真优化(RDO),而不需考虑其所在的时间层ID(TID)。根据该码率控制提议的修改,对RA而言,平均BD-PSNR 提高了0.74 dB;而LD而言,比特率波动的变化减少了 50.88%。

Table 1. QP derivation process for firstframe in a GOP

HM8.0 with the rate control

HM8.0 with the proposed rate control

QP ¬ average of a previous GOP

IF previous frame QP + 2 < QP THEN

QP¬QP+2

ELIF previous frame QP – 2 > QP THEN

   QP¬QP-2

ENDIF

Predict a target-bit

IF No remaining-bit in GOP THEN

QP ¬ previous frame QP + 2

ELSE

invoke the RQ model

ENDIF

 HM8.0中,采用分层QP结构来提高编码性能。分层GOP结构根据不同的TID值分配不同的QP值和λ值。λ值的计算如下:

 

 

References

[1]   J. Si, S. Ma,W. Gao, “Adaptive ratecontrol for HEVC,” JVT of ISO/IEC MPEG and ITU-T VCEG, JVT-J0057,Stockholm, SE, July. 2012

[2]   H.Choi, J. Nam, J. Yoo, D. Sim, I. V. Bajić, “Rate control based on unified RQ model forHEVC,”JVT of ISO/IEC MPEG and ITU-TVCEG, JVT-H023, San José, CA, Feb. 2012

[3]   Y.Liu, Z.G. Li, and Y.C. Soh, “A novel rate control scheme for low delay videocommunication of H.264/AVC standard,”IEEETrans. on Circuits and Syst. Video Tech., vol. 17, no. 1, pp. 68-78, Jan.2007

[4]   F.Bossen, “Common test conditions and software reference configurations,”JCT-VC of ITU-T SG16 WP3 and ISO/IECJTC1/SC29/WG11, JCT-VC G1200(m22869), Geneva, CH, Nov. 2011

 

Adaptive rate controlfor HEVC JCTVC-J0057

Abstract

该提案提供了JCTVC-I0433提案中码率控制结构的改进方案。针对HM7.0上的码率控制结构提案,主要有以下两个方面修改:一方面,采用假设参考解码器(HRD)来调节比特的分配;另一方面,在R-Q模型中使用 量化尺度代替直接采用QP。相比HM7.0之前的码率控制结构,采用分段三次插值方式的BD码率计算能够在 RA-main情况下减少高达28.5% (LP-main: -21.1%; LB-main:-20.7%)。

Introduction

JCTVC-H0213提案中,针对HM7.0平台,在RA-main条件下,BD-RATE损失平均高达45.4%(LB-main: 29.5%, LP-main: 28.2%)。情况更糟糕时,损失可能高于70%,这是不能接受的。基于比较流行的X264编码器中所使用的自适应比特率(ABR)码率控制算法,在JCTVC-I0433中提出了一种针对HEVC的新型自适应码率控制结构。它的性能要优于H0213,而且能够与固定码率相比拟。该提案中,码率控制结构进一步改善来降低PSNR的波动,同时SSIM值也作为一种额外的性能计算的方法。

 

Proposed rate control algorithm

1Rate modeling码率模型

基于X264中码率控制算法的率失真模型研究,提出了一种针对HEVC的线性R-D模型,如公式(1)所示。在提案模型中,采用SATD作为复杂度的评估。此外,提案中的R模型中将先前编码帧的复杂度也考虑在内,为编码性能的稳定提供有效的信息。该建议的R模型如下:

                                                                                                                              (1)

其中α是模型系数,R为码率。X为当前帧的复杂度估计值,qscale为量化尺度。X的计算公式为:

                                           (2)

n为当前帧序号,QPn-1为第n-1帧的量化参数,Rn-1为第n-1帧的实际比特数。λ为一个常量,参考值为0.6wi为先前编码帧的SATD值的权重。wi的定义如下:

                                                                                                                    (3)

量化尺度qscale和量化因子QP的关系如下:

                                                                                                (4)

Figure. 1: The relationship between thegenerated bits and the estimated bits. QP is set to 32.

2 Rate control scheme码率控制结构

考虑到LDRA设置的差异,该提案建议码率控制算法针对二者分别进行了设计。为RA设置情况设计了一种GOP级别QP调整策略,同时针对LDRA设置采用帧级别自适应QP调整结构,从而使得比特率尽可能地与目标要求相符合。

 

 

Reference

[5]   H.Choi, J. Nam, J. Yoo, D. Sim, and I. V. Bajić, “Rate control based on unified RQmodel for HEVC,” JCT-VCof ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, JCT-VC H0213 (m23088), San José, CA, USA, Feb.2012

FrankBossen, “Common test conditions and software reference configurations” , JCTVC-H1100,8th JCT-VC Meeting, San Jose, CA, USA, 1-10 February, 2012.

这篇关于基于HEVC的码率控制的相关提案的文献综述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/586354

相关文章

Spring Security 基于表达式的权限控制

前言 spring security 3.0已经可以使用spring el表达式来控制授权,允许在表达式中使用复杂的布尔逻辑来控制访问的权限。 常见的表达式 Spring Security可用表达式对象的基类是SecurityExpressionRoot。 表达式描述hasRole([role])用户拥有制定的角色时返回true (Spring security默认会带有ROLE_前缀),去

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

两个月冲刺软考——访问位与修改位的题型(淘汰哪一页);内聚的类型;关于码制的知识点;地址映射的相关内容

1.访问位与修改位的题型(淘汰哪一页) 访问位:为1时表示在内存期间被访问过,为0时表示未被访问;修改位:为1时表示该页面自从被装入内存后被修改过,为0时表示未修改过。 置换页面时,最先置换访问位和修改位为00的,其次是01(没被访问但被修改过)的,之后是10(被访问了但没被修改过),最后是11。 2.内聚的类型 功能内聚:完成一个单一功能,各个部分协同工作,缺一不可。 顺序内聚:

log4j2相关配置说明以及${sys:catalina.home}应用

${sys:catalina.home} 等价于 System.getProperty("catalina.home") 就是Tomcat的根目录:  C:\apache-tomcat-7.0.77 <PatternLayout pattern="%d{yyyy-MM-dd HH:mm:ss} [%t] %-5p %c{1}:%L - %msg%n" /> 2017-08-10

Node Linux相关安装

下载经编译好的文件cd /optwget https://nodejs.org/dist/v10.15.3/node-v10.15.3-linux-x64.tar.gztar -xvf node-v10.15.3-linux-x64.tar.gzln -s /opt/node-v10.15.3-linux-x64/bin/npm /usr/local/bin/ln -s /opt/nod

git ssh key相关

step1、进入.ssh文件夹   (windows下 下载git客户端)   cd ~/.ssh(windows mkdir ~/.ssh) step2、配置name和email git config --global user.name "你的名称"git config --global user.email "你的邮箱" step3、生成key ssh-keygen

zookeeper相关面试题

zk的数据同步原理?zk的集群会出现脑裂的问题吗?zk的watch机制实现原理?zk是如何保证一致性的?zk的快速选举leader原理?zk的典型应用场景zk中一个客户端修改了数据之后,其他客户端能够马上获取到最新的数据吗?zk对事物的支持? 1. zk的数据同步原理? zk的数据同步过程中,通过以下三个参数来选择对应的数据同步方式 peerLastZxid:Learner服务器(Follo

控制反转 的种类

之前对控制反转的定义和解释都不是很清晰。最近翻书发现在《Pro Spring 5》(免费电子版在文章最后)有一段非常不错的解释。记录一下,有道翻译贴出来方便查看。如有请直接跳过中文,看后面的原文。 控制反转的类型 控制反转的类型您可能想知道为什么有两种类型的IoC,以及为什么这些类型被进一步划分为不同的实现。这个问题似乎没有明确的答案;当然,不同的类型提供了一定程度的灵活性,但

rtmp流媒体编程相关整理2013(crtmpserver,rtmpdump,x264,faac)

转自:http://blog.163.com/zhujiatc@126/blog/static/1834638201392335213119/ 相关资料在线版(不定时更新,其实也不会很多,也许一两个月也不会改) http://www.zhujiatc.esy.es/crtmpserver/index.htm 去年在这进行rtmp相关整理,其实内容早有了,只是整理一下看着方

深入解析秒杀业务中的核心问题 —— 从并发控制到事务管理

深入解析秒杀业务中的核心问题 —— 从并发控制到事务管理 秒杀系统是应对高并发、高压力下的典型业务场景,涉及到并发控制、库存管理、事务管理等多个关键技术点。本文将深入剖析秒杀商品业务中常见的几个核心问题,包括 AOP 事务管理、同步锁机制、乐观锁、CAS 操作,以及用户限购策略。通过这些技术的结合,确保秒杀系统在高并发场景下的稳定性和一致性。 1. AOP 代理对象与事务管理 在秒杀商品