HEVC混合编码方法引入的亮点

2024-04-07 07:18

本文主要是介绍HEVC混合编码方法引入的亮点,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

HEVC混合编码方法引入的亮点:(翻译能力有限,不当之处,欢迎指正,谢谢)

1)             编码树单元(CTU,coding tree units)和编码树块(CTB,coding tree block)结构

以前标准编码层的核心是宏块,通常是4:2:0格式,包含一个16x16亮度采样块和两个相应的8x8色度采样块。然而,HEVC中类似的结构是CTU,它的大小由编码器决定,并且它可以比传统的宏块要大。一个CTU由一个亮度CTB(CTB, coding tree block),相应的两个色度CTBs和语法元素组成。一个LxL大小的亮度CTU可以是L=16,32,或者64采样;一般而言,大的CTU有利于提高压缩性能。HEVC支持CTBs通过树结构分割成更小的块和像四叉树的信号。

2)             编码单元(CU,coding units)和编码块(CB, coding block

CTU的四叉树语言结构指定了它亮度和色度CTBs的大小和位置。

四叉树的根部在CTU。因此,一个亮度CB最大为一个CTB。一个CTU分割成多个亮度和色度CTBs有分割信号控制。一个CU由一个亮度CB,两个相应的色度CBs和语法元素组成。一个CTB可能只含有一个CU,或者分割成多个CUs,并且每个CU有一个相应的分割的多个预测单元(PUs, prediction units)和一个树变换单元(TUs, transform units)。

3)             预测单元(PUs,prediction units)和预测块(PBs,prediction blocks)

在CU级决定一个编码一个图像区域用帧间预测还是帧内预测。一个PU分割结构的根部在CU级。依据基本的预测类型选择,亮度和色度的CBs可以进一步分割大小,这些分割子块通过亮度和色度PBs进行预测。HEVC支持的PB大小从64x64到4x4。

4)             变换单元(TUs,transform units)和变换块(TBs, transform blocks)

预测残差通过块变换进行编码。一个TU树结构的根部在CU级。亮度CB残差可能和亮度变换块TB一样,或者进一步分割成多个亮度TBs。色度TBs也是一样的。定义了一个类似离散余弦变换(DCT, discrete cosine transform)的整数基函数用于正方形TB块,如4x4,8x8,16x16和32x32。对于4x4的亮度帧内预测残差块,定义了一个源于离散正弦变换(DST, discrete sine transform)的整数变换。

5)             运动矢量信号

使用了一个先进的运动矢量预测(AMVP, advanced motion vector prediction),它包含基于相邻PBs和参考帧数据的最可能候选模式。同时,使用一个针对MV编码的融合模式,它允许从时域或空域相邻PBs继承MVs。而且,和H.264/MPEG-4AVC相比,还定义了改善的skip的和直接运动推断。

6)             运动补偿(MC,motion compensation

MVs采用1/4采样精度,7抽头和8抽头的滤波器用于分数采样内插。(和H.264/MPEG-4 AVC相比,H.264/MPEG-4 AVC采用6抽头滤波器用于1/2像素位置采样,然后通过线性内插的1/4位置采样)。和H.264/MPEG-4AVC相似,HEVC采用了多参考帧。对于每一个PB,传输一个或者两个运动矢量,将相应导致单向预测或者双向预测编码。像H.264/MPEG-4 AVC一样,HEVC采用一个扩充和偏移操作来实现权重预测。

7)             帧内预测(Intrapictureprediction

在帧间预测不能实现的图像区域,相邻块的已编码边界采样点用作空域预测的参考数据。帧内预测支持33种方向模式(H.264/MPEG-4AVC支持8种这样模式),一种平面模式和一种DC预测模式。选择的帧内预测模式通过基于之前相邻以解码的PBs的最可能模式(MPM,most probable prediction modes)之一进行编码。

8)             量化控制

和H.264/MPEG-4AVC中一样,HEVC采用一种统一的重建量化机制,同时针对不同大小的TB伸缩量化矩阵。

9)             熵编码

HEVC采用基于内容自适应的二进制算术编码(CABAC, context adaptive binary arithmeticcoding)进行熵编码。这个和H.264/MPEG-4 AVC中的CABAC很相似,但是做了一些改进以提高它的处理速度和压缩性能,并减少它的内容内存存储要求。

10)         内部环路去块滤波器

HEVC在帧间预测循环中,采用一个类似H.264/MPEG-4 AVC用的去块滤波器。然而,这种滤波器针对决策机制和滤波处理过程设计的简单些,并且能很好的用于并行处理之中。

11)         采样自适应偏移(SAO,sample adaptive offset

HEVC在帧间预测循环的去块滤波后,引入了一个非线性的幅度映射。它的目的是用查表的方法更好的重建原来信号的幅度。这个查表同个一些在编码端通过直方图分析获得的额外参数进行设置。(注:转载请注明出处,谢谢)

这篇关于HEVC混合编码方法引入的亮点的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/881967

相关文章

SW - 引入第三方dwg图纸后,修改坐标原点

文章目录 SW - 引入第三方dwg图纸后,修改坐标原点概述笔记设置图纸新原点END SW - 引入第三方dwg图纸后,修改坐标原点 概述 在solidworks中引入第三方的dwg格式图纸后,坐标原点大概率都不合适。 全图自动缩放后,引入的图纸离默认的原点位置差很多。 需要自己重新设置原点位置,才能自动缩放后,在工作区中间显示引入的图纸。 笔记 将dwg图纸拖到SW中

react笔记 8-17 属性绑定 class绑定 引入图片 循环遍历

1、绑定属性 constructor(){super()this.state={name:"张三",title:'我是一个title'}}render() {return (<div><div>aaaaaaa{this.state.name}<div title={this.state.title}>我是一个title</div></div></div>)} 绑定属性直接使用花括号{}   注

YOLOv8改进实战 | 注意力篇 | 引入CVPR2024 PKINet 上下文锚点注意力CAAttention

YOLOv8专栏导航:点击此处跳转 前言 YOLOv8 是由 YOLOv5 的发布者 Ultralytics 发布的最新版本的 YOLO。它可用于对象检测、分割、分类任务以及大型数据集的学习,并且可以在包括 CPU 和 GPU 在内的各种硬件上执行。 YOLOv8 是一种尖端的、最先进的 (SOTA) 模型,它建立在以前成功的 YOLO 版本的基础上,并引入了新的功能和改进,以

fetch-event-source 如何通过script全局引入

fetchEventSource源码中导出了两种类型的包cjs和esm。但是有个需求如何在原生是js中通过script标签引呢?需要加上type=module。今天介绍另一种方法 下载源码文件: https://github.com/Azure/fetch-event-source.git 安装: npm install --save-dev webpack webpack-cli ts

YOLOv8改进 | Conv篇 | YOLOv8引入DWR

1. DWR介绍 1.1  摘要:当前的许多工作直接采用多速率深度扩张卷积从一个输入特征图中同时捕获多尺度上下文信息,从而提高实时语义分割的特征提取效率。 然而,这种设计可能会因为结构和超参数的不合理而导致多尺度上下文信息的访问困难。 为了降低多尺度上下文信息的绘制难度,我们提出了一种高效的多尺度特征提取方法,将原始的单步方法分解为区域残差-语义残差两个步骤。 在该方法中,多速率深度扩张卷积

机器学习模型中的因果关系:引入单调约束

单调约束是使机器学习模型可行的关键,但它们仍未被广泛使用欢迎来到雲闪世界。 碳ausality 正在迅速成为每个数据科学家工具包中必不可少的组成部分。 这是有充分理由的。 事实上,因果模型在商业中具有很高的价值,因为它们为“假设”情景提供了更可靠的估计,特别是在用于做出影响业务结果的决策时。 在本文中,我将展示如何通过简单的更改(实际上添加一行代码)将传统的 ML 模型(如随机森林、L

DevExpress WinForms v24.1新版亮点:功能区、数据编辑器全新升级

DevExpress WinForms拥有180+组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜任! DevExpress WinForms控件2024年第一个重大版本——v24.1全新发布,此版本对功能区、状态栏

混合模式属性background-blend-mode

background-blend-mode 是 CSS 中的一个属性,它允许你将背景图像与背景颜色或背景图像之间以一种特定的混合模式进行混合。这个属性为网页设计师提供了一种强大的方式来创建视觉上吸引人的背景效果,无需使用图像编辑软件或额外的图像文件。 background-blend-mode 可以应用于单个背景图像与背景颜色之间,或者当设置多个背景图像时,应用于这些图像之间。混合模式包括了许多

C++11中新引入的enum类型

一、引言         在C++11中,引入了一个新的枚举类型——enum class(或称为作用域枚举类型),它相较于传统的enum类型有几个关键的不同点。enum class提供了更强的类型检查和封装,减少了命名冲突的可能性,并允许更加清晰地表达枚举的意图。 二、传统枚举(enum)的缺点         在C++11之前,枚举(enum)类型是隐式转换为整型的,这可能会导致一些意料之

旅行商问题 | Matlab基于混合粒子群算法GA-PSO的旅行商问题TSP

目录 效果一览基本介绍建模步骤程序设计参考资料 效果一览 基本介绍 混合粒子群算法GA-PSO是一种结合了遗传算法(Genetic Algorithm, GA)和粒子群优化算法(Particle Swarm Optimization, PSO)的优化算法。在解决旅行商问题(Traveling Salesman Problem, TSP)时,这种混合算法可以结合两种算法的优点