【H.264/AVC视频编解码技术详解】十八:算术编码的基本原理与实现

本文主要是介绍【H.264/AVC视频编解码技术详解】十八:算术编码的基本原理与实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《H.264/AVC视频编解码技术详解》视频教程已经在“CSDN学院”上线,视频中详述了H.264的背景、标准协议和实现,并通过一个实战工程的形式对H.264的标准进行解析和实现,欢迎观看!

“纸上得来终觉浅,绝知此事要躬行”,只有自己按照标准文档以代码的形式操作一遍,才能对视频压缩编码标准的思想和方法有足够深刻的理解和体会!

链接地址:H.264/AVC视频编解码技术详解

GitHub代码地址:点击这里

一、H.264的算术编码

在前述的几章节的博文/视频中,我们已经了解到熵编码是利用信息的统计冗余进行数据压缩的无损编码方法,并且已经讨论过了熵编码的基本原理、H.264中使用的语法元素解析算法“指数哥伦布编码”的算法与实践:

  • 【H.264/AVC视频编解码技术详解】七、 熵编码算法(1):基础知识
  • 【H.264/AVC视频编解码技术详解】八、 熵编码算法(2):H.264中的熵编码基本方法、指数哥伦布编码

并且在后续的内容中,讨论了在H.264中非常重要的一种熵编码方法,即上下文自适应的变长编码(CAVLC):

  • 【H.264/AVC视频编解码技术详解】十三、熵编码算法(3):CAVLC原理
  • 【H.264/AVC视频编解码技术详解】十三、熵编码算法(4):H.264使用CAVLC解析宏块的残差数据

以上的内容在H.264的baseline profile中具有广泛应用。然而在实际应用场景中更为流行的通常是main profile,在main profile中为了进一步提升压缩比率,采用的熵编码方法不是CAVLC,而是压缩效率更高的CABAC。

CABAC的全称为上下文自适应的二进制算术编码(Context-Adaptive Binary Arithmetic Coding, CABAC),是一种经过特殊设计的算术编码,其具体步骤主要有:

  1. 设定编码上下文;
  2. 语法元素的二值化;
  3. 算术编码;

二、算术编码的基本概念

算术编码属于熵编码的一种重要的类型,其作用同变长编码等熵编码方法类似,用于压缩输入数据中的统计冗余,并且使用算术编码的压缩同样是无损压缩。

在本系列第1篇中讨论了典型的变长编码方法——哈夫曼编码。包括哈夫曼编码在内的变长编码具有一个共同特点,就是针对每一个码元不同的概率,分配每个码元对应的码字。通常针对概率更高的码元,分配长度更短的码字;针对概率较低的码元,分配长度较长的码字。通过这种不同长度码字的分配使得整体输入信息的平均码字长度小于定长编码,达到数据压缩的效果。

另一方面,由于采用这种变长度的编码方法,变长编码存在一项难以突破的性能瓶颈:即使是某一个输入信源的概率再高,也至少需要1个bit的码字。这种特性限制了编码性能进一步向信源熵逼近,也导致了无法进一步提升整体的压缩性能。

算术编码的引入可以有效解决这个问题。算术编码的思想同变长编码完全不同,算术编码无法针对每一个输入码元准确细分出对应的码字。另外,变长编码可以针对短输入信息进行编码,而算术编码对类似一两个码元的输入信息通常没有任何意义,因为生成的码流长度通常更长。

在算术编码执行的过程中,始终需要两个区间来计算,这两个区间即信源的概率区间和码流的编码区间。

三、概率区间与编码区间

信源的概率区间用于表示输入信源的码元之间的概率关系。假设输入的信源为二进制信源,只存在0和1两个元素,那么元素0和1的概率之和为100%。如果0和1的概率比为7:3,那么概率区间可以用下图表示:

在这里插入图片描述

与概率区间按照码元的概率分割不同,编码区间为了标记输出码流,将自身区间递归二等分,分割点的左右分别表示一个码元0和1。每一次分割都增加一个bit输出。编码区间可以用下图表示:
在这里插入图片描述

四、一个简单的算术编码执行过程

在一次算术编码的执行前,为简便起见,首先假设输入的信源为0/1的二进制信源,0和1的概率比为7:3。即二者的概率为:

p(0) = 0.7;
p(1) = 0.3;

假设输入的待编码信息为[0, 0, 1],在编码每一个符号时,都需要对概率区间进行分割,并通过与编码区间进行比较,判断是否输出码流的bit位,以及更新编码下一个符号的上下文。

在第一次进行分割之后,概率区间和编码区间的关系如下图所示:
在这里插入图片描述

第一个字符的概率区间分割之后,不满足输出码流的条件,因此结束这个字符的编码,准备开始编码下一个字符。

第二个字符依然为0,此时概率区间和编码区间的关系为:
在这里插入图片描述

此时概率区间已经完全处于编码区间的下半区,因此应输出一个bit-0。而后,编码区间的下半区间扩展2倍到原有的完整编码区间继续进行下一个编码。该过程由下图所示:
在这里插入图片描述

我们设定的最后一个待编码符号为1,因此最后一次分割概率区间,选取上30%作为结果。此时的概率区间分割结果如下图所示:
在这里插入图片描述

由图中可看出,概率区间已经完全处于编码区间的上半区,因此需要输出一个bit-1,并循环进行如下操作,直到概率区间长度大于编码区间总长的一半:

  1. 检测概率区间的长度和位置;
  2. 根据概率区间特性,输出0或1,或记录待输出位;
  3. 概率区间随编码区间归一化。

当循环结束后,对每一个码元编码的区间分割过程结束。

对码元的区间分割结束后,整个编码过程并未完全结束,还需要一个重要的收尾过程,即处理最终的概率区间。最终的概率区间的处理方法为:

  1. 检查最终概率区间下限的位置;
  2. 若该下限位置小于整体编码区间的1/4分割点,输出bit-0,否则输出bit-1。

还需要注意的是,我们的算术编码引擎中包含了一个待输出编码位,表示此时应有一个输出bit但由于概率区间位置跨越了编码区间的中点而没有输出,需要留待以后输出。因此无论在分割中或者收尾时输出某个bit时,应同时输出数目为待输出编码位个的相反bit。

例如,当前待输出编码位为3个,某时刻应输出1,则此时应输出1000;又例如,待输出编码位为2,某时刻应输出0,则此时应输出011。

对于程序实现,请到Github代码库下载查看;CSDN学院中的视频更可以详细解释每一步的细节,以及多个案例的运行,并通过程序运行与图示解释来揭秘算术编码的本质含义,欢迎参加。

这篇关于【H.264/AVC视频编解码技术详解】十八:算术编码的基本原理与实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/415377

相关文章

C#借助Spire.XLS for .NET实现在Excel中添加文档属性

《C#借助Spire.XLSfor.NET实现在Excel中添加文档属性》在日常的数据处理和项目管理中,Excel文档扮演着举足轻重的角色,本文将深入探讨如何在C#中借助强大的第三方库Spire.... 目录为什么需要程序化添加Excel文档属性使用Spire.XLS for .NET库实现文档属性管理Sp

C++ move 的作用详解及陷阱最佳实践

《C++move的作用详解及陷阱最佳实践》文章详细介绍了C++中的`std::move`函数的作用,包括为什么需要它、它的本质、典型使用场景、以及一些常见陷阱和最佳实践,感兴趣的朋友跟随小编一起看... 目录C++ move 的作用详解一、一句话总结二、为什么需要 move?C++98/03 的痛点⚡C++

Python+FFmpeg实现视频自动化处理的完整指南

《Python+FFmpeg实现视频自动化处理的完整指南》本文总结了一套在Python中使用subprocess.run调用FFmpeg进行视频自动化处理的解决方案,涵盖了跨平台硬件加速、中间素材处理... 目录一、 跨平台硬件加速:统一接口设计1. 核心映射逻辑2. python 实现代码二、 中间素材处

MySQL中between and的基本用法、范围查询示例详解

《MySQL中betweenand的基本用法、范围查询示例详解》BETWEENAND操作符在MySQL中用于选择在两个值之间的数据,包括边界值,它支持数值和日期类型,示例展示了如何使用BETWEEN... 目录一、between and语法二、使用示例2.1、betwphpeen and数值查询2.2、be

python中的flask_sqlalchemy的使用及示例详解

《python中的flask_sqlalchemy的使用及示例详解》文章主要介绍了在使用SQLAlchemy创建模型实例时,通过元类动态创建实例的方式,并说明了如何在实例化时执行__init__方法,... 目录@orm.reconstructorSQLAlchemy的回滚关联其他模型数据库基本操作将数据添

Java数组动态扩容的实现示例

《Java数组动态扩容的实现示例》本文主要介绍了Java数组动态扩容的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1 问题2 方法3 结语1 问题实现动态的给数组添加元素效果,实现对数组扩容,原始数组使用静态分配

Java中ArrayList与顺序表示例详解

《Java中ArrayList与顺序表示例详解》顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构,:本文主要介绍Java中ArrayList与... 目录前言一、Java集合框架核心接口与分类ArrayList二、顺序表数据结构中的顺序表三、常用代码手动

Python实现快速扫描目标主机的开放端口和服务

《Python实现快速扫描目标主机的开放端口和服务》这篇文章主要为大家详细介绍了如何使用Python编写一个功能强大的端口扫描器脚本,实现快速扫描目标主机的开放端口和服务,感兴趣的小伙伴可以了解下... 目录功能介绍场景应用1. 网络安全审计2. 系统管理维护3. 网络故障排查4. 合规性检查报错处理1.

JAVA线程的周期及调度机制详解

《JAVA线程的周期及调度机制详解》Java线程的生命周期包括NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING和TERMINATED,线程调度依赖操作系统,采用抢占... 目录Java线程的生命周期线程状态转换示例代码JAVA线程调度机制优先级设置示例注意事项JAVA线程

Python轻松实现Word到Markdown的转换

《Python轻松实现Word到Markdown的转换》在文档管理、内容发布等场景中,将Word转换为Markdown格式是常见需求,本文将介绍如何使用FreeSpire.DocforPython实现... 目录一、工具简介二、核心转换实现1. 基础单文件转换2. 批量转换Word文件三、工具特性分析优点局