【H.264/AVC视频编解码技术详解】十九、熵编码(5):CABAC语法元素的二值化

本文主要是介绍【H.264/AVC视频编解码技术详解】十九、熵编码(5):CABAC语法元素的二值化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《H.264/AVC视频编解码技术详解》视频教程已经在“CSDN学院”上线,视频中详述了H.264的背景、标准协议和实现,并通过一个实战工程的形式对H.264的标准进行解析和实现,欢迎观看!

“纸上得来终觉浅,绝知此事要躬行”,只有自己按照标准文档以代码的形式操作一遍,才能对视频压缩编码标准的思想和方法有足够深刻的理解和体会!

链接地址:H.264/AVC视频编解码技术详解

GitHub代码地址:点击这里


一、上下文自适应的二进制算术编码

在上篇博文【H.264/AVC视频编解码技术详解】十八:算术编码的基本原理与实现中研究了算术编码的基本概念,然而在实际的H.264编解码的方法中,显然是不可能采用上文中简单的算法来实现。在实际应用中,H.264采用的为称作上下文自适应的二进制算术编码(Context-based Adaptive Binary Arithmetic Coding, CABAC)。CABAC算法是H.264中新引入的一种非常复杂的熵编码算法,专门用于视频的压缩编码。事实证明,在视频压缩编码领域,CABAC保持了强大的生命力,在H.264更新的标准H.265中继续保留了CABAC算法,并且废弃了CAVLC而将CABAC作为主要的熵编码方法。

在CABAC中,主要步骤或算法可以分为3个步骤/类别:

  1. 语法元素的二值化;
  2. 上下文模型;
  3. 算术编码;

在本章节中主要讨论语法元素二值化过程,上下文模型和算术编码在后续章节详述。

二、二值化方法

我们知道,预测编码、变换编码等步骤输出的信息多种多样,不会仅仅出现二进制数据,例如宏块类型mb_type或预测模式pred_mode等信息具有比较广泛的取值范围。在输入算术编码器之前,需要对这些语法元素进行二值化操作。在H.264的标准文档中,二值化的方法定义在9.3.2节。

语法元素二值化的输入数据为一个语法元素的值,例如型mb_type等。而输出的信息为语法元素的二值化数据流,以及maxBinIdxCtx、ctxIdxOffset和bypassFlag等信息。在协议文档中定义的二值化方法有:

  • 一元二值化(Unary Binarization);
  • 截断一元二值化(Truncated Unary Binarization);
  • k阶指数哥伦布编码;
  • 定长编码;
  • 其他方法;

2.1 一元二值化(Unary Binarization)

一元二值化方法是一种非常简单的方法。二值化之后的码流长度等于语法元素的值val,且除了最后一位为0外,前面的val-1位均为1。对应关系为:
在这里插入图片描述

2.2 截断一元二值化(Truncated Unary Binarization)

采用截断一元二值化方法时,输入数据除了语法元素的值之外,还需要传入一个值cMax,表示语法元素的上限值。使用截断一元二值化时,如果语法元素的值小于cMax,则采用2.1所述的一元二值化方法;如果语法元素的值等于cMax,则二值化的输出码流为cMax个bit-1。

2.3 k阶指数哥伦布编码

指数哥伦布编码在前面的博文中已有详述,详情可见:

  • 【H.264/AVC视频编解码技术详解】八、 熵编码算法(2):H.264中的熵编码基本方法、指数哥伦布编码】

2.4 定长编码

定长编码的输入数据包括语法元素的值和cMax,,表示语法元素的上限值。定长编码的码字长度以cMax的长度为准,并按二进制排列每一个语法元素值作为编码的对应。

三、语法元素的二值化

3.1 语法元素相关的特定二值化方法

在标准协议文档的9.2.3.5描述了宏块类型mb_type和子宏块类型sub_mb_type的二值化。这两种类型的二值化方法不是由某个算法推导,而是由表格指定。表9-36到9-38描述了此类语法元素的值与二进制数据的关系。

3.2 Coded Block Pattern的二值化

对于CBP数据,其二值化码流由前缀和后缀组成。前缀表示亮度cbp,即CodedBlockPatternLuma,由cMax为15的定长编码实现;若ChromaArrayType不等于0或3,则后缀表示色度cbp即CodedBlockPatternChroma,由cMax为2的截断一元编码表示。

3.3 mb_qp_delta的二值化

mb_qp_delta的二值化过程需要首先解决一个其取值有正有负的过程,因此首先采用了标准文档中表9-3中的正负值映射方法将mb_qp_delta全部转换为非负值,而后采用一元编码方法进行二值化。

这篇关于【H.264/AVC视频编解码技术详解】十九、熵编码(5):CABAC语法元素的二值化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/415378

相关文章

SpringBoot3实现Gzip压缩优化的技术指南

《SpringBoot3实现Gzip压缩优化的技术指南》随着Web应用的用户量和数据量增加,网络带宽和页面加载速度逐渐成为瓶颈,为了减少数据传输量,提高用户体验,我们可以使用Gzip压缩HTTP响应,... 目录1、简述2、配置2.1 添加依赖2.2 配置 Gzip 压缩3、服务端应用4、前端应用4.1 N

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

详解C#如何提取PDF文档中的图片

《详解C#如何提取PDF文档中的图片》提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使用,下面我们就来看看如何使用C#通过代码从PDF文档中提取图片吧... 当 PDF 文件中包含有价值的图片,如艺术画作、设计素材、报告图表等,提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使

Android中Dialog的使用详解

《Android中Dialog的使用详解》Dialog(对话框)是Android中常用的UI组件,用于临时显示重要信息或获取用户输入,本文给大家介绍Android中Dialog的使用,感兴趣的朋友一起... 目录android中Dialog的使用详解1. 基本Dialog类型1.1 AlertDialog(

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

C#数据结构之字符串(string)详解

《C#数据结构之字符串(string)详解》:本文主要介绍C#数据结构之字符串(string),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录转义字符序列字符串的创建字符串的声明null字符串与空字符串重复单字符字符串的构造字符串的属性和常用方法属性常用方法总结摘

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

Java中StopWatch的使用示例详解

《Java中StopWatch的使用示例详解》stopWatch是org.springframework.util包下的一个工具类,使用它可直观的输出代码执行耗时,以及执行时间百分比,这篇文章主要介绍... 目录stopWatch 是org.springframework.util 包下的一个工具类,使用它

Java进行文件格式校验的方案详解

《Java进行文件格式校验的方案详解》这篇文章主要为大家详细介绍了Java中进行文件格式校验的相关方案,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、背景异常现象原因排查用户的无心之过二、解决方案Magandroidic Number判断主流检测库对比Tika的使用区分zip