H.264 视频编码器变换编码分析

本文主要是介绍H.264 视频编码器变换编码分析，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

H.264 视频编码器变换编码分析

一. 变换编码分为两部分：变换，量化，以及在之后的重建环路中对应的反量化和反变换。

接下来对各部分进行分析

二. 变换

根据残差数据的类型不同，H264 High Profile中会使用到4种不同的变换：

采用 Intra4x4 预测模式和 Intra16x16 预测模式得到的亮度分量预测残差，使用4x4离散余弦变换（DCT）；
采用 Intra8x8 预测模式得到的亮度分量预测残差使用8x8离散余弦变换（DCT）；
采用 Inter 预测模式得到的亮度分量预测残差，如果预测模式块大小，小于等于8x8，则使用4x4离散余弦变换，否则编码器要在4x4和8x8离散余弦变换之间进行选择。
色度分量的预测残差全部使用4x4离散余弦变换。
其中，4x4哈达玛变换用于 Intra16x16 预测残差直流分量的二次变换；2x2哈达玛变换用于色度分量直流系数的二次变换

三. 原始数学原理：DCT变换原理

DCT变换是一种正交变换，因为具有良好的去相关性和压缩效果，并且有快速算法可以实现，因此在图像编码中被广泛使用。

但是由于变换矩阵C的变换系数中存在无理数，在编解码的计算过程中计算结果会带来误差，反变换和变换之前的结果会不一样带来误差。

在H. 264编码标准中，进行了整数变换的操作，并且可以不使用乘法操作，其中的一部分变换计算合并到量化过程中去。

四. H.264中的整数余弦变换

整数余弦变换的对象：

4x4子宏块的亮度分量
4x4子宏块的色度分量

1.变换

也就是说，4x4的残差亮度书看剧和2x2的残差色度数据需要进行二维变换，使得高频分量大多数为零，从而达到和DCT变换相似的数据压缩效果。
在这里插入图片描述
其中，Ef 矩阵中a=1/2，b=√（2/5）.
这里的圈乘运算符表示对同一位置的两个矩阵元素做一次的乘法操作。这一部分运算被合并到量化和反量化中，确保了整数余弦变换和DCT变换有相似的压缩效果。因此在编码器的标准中，变换过程只包括括号内的操作：
在这里插入图片描述

2.反变换

在H.264标准中，反变换矩阵Cinv 并不是变换矩阵Cf的逆矩阵，而是进一步做了整数化处理。因此需要其他运算来保证反变换的正确性。在H264标准中这部分也同样被合并到量化，反量化的过程中完成，这样保证在反变换的过程中同样只使用加法和移位操作。

反变换矩阵Cinv如下：
在这里插入图片描述

3. 分层的二维整数余弦变换：直流分量增加hardmard变换

首先，对于4x4子宏块的残差做二维整数余弦变换
其次，对8x8色度块的直流分量和帧内预测的16x16宏块中的16个子宏块的直流分量进行hardmard变换。如下图所示：
在这里插入图片描述
这时由于在8x8的色度块和帧内预测模式的16x16亮度快中，每个子宏块的直流分量之间还有很强的相关性。对于这些子宏块的支流分量还要进行Hardmard变换来提高数据的压缩效率。