H264编码原理（二）帧内预测

本文主要是介绍H264编码原理（二）帧内预测，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

假设你去了一家餐厅吃饭，这家餐厅提供了一个有趣的点餐方式。服务员会根据餐厅最近最受欢迎的菜品组合，推荐九个套餐给你。你的任务是从这九个套餐中找到一个最接近你心中想要的菜品组合的套餐，然后告诉服务员你想替换哪些菜，以得到你理想中的一餐。

通过这种点餐方式，你可以迅速找到与你所想菜品最接近的套餐，只需做少量的调整就能得到满意的组合。

类似地，在H.264编码中，编码器选择一个最合适的预测模式，通过少量的调整（即编码误差）得到最终的编码块，从而实现高效的压缩。

宏块（MacroBlock）

宏块，英文Macroblock，是视频编码技术中的一个基本概念。通过将画面分成一个个大小不同的块来来不同位置实行不同的压缩策略。
在视频编码中，一个编码图像通常划分成若干宏块组成，一个宏块由一个亮度像素块和附加的两个色度像素块组成。一般来说，亮度块为16x16大小的像素块，而两个色度图像像素块的大小依据其图像的采样格式而定，如：对于YUV420采样图像，色度块为8x8大小的像素块。

根据画面的复杂情况，宏块还可以被划分为若干子宏块。比如16X16还可以划分为16个4X4的宏块
每个图像中，若干宏块被排列成片（slice）的形式，视频编码算法以宏块为单位，逐个宏块进行编码，组织成连续的视频码流。

帧内预测

如果一个块或宏块在帧内模式下编码，那么预测块P是基于之前编码并重建（但未滤波）的块形成的。

最终编码的内容是预测块P和当前块的残差值。

所以本文主要内容是如何产生预测块P。

对于亮度（luma）样本，P 可以为每个4x4子块或16x16宏块形成。对于每个4x4亮度块，总共有9种可选预测模式；对于16x16亮度块，有4种可选模式；色度块也有4 种预测模式，类似于16×16 亮度块预测模式。

4x4亮度预测模式

对于4*4的亮度预测模式
请添加图片描述
左图中A～Q是预测时可能依赖的数据，a～p是需要预测的数据区域。
右图形象的表示了8种预测模式（0～8）不包括2，2是DC模式，参考了所有方向的像素。

下图是对9种预测模式的细化
请添加图片描述

模式编号	模式名称	基本计算说明
0	垂直预测 (Vertical)	来自上方相邻块的像素值。
1	水平预测 (Horizontal)	来自左方相邻块的像素值。
2	DC预测 (DC)	上方和左方相邻像素值的平均值。
3	斜下预测 (Diagonal Down-Left)	根据斜下方向相邻块的像素值。
4	斜上预测 (Diagonal Down-Right)	根据斜上方向相邻块的像素值。
5	垂直左预测 (Vertical-Left)	根据略微偏左的垂直相邻块的像素值。
6	垂直右预测 (Vertical-Right)	根据略微偏右的垂直相邻块的像素值。
7	水平上预测 (Horizontal-Up)	根据略微偏上的水平相邻块的像素值。
8	水平下预测 (Horizontal-Down)	根据略微偏下的水平相邻块的像素值。

如果需要参考的数据没有怎么办？比如本身在最左边的数据还如何参考左边的？对于这些情况H264协议中都有解决方案，感兴趣可以参考协议文档中的参考实现或者X264的源码。

下面是一个例子，直观展示了9种预测方式产生的预测块是怎样的，同时还给出了The Sum of Absolute Errors (SAE)，SAE表示和原图的差异，SAE越大，和原图的差异越大，我们选择SAE最小的一种模式，作为预测模式。
请添加图片描述

16X16亮度预测模式

和4X4的预测模式类似，16X16只有4种预测模式，
请添加图片描述

模式编号	模式名称	计算说明
0	垂直预测 (Vertical)	从块上方的样本进行外推预测。
1	水平预测 (Horizontal)	从块左方的样本进行外推预测。
2	DC预测 (DC)	使用左方和上方块的像素值均值进行预测。
3	平面预测 (Plane)	通过对左方和上方块的样本进行线性拟合，生成一个平滑的平面函数用于预测，适用于亮度平滑变化的区域。