本文主要是介绍X264编码器参数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
摘要:x264是开源的AVC/H264编码器的实现版本,了解其参数能够更加充分的理解对应视频编码在工业应用。本文根据网络上的资料收集和整理了大部分H264编码器的参数和其作用。
关键字:x264
1. x264简介
H.264是ITU(International Telecommunication Unite 国际通信联盟)和MPEG(Motion Picture Experts Group 运动图像专家组)联合制定的视频编码标准。从1999年开始,到2003年形成草案,最后在2007年定稿有待核实。在ITU的标准里称为H.264,在MPEG的标准里是MPEG-4的一个组成部分–MPEG-4 Part 10,又叫Advanced Video Codec,因此常常称为MPEG-4 AVC或直接叫AVC。
H.264编码能实现非常好的压缩比,有广泛的适用码率(适于从超低码率低延迟的电话会议到高码率的BluRay光盘和HDTV码流),良好的硬件支持(以PSP、iPod和显卡DXVA为代表)和众多强大的厂商作后盾。
x264始于2003年,从当开源社区的MPEG4-ASP编码器Xvid小有所成时开始的,经过几年的开发,特别是Dark Shikari加入开发后,x264逐渐成为了最好的视频编码器。
源代码参考X264源代码
2 X264参数
通常安装的x264是一个可执行文件,该可执行文件可以通过命令参数来执行具体的编码。下面简单描述每个参数的具体作用。
2.1 预设参数
- –profile:设置H264视频的配置,设置成功会覆盖所有的参数设置。可选参数有:
- baseline:无损,非隔行扫描,–no-8x8dct --bframes 0 --no-cabac --cqm flat --weightp 0;
- main:–no-8x8dct --cqm flat,无损;
- high:无损;
- high10:支持8-10bit,无损;
- high422:支持8-10bit,YUV420和YUV422;
- high444:支持8-10bit,YUV420、YUV422和YUV444。
- –present:压缩效率和运算时间中平衡的预设值。如果指定了一个预设值,它会在其它选项生效前生效。可选的值有:ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow和placebo。
- –tune:上一个选项基础上进一步优化输入。如果定义了一个tune值,它将在preset之后,其它选项之前生效。可选:film、animation、grain、stillimage、psnr、ssim、fastdecode、zerolatency和touhou。
- –slow-firstpass:使用–pass 1会在解析命令行时增加一些设置。如果设置preset=placebo则自动关闭此特性。如果想显式关闭此特性,使用slow-firstpass。
2.2 帧类型选项
- -I, --keyint:设置GOPSize,默认值为250;
IDR帧是视频流的“分隔符”,所有帧都不可以使用越过关键帧的帧作为参考帧。IDR帧是I帧的一种,所以它们也不参照其它帧。这意味着它们可以作为视频的搜索(seek)点。通过这个设置可以设置IDR帧的最大间隔帧数(亦称最大图像组长度)。较大的值将导致IDR帧减少(会用占用空间更少的P帧和B帧取代),也就同时减弱了参照帧选择的限制。较小的值导致减少搜索一个随机帧所需的平均时间。
- -i, --min-keyint:最小的GPOSize,默认为auto
- no-scenecut:完全关闭自适应I帧决策;
- scenecut:设置决策使用I帧、IDR帧的阈值(场景变换检测);
x264会计算每一帧与前一帧的不同程度并得出一个值。如果这个值低于scenecut,那么就算检测到一个“场景变换”。如果此时距离上一帧的距离小于 min-keyint则插入一个I帧,反之则插入一个IDR帧。较高的值会增加侦测到“场景变换”概率。
- intra-refresh:让x264为每keyint数量的帧使用宏块内部编码取代IDR帧;
块以水平移动列的方式更新,也叫刷新波。对于低延迟的流,这样可以让帧的尺寸比使用标准的IDR帧更加保持恒定。而且这样可以增强视频流对丢包的容错能力。这个选项会降低压缩率,所以在确实需要的时候才选择它。
- -b, --bframes:设置x264可使用的B帧的最大连续数量,默认3;
-
–b-adapt:设置B帧决策算法,这个选项会影响到x264使用P帧或者B帧;
- 0:关闭。总是使用B帧。和以前的 no-b-adapt选项效果相同;
- 1:‘快速’算法。快速,–b-frames越大速度越快;
- 2:‘最佳’算法,慢速,–b-frames越大速度越慢;
-
–b-bias:调节使用B帧的力度。越大的值越偏向B帧,可以在-100和100之间选择。100或-100不能保证完全或是全是B帧(使用 –b-adapt 0);
-
–b-pyramid:允许B帧作为参照帧。如果关闭,那么只有I帧和P帧才能作为参照帧。可以作为参照帧的B帧的量化参数会介于P帧和普通B帧之间。只在–b-frames设置大于等于2时此选项才生效。如果是在为蓝光光盘编码,请使用none或者strict。
- none:不允许B帧作为参照帧;
- strict:一个图像组内只允许一个B帧参照帧,这是蓝光编码强制要求的标准;
- normal:任意使用B帧参照帧;
-
–open-gop:Open-GOP是一个提升压缩效率的编码技术,有些解码器不能完全支持open-GOP流,因此这个选项默认关闭;
- none:关闭
- normal:开启
- bluray:开启。一个稍低效的open-GOP版本,因为normal模式不能用于蓝光编码。
open and closed gops all you need to know
-
–no-cabac:关闭CABAC (Context Adaptive Binary Arithmetic Coder)压缩,使用较为低效的CAVLC (Context Adaptive Variable Length Coder)。这两者在压缩效率和解码效率上有10%-20%的差别;
-
- -r --ref:控制DPB (Decoded Picture Buffer)的大小。可以在0-16之间选择。简单地说,就是设置P帧可以选择它之前的多少帧作为参照帧(B帧的值要小1-2,取决于那个B帧能不能作为参照)。最小可以选择值1,只参照自己前面的那帧。注意H.264标准限制了每个level可以参照的帧的数量。如果选择level4.1,1080p最大选4,720p最大选9;
- no-deblock:完全关闭内置去块滤波器;
- -f --deblock:调节H.264标准中的内置去块滤波器。这是个性价比很高的选择;
- –slices:设置每帧的分片数,强制使用矩形分片;
- –slice-max-size:设置每个分块包括NAL头的最大大小(bytes);
- –slice-max-mbs:设置每个分块包含的最大宏块数量;
- –slice-min-mbs:设置每个分块包含的最小宏块数量;
- –tff:开启隔行编码并设置上半场在前。x264的隔行编码使用MBAFF,因此效率不如逐行扫描。所以,仅在需要在隔行显示的设备上显示时才开启这个选项;
- –bff:开启隔行编码并设置下半场在前;
- –constrained-intra:开启SVC编码的底层要求的强制帧内预测;
- –pulldown:为你的输入流(逐行扫描的,固定帧率的)使用一组预设的“soft pulldown”;可选的参数有:none、22、32、64、double、triple、euro;
- –fake-interlaced:把流标志为隔行的但不按隔行编码。用于编码25p和30p的蓝光兼容视频;
- –frame-packing:对于立体视频,定义帧排列方式:
- 0:棋盘格 - 像素交替来自左眼和右眼
- 1:列交替 - 左眼和右眼通过列交替交织
- 2:行交替 - 左眼和右眼通过行交替交织
- 3:左右并排 - 左眼在左侧,右眼在右侧
- 4:上下并排 - 左眼在上方,右眼在下方
- 5:帧交替 - 每帧显示一个视图
- 6:单眼 - 2D帧,没有任何帧包装
- 7:平铺格式 - 左眼在左上方,右眼分割在其余区域
2.3 码率控制
- -q, --qp:强制使用恒定的QP值(0-81,0=无损);
- -B, --bitrate:设置比特率(kbit/s);
- –crf:基于质量的可变比特率(-12-51)[23.0];
- –rc-lookahead:预测帧类型的帧数 [40];
- –vbv-maxrate:最大本地比特率(kbit/s)[0];
- –vbv-bufsize:设置VBV缓冲区大小(kbit)[0];
- –vbv-init:初始VBV缓冲区占用率 [0.9];
- –crf-max:使用CRF+VBV时,限制RF到此值可能导致VBV下溢!;
- –qpmin:设置最小QP值 [0];
- –qpmax:设置最大QP值 [81];
- –qpstep:设置最大QP步长 [4];
- –ratetol:ABR速率控制和VBV的容差 [1.0];
- –ipratio:I和P之间的QP因子 [1.40];
- –pbratio:P和B之间的QP因子 [1.30];
- –chroma-qp-offset:色度与亮度之间的QP差异 [0];
- –aq-mode:AQ方法 [1];
- 0: 禁用;
- 1: 方差AQ(复杂度掩码);
- 2: 自动方差AQ;
- 3: 自动方差AQ,并偏向于暗场景;
- –aq-strength:减少平坦和纹理区域中的块和模糊 [1.0];
- -p, --pass:启用多通道速率控制;
- 1: 第一遍,创建统计文件;
- 2: 最后一遍,不覆盖统计文件;
- 3: 第N遍,覆盖统计文件;
- –stats:用于两遍统计的文件名 [“x264_2pass.log”];
- –no-mbtree:禁用mb-tree速率控制;
- –qcomp:QP曲线压缩 [0.60];
- –cplxblur:减少QP的波动(曲线压缩之前) [20.0];
- –qblur:减少QP的波动(曲线压缩之后) [0.5];
- –zones:调整视频区域的比特率;每个区域的格式为<起始帧数>,<结束帧数>,<选项>,其中<选项>可以是q=<整数>(强制QP)或 b=<浮点数>(比特率倍增器);
- –qpfile:强制一些或所有帧的帧类型和QP值;每行的格式:帧号 帧类型 QPQP是可选的(none表示由x264选择)。帧类型:I,i,K,P,B,b。K=<I或i>取决于open-gop设置QP受qpmin/qpmax的限制。
2.4 分析
- -A,–partitions:要考虑的分区。可选值为[“p8x8, b8x8, i8x8, i4x4”],表示考虑的分区类型,包括p8x8、p4x4、b8x8、i8x8、i4x4、none和all。
- –direct:直接运动矢量(MV)预测模式。可选值为[“spatial”],表示直接MV预测模式,包括none、spatial、temporal和auto。
- –no-weightb:禁用B帧的加权预测。
- –weightp:P帧的加权预测。可选值为[2],表示加权预测的类型,包括0(禁用)、1(加权参考帧)和2(加权参考帧+复制帧)。
- –me:整数像素运动估计方法。可选值为[“hex”],表示整数像素运动估计方法,包括dia(钻石搜索,半径1,快速)、hex(六边形搜索,半径2)、umh(不均匀多六边形搜索)、esa(穷举搜索)和tesa(哈达玛穷举搜索,慢)。
- –merange:最大运动矢量搜索范围,默认值为16。
- –mvrange:最大运动矢量长度,默认值为-1(自动)。
- –mvrange-thread:线程之间的最小缓冲区,默认值为-1(自动)。
- -m, --subme:亚像素运动估计和模式决策。可选值为[7],表示亚像素运动估计和模式决策的级别,包括0(仅全像素,不推荐使用)、1(SAD模式决策,一次qpel迭代)、2(SATD模式决策)等。
- –psy-rd:心理视觉优化的强度,默认值为"1.0:0.0"。其中,#1表示RD(需要subme>=6),#2表示Trellis(需要trellis,实验性)。
- –no-psy:禁用所有恶化PSNR和SSIM的视觉优化。
- –no-mixed-refs:不基于每个分区来决定引用帧。
- –no-chroma-me:忽略运动估计中的色度。
- –no-8x8dct:禁用自适应空间变换大小。
- -t, --trellis:Trellis RD量化,默认值为1。可选值为0(禁用)、1(仅在MB的最终编码中启用)、2(在所有模式决策中启用)。
- –no-fast-pskip:在P帧上禁用早期SKIP检测。
- –no-dct-decimate:在P帧上禁用系数阈值。
- –nr:降噪,默认值为0。
- –deadzone-inter:设置互帧亮度量化deadzone的大小,默认值为21。
- –deadzone-intra:设置帧内亮度量化deadzone的大小,默认值为11。deadzone的大小应在0到32之间。
- –cqm:预设量化矩阵。可选值为[“flat”],表示预设的量化矩阵类型,包括flat和jvt。
- –cqmfile:从与JM兼容的文件中读取自定义的量化矩阵。会覆盖其他–cqm*选项。
- –cqm4:设置所有的4x4量化矩阵。需要提供一个由16个整数组成的逗号分隔列表。
- –cqm8:设置所有的8x8量化矩阵。需要提供一个由64个整数组成的逗号分隔列表。
- –cqm4i, --cqm4p, --cqm8i, --cqm8p:同时设置亮度和色度的量化矩阵。
- –cqm4iy, --cqm4ic, --cqm4py, --cqm4pc:设置单独的亮度和色度量化矩阵。
2.5 设置视频可用性信息
VUI设置不被编码器使用,只是对播放设备的建议。
- –overscan:指定裁剪超扫描设置。可选值为[“undef”],表示裁剪超扫描的设置,包括undef、show和crop。
- –videoformat:指定视频格式。可选值为[“undef”],表示视频格式,包括component、pal、ntsc、secam、mac和undef。
- –range:指定颜色范围。可选值为[“auto”],表示颜色范围,包括auto、tv和pc。
- –colorprim:指定颜色原色。可选值为[“undef”],表示颜色原色,包括undef、bt709、bt470m、bt470bg、smpte170m、smpte240m、film、bt2020、smpte428、smpte431和smpte432。
- –transfer:指定传输特性。可选值为[“undef”],表示传输特性,包括undef、bt709、bt470m、bt470bg、smpte170m、smpte240m、linear、log100、log316、iec61966-2-4、bt1361e、iec61966-2-1、bt2020-10、bt2020-12、smpte2084、smpte428和arib-std-b67。
- –colormatrix:指定颜色矩阵设置。可选值为[“???”],表示颜色矩阵设置,包括undef、bt709、fcc、bt470bg、smpte170m、smpte240m、GBR、YCgCo、bt2020nc、bt2020c、smpte2085、chroma-derived-nc、chroma-derived-c和ICtCp。
- –chromaloc:指定色度采样位置(0到5)。默认值为0。
- **–mastering-display :指定主显示器的亮度、白点和显示亮度。格式为’G(x,y)B(x,y)R(x,y)WP(x,y)L(max,min)'。
- –cll:指定内容光亮度的最大值和最大帧平均值。格式为’max_content,max_frame_average’。
- –alternative-transfer:指定备用传输特性。可选值与–transfer相同。
- –nal-hrd:信号HRD信息(需要vbv-bufsize)。可选值为none、vbr、cbr(.mp4中不允许使用cbr)。
- –filler:强制使用硬CBR并生成填充数据(隐含–nal-hrd cbr)。
- –pic-struct:强制在图像定时SEI中使用pic_struct。
- –crop-rect:将’left,top,right,bottom’添加到比特流级别的裁剪矩形。
这篇关于X264编码器参数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!