音视频开发—H264 SPS 和 PPS 参数说明

2024-06-02 04:20

本文主要是介绍音视频开发—H264 SPS 和 PPS 参数说明,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

      • 序列参数集 (SPS, Sequence Parameter Set)
        • SPS的主要内容:
      • 图像参数集 (PPS, Picture Parameter Set)
        • PPS的主要内容:
      • Slice Header 结构

在H.264视频编码标准中,SPS和PPS是关键的参数集,它们提供了解码所需的各种配置信息。它们分别存储在单独的NALU中,并用于初始化解码器的参数。

序列参数集 (SPS, Sequence Parameter Set)

SPS包含关于整个视频序列的全局参数,包括视频的分辨率、帧率、颜色空间等信息。SPS NALU的 nal_unit_type 为7。

SPS的主要内容:
  1. profile_idc (8 bits)

    • 指定编码器使用的特性集(Profile),如Baseline、Main、High等。

    如下图所示

    Profile描述了H.264编码器使用的特性集,定义了编码过程中允许使用的技术和工具。不同的Profile适用于不同的应用场景,主要包括以下几种:

    1. Baseline Profile
      • 适用于低延迟和低复杂度的应用,如视频会议、移动视频等。
      • 特点:支持I帧和P帧,不支持B帧;支持逐行扫描,不支持隔行扫描;支持基本的熵编码(CAVLC),不支持高级的CABAC。
    2. Main Profile
      • 适用于广播电视和存储等应用。
      • 特点:支持I帧、P帧和B帧;支持隔行扫描;支持高级的熵编码(CABAC),提供更高的压缩效率。
    3. High Profile
      • 适用于高清电视、蓝光光盘等高质量视频应用。
      • 特点:在Main Profile的基础上增加了8x8整数变换、更多的预测模式和量化矩阵等高级功能,进一步提高压缩效率和视频质量。

    此外,还有其他更专业的Profile,如Extended Profile、High 10 Profile、High 4:2:2 Profile、High 4:4:4 Predictive Profile等,用于特定的专业应用场景。

    在这里插入图片描述

  2. constraint_set_flags (6 bits)

    • 用于指示某些编码限制和特性。
  3. level_idc (8 bits)

    • 指定解码器的性能要求(Level),如1, 1.1, 1.2, …, 5.1等。

    不同的level对应的分辨率,帧率如下图所示

    在这里插入图片描述

  4. seq_parameter_set_id

    • 标识符,用于区分不同的SPS。
  5. log2_max_frame_num_minus4

    • 定义 MaxFrameNum 的值,即最大帧编号。
  6. pic_order_cnt_type

    • 指定帧内图像顺序计数类型。
  7. log2_max_pic_order_cnt_lsb_minus4(当 pic_order_cnt_type 为0时有效):

    • 定义 MaxPicOrderCntLsb 的值。
  8. max_num_ref_frames

    • 最大参考帧数量。
  9. gaps_in_frame_num_value_allowed_flag

    • 指示是否允许帧编号之间有空隙。
  10. frame_mbs_only_flag

    • 指示视频序列是否仅包含帧宏块(不包含场宏块)。
  11. direct_8x8_inference_flag

    • 指示是否可以在直接模式中使用8x8块。
  12. frame_cropping_flag

    • 指示是否存在帧裁剪参数。
  13. vui_parameters_present_flag

    • 指示是否存在VUI(视频可用性信息)参数。
  14. VUI参数(如果 vui_parameters_present_flag 为1):

    • 包含色彩描述、时间尺度、比特率、视频格式等额外信息。

一些补充的参数如下图所示:

在这里插入图片描述

图像参数集 (PPS, Picture Parameter Set)

PPS包含关于每个图像或图像组的具体参数,指导解码器如何处理图像数据。PPS NALU的 nal_unit_type 为8。

PPS的主要内容:
  1. pic_parameter_set_id
    • 标识符,用于区分不同的PPS。
  2. seq_parameter_set_id
    • 关联的SPS的标识符。
  3. entropy_coding_mode_flag
    • 指示是否使用CABAC(上下文自适应二进制算术编码)熵编码模式。
  4. bottom_field_pic_order_in_frame_present_flag
    • 指示是否在帧内包含底部场顺序信息。
  5. num_slice_groups_minus1
    • 指定切片组的数量。
  6. slice_group_map_type(如果 num_slice_groups_minus1 > 0):
    • 指定切片组的映射类型。
  7. num_ref_idx_l0_default_active_minus1 和 num_ref_idx_l1_default_active_minus1
    • 指定参考帧列表的默认数量。
  8. weighted_pred_flag
    • 指示是否使用加权预测。
  9. weighted_bipred_idc
    • 指定双向预测中加权预测的方法。
  10. pic_init_qp_minus26
    • 初始量化参数(QP)相对于基准值26的偏移量。
  11. deblocking_filter_control_present_flag
    • 指示是否存在去块滤波参数。
  12. constrained_intra_pred_flag
    • 指示是否限制帧内预测。
  13. redundant_pic_cnt_present_flag
    • 指示是否存在冗余图像计数。

Slice Header 结构

Slice Header的结构因Slice类型(I-Slice, P-Slice, B-Slice)和某些参数的不同而略有变化。以下是Slice Header中主要字段的详解:

  1. first_mb_in_slice
    • 表示该Slice中第一个宏块的地址(从0开始)。
  2. slice_type
    • 指示Slice的类型(I-Slice, P-Slice, B-Slice等)。
    • 常见值包括:
      • 0:P-Slice
      • 1:B-Slice
      • 2:I-Slice
      • 3:SP-Slice
      • 4:SI-Slice
  3. pic_parameter_set_id
    • 指示用于该Slice的PPS的标识符。
  4. frame_num
    • 表示该Slice所属帧的帧编号。
  5. field_pic_flag(可选)
    • 指示是否为场图像(field picture)。
    • 当场图像存在时,还需要bottom_field_flag
  6. bottom_field_flag(可选)
    • 指示是否为底场(bottom field)。
  7. idr_pic_id(当Slice为IDR片时)
    • 表示IDR片的标识符。
  8. pic_order_cnt_lsb
    • 表示该Slice所属帧的图像顺序计数(LSB部分)。
  9. delta_pic_order_cnt_bottom(当pic_order_cnt_type为0时)
    • 用于计算图像顺序计数的底部增量。
  10. delta_pic_order_cnt[0] 和 delta_pic_order_cnt[1](当pic_order_cnt_type为1时)
    • 用于计算图像顺序计数的增量。
  11. redundant_pic_cnt
    • 表示冗余图像计数。
  12. direct_spatial_mv_pred_flag(当Slice类型为B-Slice时)
    • 指示是否使用直接空间运动矢量预测。
  13. num_ref_idx_active_override_flag
    • 指示是否覆盖PPS中参考索引的默认数量。
  14. num_ref_idx_l0_active_minus1 和 num_ref_idx_l1_active_minus1
    • 指示L0和L1列表中活动参考索引的数量减1。
  15. ref_pic_list_modification_flag_l0 和 ref_pic_list_modification_flag_l1
    • 指示是否修改参考图像列表。
  16. dec_ref_pic_marking
    • 包含参考图像标记信息,用于管理参考图像缓存。
  17. cabac_init_idc
    • 表示CABAC初始化索引。
  18. slice_qp_delta
    • 表示该Slice的量化参数(QP)的增量。
  19. sp_for_switch_flag(当Slice类型为SP-Slice时)
    • 指示是否为切换SP-Slice。
  20. slice_qs_delta(当Slice类型为SP-Slice或SI-Slice时)
    • 表示该Slice的QS(量化步长)的增量。
  21. disable_deblocking_filter_idc
    • 指示是否禁用去块滤波。
  22. slice_alpha_c0_offset_div2 和 slice_beta_offset_div2
    • 表示去块滤波器的α和β参数偏移量。
  23. slice_group_change_cycle
    • 指示切片组更改周期。

这篇关于音视频开发—H264 SPS 和 PPS 参数说明的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1023014

相关文章

在Dockerfile中copy和add的区别及说明

《在Dockerfile中copy和add的区别及说明》COPY和ADD都是Dockerfile中用于文件复制的命令,但COPY仅用于本地文件或目录的复制,不支持自动解压缩;而ADD除了复制本地文件或... 目录在dockerfile中,copy 和 add有什么区别?COPY 命令ADD 命令总结在Doc

解读docker运行时-itd参数是什么意思

《解读docker运行时-itd参数是什么意思》在Docker中,-itd参数组合用于在后台运行一个交互式容器,同时保持标准输入和分配伪终端,这种方式适合需要在后台运行容器并保持交互能力的场景... 目录docker运行时-itd参数是什么意思1. -i(或 --interactive)2. -t(或 --

Android开发中gradle下载缓慢的问题级解决方法

《Android开发中gradle下载缓慢的问题级解决方法》本文介绍了解决Android开发中Gradle下载缓慢问题的几种方法,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、网络环境优化二、Gradle版本与配置优化三、其他优化措施针对android开发中Gradle下载缓慢的问

解读Pandas和Polars的区别及说明

《解读Pandas和Polars的区别及说明》Pandas和Polars是Python中用于数据处理的两个库,Pandas适用于中小规模数据的快速原型开发和复杂数据操作,而Polars则专注于高效数据... 目录Pandas vs Polars 对比表使用场景对比Pandas 的使用场景Polars 的使用

使用Go语言开发一个命令行文件管理工具

《使用Go语言开发一个命令行文件管理工具》这篇文章主要为大家详细介绍了如何使用Go语言开发一款命令行文件管理工具,支持批量重命名,删除,创建,移动文件,需要的小伙伴可以了解下... 目录一、工具功能一览二、核心代码解析1. 主程序结构2. 批量重命名3. 批量删除4. 创建文件/目录5. 批量移动三、如何安

Android 悬浮窗开发示例((动态权限请求 | 前台服务和通知 | 悬浮窗创建 )

《Android悬浮窗开发示例((动态权限请求|前台服务和通知|悬浮窗创建)》本文介绍了Android悬浮窗的实现效果,包括动态权限请求、前台服务和通知的使用,悬浮窗权限需要动态申请并引导... 目录一、悬浮窗 动态权限请求1、动态请求权限2、悬浮窗权限说明3、检查动态权限4、申请动态权限5、权限设置完毕后

Java通过反射获取方法参数名的方式小结

《Java通过反射获取方法参数名的方式小结》这篇文章主要为大家详细介绍了Java如何通过反射获取方法参数名的方式,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、前言2、解决方式方式2.1: 添加编译参数配置 -parameters方式2.2: 使用Spring的内部工具类 -

Spring Boot Actuator使用说明

《SpringBootActuator使用说明》SpringBootActuator是一个用于监控和管理SpringBoot应用程序的强大工具,通过引入依赖并配置,可以启用默认的监控接口,... 目录项目里引入下面这个依赖使用场景总结说明:本文介绍Spring Boot Actuator的使用,关于Spri

基于Python开发PPTX压缩工具

《基于Python开发PPTX压缩工具》在日常办公中,PPT文件往往因为图片过大而导致文件体积过大,不便于传输和存储,所以本文将使用Python开发一个PPTX压缩工具,需要的可以了解下... 目录引言全部代码环境准备代码结构代码实现运行结果引言在日常办公中,PPT文件往往因为图片过大而导致文件体积过大,

使用DeepSeek API 结合VSCode提升开发效率

《使用DeepSeekAPI结合VSCode提升开发效率》:本文主要介绍DeepSeekAPI与VisualStudioCode(VSCode)结合使用,以提升软件开发效率,具有一定的参考价值... 目录引言准备工作安装必要的 VSCode 扩展配置 DeepSeek API1. 创建 API 请求文件2.