音视频开发—H264 SPS 和 PPS 参数说明

2024-06-02 04:20

本文主要是介绍音视频开发—H264 SPS 和 PPS 参数说明,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

      • 序列参数集 (SPS, Sequence Parameter Set)
        • SPS的主要内容:
      • 图像参数集 (PPS, Picture Parameter Set)
        • PPS的主要内容:
      • Slice Header 结构

在H.264视频编码标准中,SPS和PPS是关键的参数集,它们提供了解码所需的各种配置信息。它们分别存储在单独的NALU中,并用于初始化解码器的参数。

序列参数集 (SPS, Sequence Parameter Set)

SPS包含关于整个视频序列的全局参数,包括视频的分辨率、帧率、颜色空间等信息。SPS NALU的 nal_unit_type 为7。

SPS的主要内容:
  1. profile_idc (8 bits)

    • 指定编码器使用的特性集(Profile),如Baseline、Main、High等。

    如下图所示

    Profile描述了H.264编码器使用的特性集,定义了编码过程中允许使用的技术和工具。不同的Profile适用于不同的应用场景,主要包括以下几种:

    1. Baseline Profile
      • 适用于低延迟和低复杂度的应用,如视频会议、移动视频等。
      • 特点:支持I帧和P帧,不支持B帧;支持逐行扫描,不支持隔行扫描;支持基本的熵编码(CAVLC),不支持高级的CABAC。
    2. Main Profile
      • 适用于广播电视和存储等应用。
      • 特点:支持I帧、P帧和B帧;支持隔行扫描;支持高级的熵编码(CABAC),提供更高的压缩效率。
    3. High Profile
      • 适用于高清电视、蓝光光盘等高质量视频应用。
      • 特点:在Main Profile的基础上增加了8x8整数变换、更多的预测模式和量化矩阵等高级功能,进一步提高压缩效率和视频质量。

    此外,还有其他更专业的Profile,如Extended Profile、High 10 Profile、High 4:2:2 Profile、High 4:4:4 Predictive Profile等,用于特定的专业应用场景。

    在这里插入图片描述

  2. constraint_set_flags (6 bits)

    • 用于指示某些编码限制和特性。
  3. level_idc (8 bits)

    • 指定解码器的性能要求(Level),如1, 1.1, 1.2, …, 5.1等。

    不同的level对应的分辨率,帧率如下图所示

    在这里插入图片描述

  4. seq_parameter_set_id

    • 标识符,用于区分不同的SPS。
  5. log2_max_frame_num_minus4

    • 定义 MaxFrameNum 的值,即最大帧编号。
  6. pic_order_cnt_type

    • 指定帧内图像顺序计数类型。
  7. log2_max_pic_order_cnt_lsb_minus4(当 pic_order_cnt_type 为0时有效):

    • 定义 MaxPicOrderCntLsb 的值。
  8. max_num_ref_frames

    • 最大参考帧数量。
  9. gaps_in_frame_num_value_allowed_flag

    • 指示是否允许帧编号之间有空隙。
  10. frame_mbs_only_flag

    • 指示视频序列是否仅包含帧宏块(不包含场宏块)。
  11. direct_8x8_inference_flag

    • 指示是否可以在直接模式中使用8x8块。
  12. frame_cropping_flag

    • 指示是否存在帧裁剪参数。
  13. vui_parameters_present_flag

    • 指示是否存在VUI(视频可用性信息)参数。
  14. VUI参数(如果 vui_parameters_present_flag 为1):

    • 包含色彩描述、时间尺度、比特率、视频格式等额外信息。

一些补充的参数如下图所示:

在这里插入图片描述

图像参数集 (PPS, Picture Parameter Set)

PPS包含关于每个图像或图像组的具体参数,指导解码器如何处理图像数据。PPS NALU的 nal_unit_type 为8。

PPS的主要内容:
  1. pic_parameter_set_id
    • 标识符,用于区分不同的PPS。
  2. seq_parameter_set_id
    • 关联的SPS的标识符。
  3. entropy_coding_mode_flag
    • 指示是否使用CABAC(上下文自适应二进制算术编码)熵编码模式。
  4. bottom_field_pic_order_in_frame_present_flag
    • 指示是否在帧内包含底部场顺序信息。
  5. num_slice_groups_minus1
    • 指定切片组的数量。
  6. slice_group_map_type(如果 num_slice_groups_minus1 > 0):
    • 指定切片组的映射类型。
  7. num_ref_idx_l0_default_active_minus1 和 num_ref_idx_l1_default_active_minus1
    • 指定参考帧列表的默认数量。
  8. weighted_pred_flag
    • 指示是否使用加权预测。
  9. weighted_bipred_idc
    • 指定双向预测中加权预测的方法。
  10. pic_init_qp_minus26
    • 初始量化参数(QP)相对于基准值26的偏移量。
  11. deblocking_filter_control_present_flag
    • 指示是否存在去块滤波参数。
  12. constrained_intra_pred_flag
    • 指示是否限制帧内预测。
  13. redundant_pic_cnt_present_flag
    • 指示是否存在冗余图像计数。

Slice Header 结构

Slice Header的结构因Slice类型(I-Slice, P-Slice, B-Slice)和某些参数的不同而略有变化。以下是Slice Header中主要字段的详解:

  1. first_mb_in_slice
    • 表示该Slice中第一个宏块的地址(从0开始)。
  2. slice_type
    • 指示Slice的类型(I-Slice, P-Slice, B-Slice等)。
    • 常见值包括:
      • 0:P-Slice
      • 1:B-Slice
      • 2:I-Slice
      • 3:SP-Slice
      • 4:SI-Slice
  3. pic_parameter_set_id
    • 指示用于该Slice的PPS的标识符。
  4. frame_num
    • 表示该Slice所属帧的帧编号。
  5. field_pic_flag(可选)
    • 指示是否为场图像(field picture)。
    • 当场图像存在时,还需要bottom_field_flag
  6. bottom_field_flag(可选)
    • 指示是否为底场(bottom field)。
  7. idr_pic_id(当Slice为IDR片时)
    • 表示IDR片的标识符。
  8. pic_order_cnt_lsb
    • 表示该Slice所属帧的图像顺序计数(LSB部分)。
  9. delta_pic_order_cnt_bottom(当pic_order_cnt_type为0时)
    • 用于计算图像顺序计数的底部增量。
  10. delta_pic_order_cnt[0] 和 delta_pic_order_cnt[1](当pic_order_cnt_type为1时)
    • 用于计算图像顺序计数的增量。
  11. redundant_pic_cnt
    • 表示冗余图像计数。
  12. direct_spatial_mv_pred_flag(当Slice类型为B-Slice时)
    • 指示是否使用直接空间运动矢量预测。
  13. num_ref_idx_active_override_flag
    • 指示是否覆盖PPS中参考索引的默认数量。
  14. num_ref_idx_l0_active_minus1 和 num_ref_idx_l1_active_minus1
    • 指示L0和L1列表中活动参考索引的数量减1。
  15. ref_pic_list_modification_flag_l0 和 ref_pic_list_modification_flag_l1
    • 指示是否修改参考图像列表。
  16. dec_ref_pic_marking
    • 包含参考图像标记信息,用于管理参考图像缓存。
  17. cabac_init_idc
    • 表示CABAC初始化索引。
  18. slice_qp_delta
    • 表示该Slice的量化参数(QP)的增量。
  19. sp_for_switch_flag(当Slice类型为SP-Slice时)
    • 指示是否为切换SP-Slice。
  20. slice_qs_delta(当Slice类型为SP-Slice或SI-Slice时)
    • 表示该Slice的QS(量化步长)的增量。
  21. disable_deblocking_filter_idc
    • 指示是否禁用去块滤波。
  22. slice_alpha_c0_offset_div2 和 slice_beta_offset_div2
    • 表示去块滤波器的α和β参数偏移量。
  23. slice_group_change_cycle
    • 指示切片组更改周期。

这篇关于音视频开发—H264 SPS 和 PPS 参数说明的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1023014

相关文章

Zookeeper安装和配置说明

一、Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式。 ■ 单机模式:Zookeeper只运行在一台服务器上,适合测试环境; ■ 伪集群模式:就是在一台物理机上运行多个Zookeeper 实例; ■ 集群模式:Zookeeper运行于一个集群上,适合生产环境,这个计算机集群被称为一个“集合体”(ensemble) Zookeeper通过复制来实现

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

OpenHarmony鸿蒙开发( Beta5.0)无感配网详解

1、简介 无感配网是指在设备联网过程中无需输入热点相关账号信息,即可快速实现设备配网,是一种兼顾高效性、可靠性和安全性的配网方式。 2、配网原理 2.1 通信原理 手机和智能设备之间的信息传递,利用特有的NAN协议实现。利用手机和智能设备之间的WiFi 感知订阅、发布能力,实现了数字管家应用和设备之间的发现。在完成设备间的认证和响应后,即可发送相关配网数据。同时还支持与常规Sof

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

如何在页面调用utility bar并传递参数至lwc组件

1.在app的utility item中添加lwc组件: 2.调用utility bar api的方式有两种: 方法一,通过lwc调用: import {LightningElement,api ,wire } from 'lwc';import { publish, MessageContext } from 'lightning/messageService';import Ca

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了