H266/VVC多样化视频编码工具概述

2024-01-07 04:52

本文主要是介绍H266/VVC多样化视频编码工具概述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

全景视频编码

全景视频: 具有360度全包围视角的球面视频。
全景视频编码: 包括H266在内的视频编码算法都是以平面视频为对象的,为了采用传统的视频编码编码算法,全景视频需要转换为平面视频,其中经纬图等角映射(ERP)、立方体映射(CMP)是常用的格式。

水平环绕运动补偿:
普通平面视频编码算法的运动补偿中,当运动矢量指向参考图像边界区域外的像素时,会对参考图像边界进行填充以获取参考像素值,填充方法是用距离填充位置最近的图像边界像素值作为填充值。
ERP格式全景视频的左右边界是连续的,即图像的最左侧列像素与最右侧列像素内容是相邻的,如下图。
在这里插入图片描述
水平环绕运动补偿针对该类格式视频设计,可以使用图像右侧像素对左侧像素进行填充,也可以使用图像左侧像素对右侧像素进行填充。此外水平环绕运动补偿适用于其他左右边界连续的格式,比如等面积映射。
在这里插入图片描述
虚拟边界取消环路滤波:
多面投影映射是将球面全景视频投影在多个平面上,不论采用何种拼接方式,都不可避免地会在某些相邻投影面之间出现图像内容不连续现象,比如如下CMP格式。
如果对这些不连续边界使用环路滤波,则在重建视频中会出现拼接伪影,H266标准允许对指定边界禁用换路滤波。
在这里插入图片描述

屏幕内容编码

屏幕内容视频:像计算机桌面分享、文档演示、游戏动画等,都是屏幕内容视频,通常是由计算机生成,相比自然视频,屏幕内容视频不受摄像机镜头的物理限制,不存在传感器噪声,常带有更少的颜色类型,更多的重复图形,更锐利的物理边缘,场景切换也在屏幕视频中频繁出现。

H266屏幕内容编码: 针对屏幕内容视频的特性,H266标准采用了多种屏幕内容编码(Screen Content Coding,SCC)工具,包括帧内块复制、变换跳过模式的残差编码,块差分脉冲编码调制,调色板模式,自适应色度变换等。

帧内块复制:
IBC(Intra Block Copy)不再将参考区域限制在相邻像素行,利用当前帧所有已编码区域,预测待编码CU。预测过程与帧间预测类似,以CU为单位在当前帧已经完成重建的区域内搜索匹配的块。
使用块矢量(Block Vector,BV)来描述当前CU与匹配块的位移,与帧间预测出中的运动矢量类似,利用块矢量可以获取匹配块作为当前CU的预测值,如下图,IBC预测模式可以有效利用屏幕内容中重复出现的内容,完成更高效的预测。
在这里插入图片描述
帧内块复制支持两种预测模式,即IBC Merge模式和IBC AMVP模式。其中IBC Merge模式的块矢量候选列表通过空域矢量和历史矢量构建,下图时候空域块矢量示意图。IBC AMVP模式候选仅通过空域相邻块获取块矢量预测值,其预测值构建方式与IBC Merge模式中的空域块矢量预测方式相同。
在这里插入图片描述

变换跳过模式的残差编码:
H266中添加了变换跳过模式,即跳过变换过程,直接对CU的预测残差进行量化和熵编码。在H266中,变换跳过模式仅对宽和高都小于MaxTsSize的CU使用,MaxTsSize的值在SPS层语法元素中标识,最大值为32。

块差分脉冲编码调制:
针对屏幕视频内容,H266标准中采用块差分脉冲编码调试模式(Block Differential Pulse Coded Modulation, BDPCM)。CU完成帧内预测后,不对预测残差进行变换而直接量化,然后对量化预测出残差按预测方向进行差分脉冲编码。

调色板模式:
屏幕视频的像素值经常集中在少量颜色,H266的调色板模式(Palette Mode)可以有效提高屏幕视频的编码性能。在该模式下编解码端维护一个称为调色板的颜色列表,当像素值等于活接近调色板中得到某一个颜色时,编码端值需要编码该颜色的索引。当屏幕内容视频中的颜色种类较少时,可以用长度较短的调色板完成像素信息描述,获得较高的编码效率。

自适应色度变换:
为了削弱颜色失真效应,屏幕视频经常使用4:4:4颜色格式,H266采用ACT技术(Adaptive Color Tansform),允许使用颜色转换模块,将视频信息转换到YCgCo颜色空间,进行变换、量化、熵编码等操作。ACT技术如下图。
YCgCo颜色空间具有接近KL变换的都编码性能、与RGB颜色空间的转换可逆,支持有损压缩和无损,只包含移位和加法运算,计算复杂度低等优势。
在这里插入图片描述

参考

JVET输出文档: https://www.itu.int/wftp3/av-arch/jvet-site/
书籍: 新一代通用视频编码H266/VVC:原理、标准与实现[万帅 霍俊彦 马彦卓 杨付正/著]

备注

本系列博客主要是对《新一代通用视频编码H266/VVC:原理、标准与实现》的学习笔记。

这篇关于H266/VVC多样化视频编码工具概述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/578788

相关文章

基于Python实现一个PDF特殊字体提取工具

《基于Python实现一个PDF特殊字体提取工具》在PDF文档处理场景中,我们常常需要针对特定格式的文本内容进行提取分析,本文介绍的PDF特殊字体提取器是一款基于Python开发的桌面应用程序感兴趣的... 目录一、应用背景与功能概述二、技术架构与核心组件2.1 技术选型2.2 系统架构三、核心功能实现解析

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

基于.NET编写工具类解决JSON乱码问题

《基于.NET编写工具类解决JSON乱码问题》在开发过程中,我们经常会遇到JSON数据处理的问题,尤其是在数据传输和解析过程中,很容易出现编码错误导致的乱码问题,下面我们就来编写一个.NET工具类来解... 目录问题背景核心原理工具类实现使用示例总结在开发过程中,我们经常会遇到jsON数据处理的问题,尤其是

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常

Java中有什么工具可以进行代码反编译详解

《Java中有什么工具可以进行代码反编译详解》:本文主要介绍Java中有什么工具可以进行代码反编译的相关资,料,包括JD-GUI、CFR、Procyon、Fernflower、Javap、Byte... 目录1.JD-GUI2.CFR3.Procyon Decompiler4.Fernflower5.Jav

使用Python创建一个能够筛选文件的PDF合并工具

《使用Python创建一个能够筛选文件的PDF合并工具》这篇文章主要为大家详细介绍了如何使用Python创建一个能够筛选文件的PDF合并工具,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录背景主要功能全部代码代码解析1. 初始化 wx.Frame 窗口2. 创建工具栏3. 创建布局和界面控件4

Docker部署Jenkins持续集成(CI)工具的实现

《Docker部署Jenkins持续集成(CI)工具的实现》Jenkins是一个流行的开源自动化工具,广泛应用于持续集成(CI)和持续交付(CD)的环境中,本文介绍了使用Docker部署Jenkins... 目录前言一、准备工作二、设置变量和目录结构三、配置 docker 权限和网络四、启动 Jenkins

MobaXterm远程登录工具功能与应用小结

《MobaXterm远程登录工具功能与应用小结》MobaXterm是一款功能强大的远程终端软件,主要支持SSH登录,拥有多种远程协议,实现跨平台访问,它包括多会话管理、本地命令行执行、图形化界面集成和... 目录1. 远程终端软件概述1.1 远程终端软件的定义与用途1.2 远程终端软件的关键特性2. 支持的

关于最长递增子序列问题概述

《关于最长递增子序列问题概述》本文详细介绍了最长递增子序列问题的定义及两种优化解法:贪心+二分查找和动态规划+状态压缩,贪心+二分查找时间复杂度为O(nlogn),通过维护一个有序的“尾巴”数组来高效... 一、最长递增子序列问题概述1. 问题定义给定一个整数序列,例如 nums = [10, 9, 2

Java数字转换工具类NumberUtil的使用

《Java数字转换工具类NumberUtil的使用》NumberUtil是一个功能强大的Java工具类,用于处理数字的各种操作,包括数值运算、格式化、随机数生成和数值判断,下面就来介绍一下Number... 目录一、NumberUtil类概述二、主要功能介绍1. 数值运算2. 格式化3. 数值判断4. 随机