H266/VVC多样化视频编码工具概述

2024-01-07 04:52

本文主要是介绍H266/VVC多样化视频编码工具概述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

全景视频编码

全景视频: 具有360度全包围视角的球面视频。
全景视频编码: 包括H266在内的视频编码算法都是以平面视频为对象的,为了采用传统的视频编码编码算法,全景视频需要转换为平面视频,其中经纬图等角映射(ERP)、立方体映射(CMP)是常用的格式。

水平环绕运动补偿:
普通平面视频编码算法的运动补偿中,当运动矢量指向参考图像边界区域外的像素时,会对参考图像边界进行填充以获取参考像素值,填充方法是用距离填充位置最近的图像边界像素值作为填充值。
ERP格式全景视频的左右边界是连续的,即图像的最左侧列像素与最右侧列像素内容是相邻的,如下图。
在这里插入图片描述
水平环绕运动补偿针对该类格式视频设计,可以使用图像右侧像素对左侧像素进行填充,也可以使用图像左侧像素对右侧像素进行填充。此外水平环绕运动补偿适用于其他左右边界连续的格式,比如等面积映射。
在这里插入图片描述
虚拟边界取消环路滤波:
多面投影映射是将球面全景视频投影在多个平面上,不论采用何种拼接方式,都不可避免地会在某些相邻投影面之间出现图像内容不连续现象,比如如下CMP格式。
如果对这些不连续边界使用环路滤波,则在重建视频中会出现拼接伪影,H266标准允许对指定边界禁用换路滤波。
在这里插入图片描述

屏幕内容编码

屏幕内容视频:像计算机桌面分享、文档演示、游戏动画等,都是屏幕内容视频,通常是由计算机生成,相比自然视频,屏幕内容视频不受摄像机镜头的物理限制,不存在传感器噪声,常带有更少的颜色类型,更多的重复图形,更锐利的物理边缘,场景切换也在屏幕视频中频繁出现。

H266屏幕内容编码: 针对屏幕内容视频的特性,H266标准采用了多种屏幕内容编码(Screen Content Coding,SCC)工具,包括帧内块复制、变换跳过模式的残差编码,块差分脉冲编码调制,调色板模式,自适应色度变换等。

帧内块复制:
IBC(Intra Block Copy)不再将参考区域限制在相邻像素行,利用当前帧所有已编码区域,预测待编码CU。预测过程与帧间预测类似,以CU为单位在当前帧已经完成重建的区域内搜索匹配的块。
使用块矢量(Block Vector,BV)来描述当前CU与匹配块的位移,与帧间预测出中的运动矢量类似,利用块矢量可以获取匹配块作为当前CU的预测值,如下图,IBC预测模式可以有效利用屏幕内容中重复出现的内容,完成更高效的预测。
在这里插入图片描述
帧内块复制支持两种预测模式,即IBC Merge模式和IBC AMVP模式。其中IBC Merge模式的块矢量候选列表通过空域矢量和历史矢量构建,下图时候空域块矢量示意图。IBC AMVP模式候选仅通过空域相邻块获取块矢量预测值,其预测值构建方式与IBC Merge模式中的空域块矢量预测方式相同。
在这里插入图片描述

变换跳过模式的残差编码:
H266中添加了变换跳过模式,即跳过变换过程,直接对CU的预测残差进行量化和熵编码。在H266中,变换跳过模式仅对宽和高都小于MaxTsSize的CU使用,MaxTsSize的值在SPS层语法元素中标识,最大值为32。

块差分脉冲编码调制:
针对屏幕视频内容,H266标准中采用块差分脉冲编码调试模式(Block Differential Pulse Coded Modulation, BDPCM)。CU完成帧内预测后,不对预测残差进行变换而直接量化,然后对量化预测出残差按预测方向进行差分脉冲编码。

调色板模式:
屏幕视频的像素值经常集中在少量颜色,H266的调色板模式(Palette Mode)可以有效提高屏幕视频的编码性能。在该模式下编解码端维护一个称为调色板的颜色列表,当像素值等于活接近调色板中得到某一个颜色时,编码端值需要编码该颜色的索引。当屏幕内容视频中的颜色种类较少时,可以用长度较短的调色板完成像素信息描述,获得较高的编码效率。

自适应色度变换:
为了削弱颜色失真效应,屏幕视频经常使用4:4:4颜色格式,H266采用ACT技术(Adaptive Color Tansform),允许使用颜色转换模块,将视频信息转换到YCgCo颜色空间,进行变换、量化、熵编码等操作。ACT技术如下图。
YCgCo颜色空间具有接近KL变换的都编码性能、与RGB颜色空间的转换可逆,支持有损压缩和无损,只包含移位和加法运算,计算复杂度低等优势。
在这里插入图片描述

参考

JVET输出文档: https://www.itu.int/wftp3/av-arch/jvet-site/
书籍: 新一代通用视频编码H266/VVC:原理、标准与实现[万帅 霍俊彦 马彦卓 杨付正/著]

备注

本系列博客主要是对《新一代通用视频编码H266/VVC:原理、标准与实现》的学习笔记。

这篇关于H266/VVC多样化视频编码工具概述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/578788

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提供了许多比 AWT 更好的屏幕显示元素,更加灵活和可定制,具有更好的跨平台性能。 组件和容器 Java Swing 提供了许多

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

超强的截图工具:PixPin

你是否还在为寻找一款功能强大、操作简便的截图工具而烦恼?市面上那么多工具,常常让人无从选择。今天,想给大家安利一款神器——PixPin,一款真正解放双手的截图工具。 想象一下,你只需要按下快捷键就能轻松完成多种截图任务,还能快速编辑、标注甚至保存多种格式的图片。这款工具能满足这些需求吗? PixPin不仅支持全屏、窗口、区域截图等基础功能,它还可以进行延时截图,让你捕捉到每个关键画面。不仅如此

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return