多功能视频编码标准 H.266/VVC

2023-12-26 08:44

本文主要是介绍多功能视频编码标准 H.266/VVC,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

视频技术的最新进展潜在地增加了对流传输和广播视频内容的需求。在今日 人们依靠视频来相识并建立联系,借助超高清(Ultra High Definition,UHD)、虚 拟现实(Virtual Reality,VR)和 360 全景视频等技术,人们可以在线捕捉并分享最 快乐最想记住的美好时刻。

毫无疑问,视频技术的快速发展带来视频数据量大的问题,而有效地压缩视 频将变得非常重要,特别是在处理高图像质量视频传输时。2013 年,高效视频编 码标准比之前的标准减少了 50%的比特。然而,由于视频技术将继续呈上升趋势, 现在的 H.265/HEVC 视频标准已难以满足人们,所以迫切需要研究多功能视频编 码标准来解决高图像质量视频带来的难题。所以,国际电信联盟和运动图像专家 组这两个标准化机构于 2017 年 10 月开始开发未来的多功能视频编码标准,将在 目前 H.265/HEVC 的基础上进行添加新的技术或改进其中已有的技术,目的是在 H.265/HEVC 基础上将码率再降低 50%。

H.266/VVC 编码框架

与上一代编码技术 H.265/HEVC 相比,H.266/VVC 编码框架仍由块划分、预测、变换量化、环路滤波、熵编码等多个模块组成,但在每个 模块中都添加了提高视频编码效果的关键技术。

(1)块划分

H.266/VVC 编码是基于编码单元来实现编码处理。首先将接收到的每帧视 频图像划分为许多个编码树单元(Coding tree units,CTU),然后使用具有四叉树、 二叉树、三叉树的混合树结构将 CTU 划分为许多编码单元(Coding units,CU),再 对每个 CU 进行预测等后续模块处理,最后得到视频压缩后的码流。

(2)预测

视频编码中预测模块是指利用视频图像帧中或相邻图像帧之间,像素与像素 之间存在极强的像素相关性的原理,来剔除时域和空域中的数据冗余,而预测模 块又分为帧内预测技术和帧间预测技术。

帧内预测是指考虑到图像块中存在空域 冗余的特性(即一帧图像内相邻像素之间存在较强的相似性),使用当前图像块 的邻近已编码处理过的像素块预测出当前块像素值的过程。在新一代视频编码 H.266/VVC 帧内预测中新增了许多技术,如更多角度方向预测、非正方形的广角 帧内预测(Wide-angle intra prediction for non-square blocks,WAIP)、位置决定的帧 内预测组合(Position dependent intra prediction combination,PDPC)、帧内子块划 分技术(Intra sub-partitions,ISP)、跨分量线性模型预测(Cross-component linear model prediction,CCLM)、多参考行帧内预测(Multi-line intra prediction,MLIP)、 矩阵加权帧内预测(Matrix based intra prediction,MIP)等技术。

帧间预测是指由于视频由不间断的图像帧组成,而相邻的图像帧之间存在极 强图像数据相似度,通过记录相邻已编码的图像帧与当前帧之间的运动信息,来 预测当前未编码帧,解决时域存在的数据冗余问题。在新一代视频编码 H.266/VVC 帧间预测中新增了如用于帧间预测的三角形划分、仿射运动补偿预 测等新技术。

(3)变换量化

变换是通常指将经过预测后的残差值进行离散变换(Discrete Transform,DT)。 由于图像大概率会具有简单纹理且平整的区域,经过变换处理后,将空域上较为 分散的这些区域的数据较为集中在变换域某个区域中,从而有效减少视频图像的 数据冗余。通常情况下,经过变换处理后的 DT 系数往往都处在一个较大的连续 取值范围。为了减少 DT 系数的取值范围,对连续的变换系数进行量化,实现进 一步减少数据量的目的,仅会损失一定的数据精度。在 H.266/VVC 中为了提高 变换和量化的计算速度,在编码时仍同时执行变换和量化。

除了 H.265/HEVC 中已有的 DCT2 变换核外,还新添加了 DST7、DCT8 变 换核,通过根据不同的预测模式选择适合的变换核,以达到最佳的变换效果。

(4)熵编码

在信息论中,熵编码是一种通用的无损数据编码压缩技术,该技术用二进制 流代替了图像数据信息。熵编码与变换和量化相结合,可显著减小视频图像数据。 熵编码将承载视频图像信息的数据(如运动矢量信息、变换量化系数等)变化为 可以进行存储或传输的二进制数据流。原始视频经过熵编码处理后便是压缩后的 码流。

(5)滤波及补偿

由于 H.266/VVC 视频编码是通过对 CU 进行块划分后再预测的,所以经过 H.266/VVC 视频编码后的视频会出现图像方块效应、振铃效应、图像质量差等失 真现象。为了减少视频失真现象所带来的不好视觉体验,H.266/VVC 编码中采用 去方块滤波(De-Blocking Filter,DBF)减少方块效应,并在 DBF 中参考重建的亮 度分量的水平来决定滤波器的强度,使得滤波效果更好。H.266/VVC 针对存在的 振铃效应现象,继续采用样本自适应补偿滤波进行削弱。同时,还应用了基于块 的自适应环路滤波(Adaptive Loop Filter,ALF) 以提高图像的主观质量评价的同 时提高 H.266/VVC 编码效率。

这篇关于多功能视频编码标准 H.266/VVC的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/538763

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

《x86汇编语言:从实模式到保护模式》视频来了

《x86汇编语言:从实模式到保护模式》视频来了 很多朋友留言,说我的专栏《x86汇编语言:从实模式到保护模式》写得很详细,还有的朋友希望我能写得更细,最好是覆盖全书的所有章节。 毕竟我不是作者,只有作者的解读才是最权威的。 当初我学习这本书的时候,只能靠自己摸索,网上搜不到什么好资源。 如果你正在学这本书或者汇编语言,那你有福气了。 本书作者李忠老师,以此书为蓝本,录制了全套视频。 试

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

树莓派5_opencv笔记27:Opencv录制视频(无声音)

今日继续学习树莓派5 8G:(Raspberry Pi,简称RPi或RasPi)  本人所用树莓派5 装载的系统与版本如下:  版本可用命令 (lsb_release -a) 查询: Opencv 与 python 版本如下: 今天就水一篇文章,用树莓派摄像头,Opencv录制一段视频保存在指定目录... 文章提供测试代码讲解,整体代码贴出、测试效果图 目录 阶段一:录制一段

基于树梅派的视频监控机器人Verybot

最近这段时间做了一个基于树梅派 ( raspberry pi ) 的视频监控机器人平台 Verybot ,现在打算把这个机器人的一些图片、视频、设计思路进行公开,并且希望跟大家一起研究相关的各种问题,下面是两张机器人的照片:         图片1:                   图片2                    这个平台的基本组成是:

PC与android平板通过浏览器监控Verybot的视频

下面这个视频是PC与android平板通过浏览器监控Verybot的视频:           http://v.youku.com/v_show/id_XNjYzNzYyMTIw.html

Verybot的几个视频

1、Verybot的运动控制                 http://v.youku.com/v_show/id_XNjYxNjg4MTM2.html           2、Verybot比较初步的网络视频监控           http://v.youku.com/v_show/id_XNjYxNjkyMjg0.html           3、V

java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频)

这是什么系统? 资源获取方式在最下方 java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频) 停车管理信息系统是为了提升停车场的运营效率和管理水平而设计的综合性平台。系统涵盖用户信息管理、车位管理、收费管理、违规车辆处理等多个功能模块,旨在实现对停车场资源的高效配置和实时监控。此外,系统还提供了资讯管理和统计查询功能,帮助管理者及时发布信息并进行数据分析,为停车场的科学

一款支持同一个屏幕界面同时播放多个视频的视频播放软件

GridPlayer 是一款基于 VLC 的免费开源跨平台多视频同步播放工具,支持在一块屏幕上同时播放多个视频。其主要功能包括: 多视频播放:用户可以在一个窗口中同时播放任意数量的视频,数量仅受硬件性能限制。支持多种格式和流媒体:GridPlayer 支持所有由 VLC 支持的视频格式以及流媒体 URL(如 m3u8 链接)。自定义网格布局:用户可以配置播放器的网格布局,以适应不同的观看需求。硬