ICIP2020:VVC无损模式中ISP的快速实现

2023-11-05 11:20

本文主要是介绍ICIP2020:VVC无损模式中ISP的快速实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

​本文来自ICIP2020论文《A FAST LOSSLESS IMPLEMENTATION OF THE INTRA SUBPARTITION MODE FOR VVC》

VVC主要通过 Transform Skip Mode(TSM) 实现无损编码,由于VVC不支持同时使用TSM和Intra Subpartition (ISP),本文将研究在VVC在无损编码中结合TSM和ISP。

VVC中无损编码的实现的主要配置如下:

  • 对所有CU使用TSM模式。

  • 对于8比特输入信号选择QP为4。

  • 禁用环路滤波。

ISP简介

ISP就是将亮度帧内预测块进一步划分为子块。它在水平或垂直方向上将亮度帧内预测块划分为n个子块,划分的子块数量n取决于CU尺寸,

  • 如果CU中包含超过32个像素,n=4

  • 如果CU中包含正好32个像素,n=2

  • 如果CU中包含16个像素(4x4),不允许使用ISP模式

Fig.1是CU中包含超过32个像素时ISP划分的情况。

ISP划分的每个子块都采用同样的帧内预测模式所以对于一个CU只需要传输一次帧内模式,它们的帧内预测过程和普通帧内预测一样:首先,生成预测值和残差值,然后,对残差进行变换量化,非零系数进行熵编码传到解码端。其结果重建后可以用于预测下一个子块。

在VVC中同一个CU不允许同时使用ISP和TSM模式,这主要是因为在有损编码时两者结合编码增益不高。但这没有考虑到无损编码的情况,本文主要完成下面两件事:

  • 允许CU在使用TSM的同时使用ISP

  • 通过在无损情况下实现快速搜索算法来达到编码时间和编码增益的平衡

无损编码中的ISP

ISP和TSM的结合

为了在无损编码中将TSM和ISP结合,需要进行以下改进:

  • 允许CU的每个子块使用ISP编码,且当对应的CBF非零时要能解析TSM标志位。TSM在熵编码中的上下文模型还使用VVC中提供的。

  • 在编码端,始终为ISP模式生成的子块选择使用TSM模式。

编码端估计

  • VTM7.0中帧内预测搜索

帧内预测搜索过程用于选择最优的模式,包括帧内预测模式、MRL、MIP、ISP等。从中选择RD cost最小的模式,失真用原始像素和重建像素的均方误差度量。但是为所有模式计算RD cost复杂度太高了,所以VTM7.0构建了Most Promising Candidates (MPC) 列表,只需要为MPC中的模式计算RD cost。MPC列表创建过程如下:

  1. 对MRL、MIP和普通帧内候选模式(不包括ISP)的RD cost进行排序,失真用预测像素和原始像素的SAD度量。

  2. 只取K个候选项,K由块尺寸和MIP模式的RD cost决定。

  3. 将 Most Probable Modes (MPM)中的候选项加入列表。

  4. 将ISP模式加到列表最末端。

可以看见,上面没有对ISP模式进行RD cost估计。这是因为在有损编码中ISP模式无法准确计算SAD,除第一个子块外,其他子块需要利用前一个子块的重建值来预测,而这又必须等所有RD cost计算完之后才能获得。

VTM7.0中无损编码的帧内搜索和上面相同,唯一的区别在于计算RD cost时不用计算失真。

  • 无损编码ISP快速搜索优化

无损编码的一个特点是所有重建像素都可以估计到,因为它和原始像素相同,这样就可以对ISP模式计算SAD。本文提出快速算法替换上面MPC列表构建的第四步,

4.a 令C等于MPC列表(ISP模式加入之前)中第二好的RD cost。

4.b 计算所有预选的普通帧内预测模式的ISP-SAD构建一个子列表,每个模式计算两遍因为ISP有水平和垂直两种划分方式。

4.c 为ISP-SAD子列表的所有元素计算基于SAD的RD cost。

4.d 将所有基于SAD的RD cost小于C的ISP模式加入MPC。此外,每加入一个ISP模式同时移除一个最差的非ISP模式。但是至少保留一个非ISP模式。

MPC构建流程如Fig.2所示,

实验结果

实验在VTM7.0无损模式下完成。共两组实验:TSM和ISP结合但没有搜索优化(V1)、TSM和ISP结合同时有搜索优化(V2)。

实验结果如表所示,V1编码增益0.73%同时编码耗时127%,V2编码增益0.71%同时编码耗时111%。结果表明快速搜索优化可以达到更好的编码时间和编码增益的平衡。同时,V1和V2都节省了码率,表明在VVC无损编码中将TSM和ISP结合能取得很好的结果。

感兴趣的请关注微信公众号Video Coding

这篇关于ICIP2020:VVC无损模式中ISP的快速实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/349507

相关文章

C#实现将Excel表格转换为图片(JPG/ PNG)

《C#实现将Excel表格转换为图片(JPG/PNG)》Excel表格可能会因为不同设备或字体缺失等问题,导致格式错乱或数据显示异常,转换为图片后,能确保数据的排版等保持一致,下面我们看看如何使用C... 目录通过C# 转换Excel工作表到图片通过C# 转换指定单元格区域到图片知识扩展C# 将 Excel

基于Java实现回调监听工具类

《基于Java实现回调监听工具类》这篇文章主要为大家详细介绍了如何基于Java实现一个回调监听工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录监听接口类 Listenable实际用法打印结果首先,会用到 函数式接口 Consumer, 通过这个可以解耦回调方法,下面先写一个

使用Java将DOCX文档解析为Markdown文档的代码实现

《使用Java将DOCX文档解析为Markdown文档的代码实现》在现代文档处理中,Markdown(MD)因其简洁的语法和良好的可读性,逐渐成为开发者、技术写作者和内容创作者的首选格式,然而,许多文... 目录引言1. 工具和库介绍2. 安装依赖库3. 使用Apache POI解析DOCX文档4. 将解析

Qt中QGroupBox控件的实现

《Qt中QGroupBox控件的实现》QGroupBox是Qt框架中一个非常有用的控件,它主要用于组织和管理一组相关的控件,本文主要介绍了Qt中QGroupBox控件的实现,具有一定的参考价值,感兴趣... 目录引言一、基本属性二、常用方法2.1 构造函数 2.2 设置标题2.3 设置复选框模式2.4 是否

C++使用printf语句实现进制转换的示例代码

《C++使用printf语句实现进制转换的示例代码》在C语言中,printf函数可以直接实现部分进制转换功能,通过格式说明符(formatspecifier)快速输出不同进制的数值,下面给大家分享C+... 目录一、printf 原生支持的进制转换1. 十进制、八进制、十六进制转换2. 显示进制前缀3. 指

springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法

《springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法》:本文主要介绍springboot整合阿里云百炼DeepSeek实现sse流式打印,本文给大家介绍的非常详细,对大... 目录1.开通阿里云百炼,获取到key2.新建SpringBoot项目3.工具类4.启动类5.测试类6.测

pytorch自动求梯度autograd的实现

《pytorch自动求梯度autograd的实现》autograd是一个自动微分引擎,它可以自动计算张量的梯度,本文主要介绍了pytorch自动求梯度autograd的实现,具有一定的参考价值,感兴趣... autograd是pytorch构建神经网络的核心。在 PyTorch 中,结合以下代码例子,当你

SpringBoot集成Milvus实现数据增删改查功能

《SpringBoot集成Milvus实现数据增删改查功能》milvus支持的语言比较多,支持python,Java,Go,node等开发语言,本文主要介绍如何使用Java语言,采用springboo... 目录1、Milvus基本概念2、添加maven依赖3、配置yml文件4、创建MilvusClient

JS+HTML实现在线图片水印添加工具

《JS+HTML实现在线图片水印添加工具》在社交媒体和内容创作日益频繁的今天,如何保护原创内容、展示品牌身份成了一个不得不面对的问题,本文将实现一个完全基于HTML+CSS构建的现代化图片水印在线工具... 目录概述功能亮点使用方法技术解析延伸思考运行效果项目源码下载总结概述在社交媒体和内容创作日益频繁的

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各