DCC2023:解码端帧内色度模式生成

2024-01-17 02:36

本文主要是介绍DCC2023:解码端帧内色度模式生成,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

​本文来自DCC2023文章《Decoder-side Chroma Intra Mode Derivation in Video Coding》

VVC支持67种帧内预测模式(DC模式、Planar模式和65种角度模式),如果对每个CU的帧内模式编码的话会消耗大量比特,因此ECM中提出了基于梯度的解码端亮度帧内模式生成(Decoder-side Intra Mode Dervation,DIMD)算法。然而DIMD是根据亮度特征设计的算法,没有用于色度分量。

ECM中色度帧内预测模式和VVC类似,包括DM模式(色度直接使用对应亮度的帧内模式)、4种默认模式(Planar、垂直、水平、DC模式)、CCLM和MMLM。所以色度分量能使用的角度模式只能来自DM或默认模式之一,使得色度不能像亮度一样灵活的选择最合适的预测角度。如果允许色度使用更多的角度模式则预测会更准确,但是传输这些模式也会消耗更多比特。由于色度的纹理通常比亮度更简单,所以增加角度模式提高预测准确率带来的收益可能无法覆盖消耗更多比特带来的损失。因此文章提出了解码端帧内色度模式生成(Decoder-side Chroma Intra Mode Derivation,DCIMD)。

ECM中的DIMD


ECM中新增了DIMD工具,DIMD可以基于梯度在编码端和解码端生成亮度帧内预测模式,因此使用DIMD的CU无需在码流中传输模式信息。

使用DIMD时需要使用当前块相邻的亮度像素生成2个角度模式,然后根据2个角度模式和planar模式分别生成预测块,最后将3个预测块加权得到最终的亮度预测块。

图1 DIMD使用的相邻像素

DIMD计算梯度时需要使用相邻第2行/列的重建像素,如图1,对每个像素使用3x3 Sobel算子分别计算水平梯度G_hor和垂直梯度G_ver,水平Sobel算子F_hor和垂直Sobel算子F_ver如公式(1)(2)

计算完梯度后开始构建直方图,直方图对每个角度初始值都是0,

首先对每个相邻像素根据梯度按公式(3)计算θ

θ会被映射到最近的65个角度模式之一,当G_hor和G_ver都是0时θ会被映射为planar模式。对于被映射的角度,其直方图对应的频数增加G,G根据公式(4)计算,

当所有相邻像素处理完后,直方图就构建完毕,从中选择频数最大的两个模式mode1和mode2。

然后根据mode1、mode2和planar模式分别生成预测块,最后将3个预测块按照公式(5)加权得到最终预测块。

其中planar的权重w_planar固定为21/64,剩下的43/61由mode1和mode2根据其在直方图中的频数分配,

DCIMD


上面的DIMD仅用于亮度分量,文章提出DCIMD用于处理色度分量。DCIMD可以解决色度分量使用的角度模式少的问题,同时也不需要在码流中传输模式索引。

DCIMD计算时需要使用对应亮度相邻第2行/列的重建像素,以及Cb和Cr分量相邻第2行/列的重建像素,如图2。

当计算色度块时对应的亮度块已经重建完成,且亮度块和色度块相关性更高,为什么这里使用亮度相邻的重建像素而不是直接使用对应亮度块的重建像素?这么做是避免硬件流水线延迟。

图2 DCIMD使用的相邻像素

DCIMD和DIMD过程类似,它使用亮度和色度重建像素一起构建一个直方图,不同之处在于它最终只选择1个模式(直方图中频数最高的模式),Cb和Cr分量都使用该模式。

DCIMD生成的角度模式可能并不能适合所有色度块,所以每个CU都有一个标志位表示是否使用DCIMD。

CIMF


DIMD中最终亮度预测块由3个预测块加权得到,这3个预测块都是由空域信息得到。但是色度的纹理比较简单,如果同样使用空域信息得到的几个预测块加权效果不好。

对应色度帧内模式,DM模式、DCIMD模型和4个默认模式都是空域相关的模式,CCLM和MMLM是cross-component相关的模式。由于空域模式和cross-component模式包含不同特征,将它们加权能够提升预测效果。因此文章提出CIMF(Chroma Intra Mode Fusion)。CIMF过程如公式(5),

为了平衡复杂度和效率,ECM中对于CIMF空域模式从DM模式、DCIMD模型和4个默认模式中选择,cross-component模式固定为MMLM_LT。权值由上方和左侧相邻块的模式决定,如图3,

图3 CIMF权值

实验结果


实验平台ECM-4.0,实验配置All intra,结果如表1,DCIMD的YUV BD-Rate为-0.06%/-0.56/-0.54%,DCIMD+CIMF的YUV BD-Rate为-0.07%/-1.17/-1.02%

感兴趣的请关注微信公众号Video Coding

这篇关于DCC2023:解码端帧内色度模式生成的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/614661

相关文章

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

在JS中的设计模式的单例模式、策略模式、代理模式、原型模式浅讲

1. 单例模式(Singleton Pattern) 确保一个类只有一个实例,并提供一个全局访问点。 示例代码: class Singleton {constructor() {if (Singleton.instance) {return Singleton.instance;}Singleton.instance = this;this.data = [];}addData(value)

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

hdu 1102 uva 10397(最小生成树prim)

hdu 1102: 题意: 给一个邻接矩阵,给一些村庄间已经修的路,问最小生成树。 解析: 把已经修的路的权值改为0,套个prim()。 注意prim 最外层循坏为n-1。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstri

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系

Thymeleaf:生成静态文件及异常处理java.lang.NoClassDefFoundError: ognl/PropertyAccessor

我们需要引入包: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId></dependency><dependency><groupId>org.springframework</groupId><artifactId>sp