图像的阻挡效应因子(Blocking Effect Factor,BEF)和PSNR-B指标原理及实现

本文主要是介绍图像的阻挡效应因子(Blocking Effect Factor,BEF)和PSNR-B指标原理及实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 参考博文:Paper | Quality assessment of deblocked images - RyanXing - 博客园 (cnblogs.com)

像的阻挡效应因子(Blocking Effect Factor,BEF)。阻挡效应是指当图像被分割成块时,相邻块之间的边界会引入人眼可见的伪影。阻挡效应因子用于评估图像中阻挡效应的程度。

PSNR-B指标,旨在衡量 压缩图像的块效应强度 或 去块效应后的残留块效应强度(比较去块效应算法的优劣)。

我们首先假设图像由整数个块(tiling)组成。例如:

 图中每一个块都是8×8的块,一共有64个。定义以下块类别:

分别代表:纵向接壤块边缘的像素对、纵向非接壤块边缘的像素对、横向接壤块边缘的像素对 和 横向非接壤块边缘的像素对。

定义两个指标:

前者代表块边缘变化强度,后者代表非块边缘(块内)变化强度。随着量化逐渐粗糙,前者的增大会明显快于后者。

还考虑一个因素:随着块增大,块效应也会逐渐明显。【反过来,如果块很小,那么远看是看不出块效应的】因此我们定义一个块效应因数(blocking effect factor, BEF):

 

 其中的η随着块尺寸的增大而增大:

 例如在H264压缩标准下,一张图像内可以有多种不同尺寸的块。此时就有:

 

 

 定义PSNR-B如下:

 

 阻挡效应因子(Blocking Effect Factor,BEF)代码实现

def _blocking_effect_factor(im):  # 计算了图像的阻挡效应因子(Blocking Effect Factor,BEF)'''阻挡效应是指当图像被分割成块时,相邻块之间的边界会引入人眼可见的伪影。阻挡效应因子用于评估图像中阻挡效应的程度。Args:im:输入的图片Returns:计算了图像的阻挡效应因子'''block_size = 8# im是一个四维的数组,代表输入的图像。通常,它的形状是(height, width, channels, frames),表示图像的高度、宽度、通道数和帧数block_horizontal_positions = torch.arange(7, im.shape[3] - 1, 8)  # 定义了一个块的大小为8个像素block_vertical_positions = torch.arange(7, im.shape[2] - 1, 8)horizontal_block_difference = ((im[:, :, :, block_horizontal_positions] - im[:, :, :, block_horizontal_positions + 1]) ** 2).sum(3).sum(2).sum(1)  # 计算图像中水平方向上相邻像素之差的平方vertical_block_difference = ((im[:, :, block_vertical_positions, :] - im[:, :, block_vertical_positions + 1, :]) ** 2).sum(3).sum(2).sum(1)  # 计算图像中竖直方向上相邻像素之差的平方nonblock_horizontal_positions = np.setdiff1d(torch.arange(0, im.shape[3] - 1), block_horizontal_positions)nonblock_vertical_positions = np.setdiff1d(torch.arange(0, im.shape[2] - 1), block_vertical_positions)horizontal_nonblock_difference = ((im[:, :, :, nonblock_horizontal_positions] - im[:, :, :, nonblock_horizontal_positions + 1]) ** 2).sum(3).sum(2).sum(1)vertical_nonblock_difference = ((im[:, :, nonblock_vertical_positions, :] - im[:, :, nonblock_vertical_positions + 1, :]) ** 2).sum(3).sum(2).sum(1)# np.setdiff1d()函数来找到两个数组之间的差异,然后计算了图像中水平和垂直方向上非块(non-block)位置的像素差值的平方和n_boundary_horiz = im.shape[2] * (im.shape[3] // block_size - 1)n_boundary_vert = im.shape[3] * (im.shape[2] // block_size - 1)boundary_difference = (horizontal_block_difference + vertical_block_difference) / (n_boundary_horiz + n_boundary_vert)n_nonboundary_horiz = im.shape[2] * (im.shape[3] - 1) - n_boundary_horizn_nonboundary_vert = im.shape[3] * (im.shape[2] - 1) - n_boundary_vertnonboundary_difference = (horizontal_nonblock_difference + vertical_nonblock_difference) / (n_nonboundary_horiz + n_nonboundary_vert)scaler = np.log2(block_size) / np.log2(min([im.shape[2], im.shape[3]]))bef = scaler * (boundary_difference - nonboundary_difference)bef[boundary_difference <= nonboundary_difference] = 0return bef

PSNR-B代码实现

def calculate_psnrb(img1, img2, crop_border, input_order='HWC', test_y_channel=False):"""Calculate PSNR-B (Peak Signal-to-Noise Ratio).Ref: Quality assessment of deblocked images, for JPEG image deblocking evaluation# https://gitlab.com/Queuecumber/quantization-guided-ac/-/blob/master/metrics/psnrb.pyArgs:img1 (ndarray): Images with range [0, 255].img2 (ndarray): Images with range [0, 255].crop_border (int): Cropped pixels in each edge of an image. Thesepixels are not involved in the PSNR calculation.input_order (str): Whether the input order is 'HWC' or 'CHW'.Default: 'HWC'.test_y_channel (bool): Test on Y channel of YCbCr. Default: False.Returns:float: psnr result."""assert img1.shape == img2.shape, (f'Image shapes are differnet: {img1.shape}, {img2.shape}.')if input_order not in ['HWC', 'CHW']:raise ValueError(f'Wrong input_order {input_order}. Supported input_orders are ' '"HWC" and "CHW"')img1 = reorder_image(img1, input_order=input_order)  # 调整图片维度顺序为HWCimg2 = reorder_image(img2, input_order=input_order)img1 = img1.astype(np.float64)  # 图片类型转换img2 = img2.astype(np.float64)if crop_border != 0:img1 = img1[crop_border:-crop_border, crop_border:-crop_border, ...]  # 去除图片的边缘像素img2 = img2[crop_border:-crop_border, crop_border:-crop_border, ...]if test_y_channel:img1 = to_y_channel(img1)  # Y通道颜色空间转换img2 = to_y_channel(img2)# follow https://gitlab.com/Queuecumber/quantization-guided-ac/-/blob/master/metrics/psnrb.pyimg1 = torch.from_numpy(img1).permute(2, 0, 1).unsqueeze(0) / 255.img2 = torch.from_numpy(img2).permute(2, 0, 1).unsqueeze(0) / 255.# torch.from_numpy(img1)将NumPy数组img1转换为PyTorch张量,unsqueeze(0)将张量的维度扩展一个单位,以添加一个虚拟的批次维度# permute(2, 0, 1)用于对张量进行维度重排,将原始图像的通道维度从最后一维移动到第一维,# 行维度移动到第二维,列维度移动到第三维。这是为了与PyTorch默认的通道维度顺序(即[batch_size, channel, height, width])保持一致# img1和img2被转换为形状为[1, channel, height, width]的PyTorch张量,并且它们的值被归一化到0到1之间total = 0for c in range(img1.shape[1]):  # img1.shape[1]是通道的数量mse = torch.nn.functional.mse_loss(img1[:, c:c + 1, :, :], img2[:, c:c + 1, :, :], reduction='none')# 计算均方误差(Mean Square Error,简称MSE)损失。它用于衡量模型的预测结果与目标值之间的差异bef = _blocking_effect_factor(img1[:, c:c + 1, :, :])  # 计算阻塞效应因子的临时结果befmse = mse.view(mse.shape[0], -1).mean(1)# 调整mse的形状,将其转换为二维张量,其中每一行表示一个样本(这里只有一个样本),每一列表示样本的一个特征total += 10 * torch.log10(1 / (mse + bef))return float(total) / img1.shape[1]

 

这篇关于图像的阻挡效应因子(Blocking Effect Factor,BEF)和PSNR-B指标原理及实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/744818

相关文章

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

通过SSH隧道实现通过远程服务器上外网

搭建隧道 autossh -M 0 -f -D 1080 -C -N user1@remotehost##验证隧道是否生效,查看1080端口是否启动netstat -tuln | grep 1080## 测试ssh 隧道是否生效curl -x socks5h://127.0.0.1:1080 -I http://www.github.com 将autossh 设置为服务,隧道开机启动

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为

vue项目集成CanvasEditor实现Word在线编辑器

CanvasEditor实现Word在线编辑器 官网文档:https://hufe.club/canvas-editor-docs/guide/schema.html 源码地址:https://github.com/Hufe921/canvas-editor 前提声明: 由于CanvasEditor目前不支持vue、react 等框架开箱即用版,所以需要我们去Git下载源码,拿到其中两个主

android一键分享功能部分实现

为什么叫做部分实现呢,其实是我只实现一部分的分享。如新浪微博,那还有没去实现的是微信分享。还有一部分奇怪的问题:我QQ分享跟QQ空间的分享功能,我都没配置key那些都是原本集成就有的key也可以实现分享,谁清楚的麻烦详解下。 实现分享功能我们可以去www.mob.com这个网站集成。免费的,而且还有短信验证功能。等这分享研究完后就研究下短信验证功能。 开始实现步骤(新浪分享,以下是本人自己实现

基于Springboot + vue 的抗疫物质管理系统的设计与实现

目录 📚 前言 📑摘要 📑系统流程 📚 系统架构设计 📚 数据库设计 📚 系统功能的具体实现    💬 系统登录注册 系统登录 登录界面   用户添加  💬 抗疫列表展示模块     区域信息管理 添加物资详情 抗疫物资列表展示 抗疫物资申请 抗疫物资审核 ✒️ 源码实现 💖 源码获取 😁 联系方式 📚 前言 📑博客主页:

探索蓝牙协议的奥秘:用ESP32实现高质量蓝牙音频传输

蓝牙(Bluetooth)是一种短距离无线通信技术,广泛应用于各种电子设备之间的数据传输。自1994年由爱立信公司首次提出以来,蓝牙技术已经经历了多个版本的更新和改进。本文将详细介绍蓝牙协议,并通过一个具体的项目——使用ESP32实现蓝牙音频传输,来展示蓝牙协议的实际应用及其优点。 蓝牙协议概述 蓝牙协议栈 蓝牙协议栈是蓝牙技术的核心,定义了蓝牙设备之间如何进行通信。蓝牙协议

python实现最简单循环神经网络(RNNs)

Recurrent Neural Networks(RNNs) 的模型: 上图中红色部分是输入向量。文本、单词、数据都是输入,在网络里都以向量的形式进行表示。 绿色部分是隐藏向量。是加工处理过程。 蓝色部分是输出向量。 python代码表示如下: rnn = RNN()y = rnn.step(x) # x为输入向量,y为输出向量 RNNs神经网络由神经元组成, python

利用Frp实现内网穿透(docker实现)

文章目录 1、WSL子系统配置2、腾讯云服务器安装frps2.1、创建配置文件2.2 、创建frps容器 3、WSL2子系统Centos服务器安装frpc服务3.1、安装docker3.2、创建配置文件3.3 、创建frpc容器 4、WSL2子系统Centos服务器安装nginx服务 环境配置:一台公网服务器(腾讯云)、一台笔记本电脑、WSL子系统涉及知识:docker、Frp

基于 Java 实现的智能客服聊天工具模拟场景

服务端代码 import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintWriter;import java.net.ServerSocket;import java.net.Socket;public class Serv