图像质量的评价指标【PSNR/SSIM/LPIPS/IE/NIE/Prepetual loss】

2024-02-05 14:30

本文主要是介绍图像质量的评价指标【PSNR/SSIM/LPIPS/IE/NIE/Prepetual loss】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

做插帧这么久了,这几个指标还没系统的研究过,这次开一个博客写下这几个指标的区别
这里贴一个比较全的评价指标的库https://github.com/csbhr/OpenUtility/tree/c9cf713c99523c0a2e0be6c2afa988af751ad161
以以下两张图为例
预测图片
在这里插入图片描述
真实图片
在这里插入图片描述

MSE

MSE(mean squared error)均方误差
公式如下:
在这里插入图片描述
即两张图片对应像素点数的差的平方求平均,这里可以理解为带噪声图像与干净图像之间的噪声
对于这两张0-255的取值范围的图片,MSE的值为20.3308
对于上图真值图片和一张全黑图片(值为0),MSE的值为15907.2259
对于全白图片和全黑图片,MSE的值为255*255=65025

而将该两张图片过Tensor后缩放成0-1之间,MSE的值为0.0003
显然,MSE的值的大小和图片本身是有关的

PSNR

PSNR(Peak Signal-to-Noise Ratio)
PSNR即峰值信噪比,衡量的是对应像素之间的相近程度
公式如下
在这里插入图片描述
MSE即上图的均方误差。MAXI为图像中像素颜色的可以取到的最大数值,即255
PSNR则是反映MSE的相对大小情况
如上图与真值的PSNR为35.054(Unit8)
将上图缩放为0-1之间,PSNR为35.229(float64)
这两种情况的取值不一样!!!

以及,直接用unit8相减减不出负值,会溢出,而平方的取值范围达不到,最后的MSE的值会不准,导致PSNR结果不对
至于峰值信噪比和信噪比之间的关系(信噪比我理解的是预测图片像素值的均方和),这里我理解的是将图片的信号值变成最大数值,可以规避掉图片由于RGB绝对值很小带来的PSNR值很小的情况,导致同样噪声情况下,亮度值大的图片比亮度值小的图片PSNR值高

这里还值得注意的是,若MSE的值为0,会导致PSNR取值无限大,因此会采用加上一个小的值到MSE上,进行截断,比如加上1e-8,因此PSNR最大值为128.13080360867912
而MAX平方/MSE永远>=1,因此PSNR的值不会为负(是负的就是算错了分子分母上下的值没搞对)

SSIM

【论文】
SSIM(structural similarity index)结构性相似指标
评价一张图片的亮度 (luminance )、对比度 (contrast ) 和结构 (structure)
在这里插入图片描述
亮度用均值表示
标准差,协方差作为对比度的表示
在这里插入图片描述
作为结构的表示
SSIM和PSNR的差别
a作为gt,以下5张图有着同样的PSNR值,但是SSIM值差别很大
在这里插入图片描述
同时,SSIM只是计算的一个小窗口内图像的亮度、对比度、结构的值得相似程度(三者是不相关的),通过逐像素滑窗求平均,可以得到整幅图像的MSSIM
在这里插入图片描述

LPIPS

Learned Perceptual Image Patch Similarity (LPIPS) 感知图像块相似性
来源于CVPR2018年的一篇论文【here】
其主要思想是用CNN网络学到一些深层特征,再求得两张图片的深层特征之间的距离
网络的搭建如下:
在这里插入图片描述
首先F即是不同的CNN网络,有Alexnet,VGG,squeeze,过了网络之后得到不同层的特征图y,将这些特征图在通道维进行单位归一化,
然后对特征维的不同通道乘上一个缩放因子,再将两张图的特征做l2损失,最后不同层的特征求得损失求平均得到一个距离d0=(x,x0)
在这里插入图片描述

而右边的预测感知评价则是跟数据集有关。这里作者先介绍了一种评价图片相似程度的准则,2AFC similarity judgments,简称AFC,一组图片中有三张图片组成,其中两张图片分别与另一张图片配对,得到(x,x0)(x,x1),然后由人去判断哪张图片与参考图片更相似一点,最后两个配对的置信度分别由支持人数的比例构成,比如5个人里4个人觉得第一组更接近,那么第一组的置信度就是80%,第二组就是20%,最后这一组三张图片回答得到一个总的分数,总的分数的计算规则为p * p+(1-p) * (1-p)

因此通过网络G,将输入的两组距离映射得到一个输出分数,与地面真值相比使最终的损失最小

并提出三种不同的训练策略:-lin ,只训练最后一层的分类头,-tune,预训练之后做微调,-scratch高斯初始化后从头训
这是一些作者给出的结果,可以看到在认为设计的扭曲数据集上和算法生成的扭曲的数据集上,LPIPS 得到的分数都是跟人最接近的
在这里插入图片描述
用起来也比较简单,导个包就好了,作者再代码主页也介绍得比较详尽了

这篇关于图像质量的评价指标【PSNR/SSIM/LPIPS/IE/NIE/Prepetual loss】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/681211

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

zeroclipboard 粘贴板的应用示例, 兼容 Chrome、IE等多浏览器

zeroclipboard单个复制按钮和多个复制按钮的实现方法 最近网站改版想让复制代码功能在多个浏览器上都可以实现,最近看网上不少说我们的代码复制功能不好用的,我们最近将会增加代码高亮等功能,希望大家多多支持我们 zeroclipboard是一个跨浏览器的库类 它利用 Flash 进行复制,所以只要浏览器装有 Flash 就可以运行,而且比 IE 的

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

HalconDotNet中的图像特征与提取详解

文章目录 简介一、边缘特征提取二、角点特征提取三、区域特征提取四、纹理特征提取五、形状特征提取 简介   图像特征提取是图像处理中的一个重要步骤,用于从图像中提取有意义的特征,以便进行进一步的分析和处理。HalconDotNet提供了多种图像特征提取方法,每种方法都有其特定的应用场景和优缺点。 一、边缘特征提取   边缘特征提取是图像处理中最基本的特征提取方法之一,通过检

超越IP-Adapter!阿里提出UniPortrait,可通过文本定制生成高保真的单人或多人图像。

阿里提出UniPortrait,能根据用户提供的文本描述,快速生成既忠实于原图又能灵活调整的个性化人像,用户甚至可以通过简单的句子来描述多个不同的人物,而不需要一一指定每个人的位置。这种设计大大简化了用户的操作,提升了个性化生成的效率和效果。 UniPortrait以统一的方式定制单 ID 和多 ID 图像,提供高保真身份保存、广泛的面部可编辑性、自由格式的文本描述,并且无需预先确定的布局。

风控系统之指标回溯,历史数据重跑

个人博客:无奈何杨(wnhyang) 个人语雀:wnhyang 共享语雀:在线知识共享 Github:wnhyang - Overview 回顾 默认你已经看过之前那篇风控系统指标计算/特征提取分析与实现01,Redis、Zset、模版方法。 其中已经介绍了如何利用redis的zset结构完成指标计算,为了方便这篇文章的介绍,还是在正式开始本篇之前回顾一下。 时间窗口 zset

Winfrom中解决图像、文字模糊的方法

1.添加清单 2.将清单中的下面内容取消注释

使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意

引言 什么是Amazon Bedrock? Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI以及亚马逊自身)开发的多种基础模型(Foundation Models,简称FMs)。