[论文阅读]Color2Gray :Salience-Preserving Color Removal

2023-10-07 02:10

本文主要是介绍[论文阅读]Color2Gray :Salience-Preserving Color Removal,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《计算机图形与图像处理》课程阅读论文——Color2Gray :Salience-Preserving Color Removal

Amy A. Gooch, Sven C. Olsen, Jack Tumblin, and Bruce Gooch. 2005. Color2Gray: salience-preserving color removal. In ACM SIGGRAPH 2005 Papers (SIGGRAPH ’05). Association for Computing Machinery, New York, NY, USA, 634–639.


Abstract

当彩色图像转换成灰度图像时,在视觉上会丢失重要的图片特征。论文提出了通过尝试保留彩色图像中重要的特征来减少其丢失的算法:Color2Gray

算法的基本思想:

CIE L^{*}a^{*}b^{*}色度平面(chrominance plane)进行有符号的色度距离计算,将原始图像(source image)的色度和亮度变化映射到灰度图像中以创建保留彩色图像显著特征的目

标图像。

算法主要包括三个步骤:

1.将输入的RGB图像转换到感知均匀(perceptually uniform)的CIE L^{*}a^{*}b^{*};

  • L表示图形的亮度,范围从0到100,0表示黑色,100表示白色。L的值越大亮度越高。
  • a表示从绿色到红色的分量,数值从负到正对应颜色从绿到红,例如-128……+127
  • b表示从蓝色到红色的分量,数组从负到正对应颜色从蓝到黄,例如-128……+127
  • 感知均匀:当Lab数值的变化幅度一样,给人带来视觉上的变化幅度相差不大

2.使用相邻像素色度差异(chrominance differences)和亮度差异(luminance differences)创建目标灰度图像差异(grayscale target differences);

3.将其转化为优化问题:根据原图像的色度变化有选择地调节灰度表示。

 

Introduction

1.若数字图像仅被看做是光学记录,那么灰度图像仅需要使用平坦光谱相应(flat spectral response)记录其光强度。但是我们希望数字图像能保留一些有意义的视觉体验,即使是在灰度图像上。

2.仅通过近似光谱均匀性构建彩色图像的灰度映射是严重不足的,因为仅有色度差异的单色视觉线索会丢失。

3.视觉科学家认为,人类视觉系统并不能感知绝对的值,相反,色度和亮度感知是基于相对评估的,在某种程度上是由于早期视觉处理阶段的细胞中心-周围组织( center-surround organization)。

 

Related Work

1.传统的将RGB图像转换成灰度图像的方法:点乘、加权和-->将三维颜色空间映射到一维空间。

2.彩色图像到灰度图像的转换是一个维度降低问题(dimensionality reduction problem)。

  • PCA(principal component analysis)
    • 计算颜色空间的椭球体-->是适合所有图像颜色值组成的点的最小二乘解法。
    • 可以将图像中的颜色值投影到由椭球体主轴定义的亮度轴(luminance axis)上。
    • PCA的有效性取决于颜色空间(color space)。
    • 主轴和副轴的比例越大,就越有可能为不同的颜色创建不同的灰度值。

 

  • Space-filling curves
    • 在颜色空间中创建簇,并且使用空间填充曲线(space-filling curves)3维颜色空间的1维参数。

Algorithm-->Color2Gray

1.基本思路

(1)将输入的RGB图像转换到感知均匀(perceptually uniform)的颜色空间-->CIE L^{*}a^{*}b^{*},因为其欧氏距离与感知差异性密切相关;

(2)结合颜色差异(color differences),即亮度和色度差异计算目标差异(target differences);

对于像素i和周围(neighbor)像素j:

使用有符号距离标量δ-->亮度和色度差异

灰度图像j-->g_{ij}=(g_{i}-g_{j})表征灰度值差异(grayscale difference),即目标差异(target differences)

目的:找到最优的g使得g_{ij}接近δ

(3)使用最小二乘法(a least squares optimization)有选择性地调整原图像的亮度差异以影响原图像的色度差异。

2.计算目标差异(target differences)

  • CIE L^{*}a^{*}b^{*}空间:
    • Luminance difference:\bigtriangleup L_{ij}=L_{i}-L_{j}
    • the a^{*} channel difference:\bigtriangleup A_{ij}
    • the b^{*} channel difference:\bigtriangleup B_{ij}
    • chrommatic difference vector:\overrightarrow{\bigtriangleup C_{ij}}=\bigtriangleup A_{ij}-\bigtriangleup B_{ij}
  • 引入参数θ:
    • 划分\Delta a^{*}\Delta b^{*} 的色度平面(chrominance plane),并且决定色度的差异是否会使得原图像亮度差异加深或减轻。
    • \overrightarrow{v_{\theta }}定义为θ相对于\Delta a^{*}的轴的归一化向量

  • 引入参数α:

控制应用于原图像亮度值的色度变化量

下图中参数α取值分别为5,10,25

  • 引入参数μ:控制像素的相邻像素尺寸(neighborhood size)
  • 目标差异(tatgrt differences)

Given:crunch(x)=\alpha *tanh(\frac{x}{\alpha }),\overrightarrow{v_{\theta }}=\left ( \cos \theta ,\sin \theta \right )

then:\delta \left ( \alpha ,\theta \right )_{ij}= \left\{\begin{matrix}\Delta L_{ij},if\left | \Delta L_{ij}\right |>crunch\left ( \left \| \overrightarrow{\Delta C_{ij}} \right \| \right ) \\ crunch\left ( \left \| \overrightarrow{\Delta C_{ij}} \right \| \right ),if \overrightarrow{\Delta C_{ij}}\cdot \overrightarrow{v_{\theta }}\geq 0 \\ crunch\left ( -\left \| \overrightarrow{\Delta C_{ij}} \right \| \right ),otherwise. \end{matrix}\right.

 

3.解决优化问题

使用共轭梯度法(conjugate gradient iterations)最小化目标函数f(g):

f\left ( g \right )= \sum _{(i,j)\displaystyle \in K}\left ( \left ( g_{i} -g_{j}\right ) -\delta _{ij}\right )^{2}

移动像素:

f\left ( g \right )=f\left ( g+c \right )

由于f(g)是凸函数,存在多个全局最小解

Conclusion

1.算法的性能

  • 解决优化问题的代价与邻域K成正比:对于S*S的图像,若邻域为整张图像,时间复杂度为O(S^{4});若邻域为μ*μ,时间复杂度为O\left ( S^{2}\mu ^{2} \right )
  • 当邻域为整张图片时,算法处理时间

100*100:12.7s

150*150:65.6s

200*200:204.0s

2.局限性

  • 在将具有大范围色度梯度进行映射到可区分的灰度图像时表现不佳

 

  • 对于高动态场景,特别是自然场景,算法不能提供大的提升

3.结果展示

 

 

 

 

 

 

 

 

这篇关于[论文阅读]Color2Gray :Salience-Preserving Color Removal的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/155387

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

三色标记(Tri-color marking)

维基百科部分 原文 https://en.wikipedia.org/wiki/Tracing_garbage_collection#TRI-COLOR Because of these performance problems, most modern tracing garbage collectors implement some variant of the tri-color ma

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

[论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

引言 今天带来第一篇量化论文LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale笔记。 为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。 大语言模型已被广泛采用,但推理时需要大量的GPU内存。我们开发了一种Int8矩阵乘法的过程,用于Transformer中的前馈和注意力投影层,这可以将推理所需