数字水印 | 图像标准化论文:Digital Watermarking Robust to Geometric Distortions(二)

本文主要是介绍数字水印 | 图像标准化论文:Digital Watermarking Robust to Geometric Distortions(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

      • C 变换参数的确定
      • D 水印的影响
      • E 可替代的标准化过程



🤖原文: Digital Watermarking Robust to Geometric Distortions

🤖前言: 这是一篇 2005 年的 SCI 一区 + CCF-A,但是网上关于它的讲解貌似挺少的。文中提出了两种数字水印方案,但是我只关注第一种方案中的图像标准化技术。由于本人很菜,因此可能存在翻译或者理解的错误,请各位指正!



C 变换参数的确定

在本节中,我们展示了如何确定与变换相关的参数,使它们达到各自的标准化目标。



矩阵 A x = ( 1 β 0 1 ) \mathbf{A}_x=\begin{pmatrix} 1 & \beta \\ 0 & 1 \end{pmatrix} Ax=(10β1)

回顾前文公式:

μ p q ′ = ∑ i = 0 p ∑ j = 0 q ( p i ) T ( q j ) a 11 i ⋅ a 12 p − i ⋅ a 21 j ⋅ a 22 q − j ⋅ μ i + j , p + q − i − j \mu'_{pq} = \sum_{i=0}^{p}\sum_{j=0}^{q} \begin{pmatrix} p \\ i \end{pmatrix}^T \begin{pmatrix} q \\ j \end{pmatrix} a^i_{11}\cdot a^{p-i}_{12}\cdot a^{j}_{21}\cdot a^{q-j}_{22}\cdot \mu_{i+j,p+q-i-j} μpq=i=0pj=0q(pi)T(qj)a11ia12pia21ja22qjμi+j,p+qij

个人理解:这里提到前文公式,是为了告诉读者 μ 30 ( 2 ) \mu^{(2)}_{30} μ30(2) 是怎么求出来的。应该就是把 p , q p,q p,q 和矩阵 A x \mathbf{A}_x Ax 中的参数代入上式,从而得到 μ 30 ( 2 ) \mu^{(2)}_{30} μ30(2)。可是我代入进去的结果不对啊?这里的转置是我自己加的,不加求不了矩阵乘法啊!

我们得到:

μ 30 ( 2 ) = μ 30 ( 1 ) + 3 β μ 21 ( 1 ) + 3 β 2 μ 12 ( 1 ) + β 3 μ 03 ( 1 ) \mu^{(2)}_{30}=\mu^{(1)}_{30}+3\beta\mu^{(1)}_{21}+3\beta^2\mu^{(1)}_{12}+\beta^3\mu^{(1)}_{03} μ30(2)=μ30(1)+3βμ21(1)+3β2μ12(1)+β3μ03(1)

其中, μ p q ( 1 ) \mu^{(1)}_{pq} μpq(1) 是图像 f 1 ( x , y ) f_1(x,y) f1(x,y) 的中心矩。

μ 30 ( 2 ) = 0 \mu^{(2)}_{30}=0 μ30(2)=0,我们得到:

μ 30 ( 1 ) + 3 β μ 21 ( 1 ) + 3 β 2 μ 12 ( 1 ) + β 3 μ 03 ( 1 ) = 0 \mu^{(1)}_{30}+3\beta\mu^{(1)}_{21}+3\beta^2\mu^{(1)}_{12}+\beta^3\mu^{(1)}_{03}=0 μ30(1)+3βμ21(1)+3β2μ12(1)+β3μ03(1)=0

参数 β \beta β 就是通过这个式子得到的。

注意到上式在 μ 03 ( 1 ) ≠ 0 \mu^{(1)}_{03}\neq 0 μ03(1)=0 的情况下最多可以有三个根,这对于大多数自然图像来说是普遍成立的。特别地,我们可能有以下两种情况:

  • 三个根中一个是实根,另外两个是复根;
  • 三个根都是实根。

对于第一种情况,我们简单地取 β \beta β 为实根;对于第二种情况,我们取 β \beta β 为三个实根的中位数。参见附录,这样的选择保证了得到的标准化图像的唯一性。

当然,在一些非常不寻常的条件下,根的个数可能会发生变化。例如,当上式涉及到的所有矩都为 0 0 0 时,它将有无穷多个解。这可以发生在图像是旋转对称的时候,比如圆盘或者圆环。我们参考文献 [16] 和 [17] 来更详细地介绍一般的标准化过程。




矩阵 A y = ( 1 0 γ 1 ) \mathbf{A}_y=\begin{pmatrix} 1 & 0 \\ \gamma & 1 \end{pmatrix} Ay=(1γ01)

回顾前文公式:

μ p q ′ = ∑ i = 0 p ∑ j = 0 q ( p i ) T ( q j ) a 11 i ⋅ a 12 p − i ⋅ a 21 j ⋅ a 22 q − j ⋅ μ i + j , p + q − i − j \mu'_{pq} = \sum_{i=0}^{p}\sum_{j=0}^{q} \begin{pmatrix} p \\ i \end{pmatrix}^T \begin{pmatrix} q \\ j \end{pmatrix} a^i_{11}\cdot a^{p-i}_{12}\cdot a^{j}_{21}\cdot a^{q-j}_{22}\cdot \mu_{i+j,p+q-i-j} μpq=i=0pj=0q(pi)T(qj)a11ia12pia21ja22qjμi+j,p+qij

我们得到:

μ 11 ( 3 ) = γ μ 20 ( 2 ) + μ 11 ( 2 ) \mu^{(3)}_{11}=\gamma\mu^{(2)}_{20}+\mu^{(2)}_{11} μ11(3)=γμ20(2)+μ11(2)

μ 11 ( 3 ) = 0 \mu^{(3)}_{11}=0 μ11(3)=0,我们得到:

γ = − μ 11 ( 2 ) μ 20 ( 2 ) \gamma=-\frac{\mu^{(2)}_{11}}{\mu^{(2)}_{20}} γ=μ20(2)μ11(2)

因此,参数 γ \gamma γ 具有唯一的解。




矩阵 A s = ( α 0 0 δ ) \mathbf{A}_s=\begin{pmatrix} \alpha & 0 \\ 0 & \delta \end{pmatrix} As=(α00δ)

缩放参数 α \alpha α δ \delta δ 的大小通过在水平和垂直方向上将图像 f 3 ( x , y ) f_3(x,y) f3(x,y) 缩放到规定的标准尺寸来确定。它们的符号都是确定的,这样 μ 50 ( 4 ) \mu^{(4)}_{50} μ50(4) μ 05 ( 4 ) \mu^{(4)}_{05} μ05(4) 都是正的,可以通过水平翻转或垂直翻转来改变。

简而言之,参数 α \alpha α δ \delta δ 的大小是根据规定的标准尺寸确定的,标准尺寸的大小决定了参数 α \alpha α δ \delta δ 的取值。由于缩放倍数是非负的,因此参数 α \alpha α δ \delta δ 的符号一定为正(?)



D 水印的影响

值得注意的是,对于水印嵌入,标准化是对原始图像进行的;对于水印提取,标准化是对含水印图像进行的。因此,重要的是设计水印信号,使其对标准化图像的影响最小。

w ( x , y ) w(x,y) w(x,y) 表示添加到原始图像 f ( x , y ) f(x,y) f(x,y) 中的水印信号。令 m p q ( w ) m^{(w)}_{pq} mpq(w) 表示 w ( x , y ) w(x,y) w(x,y) 的原点矩。根据前文公式:

d 1 = m 10 m 00 , d 2 = m 01 m 00 d_1=\frac{m_{10}}{m_{00}},\ d_2=\frac{m_{01}}{m_{00}} d1=m00m10, d2=m00m01
可以取 m 10 ( w ) = m 01 ( w ) = 0 m^{(w)}_{10}=m^{(w)}_{01}=0 m10(w)=m01(w)=0,使得 w ( x , y ) w(x,y) w(x,y) 对标准化过程的中心步骤没有影响。

此外,我们希望对于 p + q p+q p+q 等于 2 2 2 3 3 3 m p q ( w ) = 0 m^{(w)}_{pq}=0 mpq(w)=0,使得水印不影响其余的标准化变换。这里假设 w ( x , y ) w(x,y) w(x,y) f ( x , y ) f(x,y) f(x,y) 是统计独立的,因此它们的二阶和三阶中心矩是可加的。

正如后面将要讨论的那样,水印是由零均值高斯或均匀源产生的 C D M A \mathsf{CDMA} CDMA 信号,它被添加到图像的中频 D C T \mathsf{DCT} DCT 系数中。从我们的数值例子可以看出,这样的水印几乎满足上述所描述的所有期望的性质,并且对标准化图像几乎没有影响。



E 可替代的标准化过程

上述标准化过程由一系列初等仿射变换(即剪切和缩放操作)组成。我们指出,其他变换过程也可以用类似的方式构造,以实现标准化图像中的放射变换不变性。比如以下过程:
A = ( c o s ϕ s i n ϕ − s i n ϕ c o s ϕ ) ( α 0 0 δ ) ( 1 β 0 1 ) \mathbf{A}=\begin{pmatrix} cos\phi & sin\phi \\ -sin\phi & cos\phi \end{pmatrix} \begin{pmatrix} \alpha & 0 \\ 0 & \delta \end{pmatrix} \begin{pmatrix} 1 & \beta \\ 0 & 1 \end{pmatrix} A=(cosϕsinϕsinϕcosϕ)(α00δ)(10β1)
其中包括:

  • 1)在 x x x 方向上的剪切;
  • 2 )在 x x x 方向和 y y y 方向上的缩放;
  • 3)旋转 ϕ \phi ϕ 角度;

上述过程中的参数可以通过执行每个步骤的一组预定义的矩来确定。感兴趣的读者可以参考文献 [15]。



这篇关于数字水印 | 图像标准化论文:Digital Watermarking Robust to Geometric Distortions(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/997013

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

[论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

引言 今天带来第一篇量化论文LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale笔记。 为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。 大语言模型已被广泛采用,但推理时需要大量的GPU内存。我们开发了一种Int8矩阵乘法的过程,用于Transformer中的前馈和注意力投影层,这可以将推理所需

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.