图像处理之《生成式隐写研究》论文阅读

本文主要是介绍图像处理之《生成式隐写研究》论文阅读，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

这是一篇关于生成式隐写的中文综述文章

一、文章摘要

隐写术通常将秘密信息以不可见的形式隐藏到载体中，从而通过传递含密载体实现隐蔽通信。嵌入式隐写方案通过修改载体将秘密信息嵌入其中，但会不可避免地改变载体的统计特性，因此难以抵抗各类隐写分析工具的检测。为了解决此问题，生成式隐写方案以秘密信息为驱动直接生成含密载体。相比于嵌入式隐写方案，生成式隐写方案针对现有基于统计特征的隐写分析方法具有较好的抗检测性能，因此逐渐成为信息隐藏领域的研究热点。本文首先对四类生成式隐写方案进行详细地描述和分析，包括：(1)图像生成式隐写方案；(2)文本生成式隐写方案；(3)音频生成式隐写方案；(4)社交网络行为生成式隐写方案；其次，通过实验详细分析和对比了各种图像和文本生成式隐写方法的性能；最后，本文分析了当前生成式隐写方案仍然存在的问题，并提出相应的解决方案和展望未来的发展方向。

在这里插入图片描述
二、生成式隐写方案分类

根据生成的含密载体类型，本文将现有的生成式隐写方案分为以下四大类：(1）图像生成式隐写方案；(2) 文本生成式隐写方案；(3）音频生成式隐写方案；(4）社交网络行为生成式隐写方案；根据隐写方式的不同，每类生成式隐写方案又可以进一步细分为若干个子类。

在这里插入图片描述

三、图像生成式隐写方案

根据秘密信息表达方式的不同，本文将现有的图像生成式隐写方案分为基于像素定义的图像生成式隐写方案、基于低层特征映射的图像生成式隐写方案、基于高层特征关联的图像生成式隐写方案以及基于隐空间映射的图像生成式隐写方案，如表1所示。

在这里插入图片描述

3.1 基于像素定义的图像生成式隐写方案

基于像素定义的图像生成式隐写方案主要有两类。一类方法将秘密信息编码为图像的像素值从而构造整幅图像；另一类方法先将秘密信息映射到图像中部分指定位置像素值，然后利用图像生成技术补全图像的剩余部分。

在这里插入图片描述
3.2 基于低层特征映射的图像生成式隐写方案

为了解决基于像素定义的图像生成式隐写的鲁棒性较低问题，部分研究者提出了基于低层特征映射的图像生成式隐写方案。该类方案将秘密信息映射为图像的低层特征(如纹理、轮廓等)，然后生成具有此特征的含密图像。

在这里插入图片描述

3.3 基于高层特征关联的图像生成式隐写方案

为了进一步提升含密图像的生成质量，一些研究者提出了基于高层特征关联的图像生成式隐写方案。该类方案将秘密信息编码为图像的特定高层特征(例如图像的语义信息、图像的风格特征等)，并生成符合该特征的含密图像。

在这里插入图片描述

3.4 基于隐空间映射的图像生成式隐写方案

一些研究者发现自然图像通常服从特殊的复杂分布，通过神经网络能够学习到图像空间分布与某隐空间分布(如高维高斯分布等)的映射规则根据以上研究成果启发，基于隐空间映射的图像生成式隐写方案通过构建秘密信息与隐空间向量的映射规则，将秘密信息映射为隐向量并转换为相应的图像。该图像可以作为含密图像从而实现隐蔽通信。

在这里插入图片描述

四、文本生成式隐写方案

早期的文本隐写方案大多数是通过修改文本实现信息隐藏的嵌入式隐写方案。然而，相比图像载体，文本载体的数据量小，存在的冗余修改空间有限，因此修改文本的嵌人式隐写方式不利于大量秘密信息的隐写。随着自然语言处理技术的发展，文本生成模型生成的文本质量越来越高，这为文本生成式隐写的发展奠定了坚实的基础。本节根据生成文本所使用生成模型的不同，将现有的文本生成式隐写方案分为以下两类：基于马尔科夫模型的文本生成式隐写方案和基于神经网络模型的文本生成式隐写方案。文本生成式隐写方案的分类对比如表6所示。

在这里插入图片描述

4.1 基于马尔科夫模型的文本生成式隐写方案

马尔科夫模型可以根据自然文本中邻近单词的出现频次对文本进行建模。因此，早期的文本生成式隐写方法大多使用马尔科夫模型生成含密文本。该类方案首先通过马尔科夫模型对自然文本中每个单词出现的频率进行统计，近似获得单词的概率，然后根据秘密信息选择相应概率的单词以生成含密文本，在生成文本的过程中实现隐写。

在这里插入图片描述

4.2 基于神经网络模型的文本生成式隐写方案

随着深度学习技术的发展，神经网络模型成为解决文本生成领域各种问题的主流方法，更多的研究者聚焦基于神经网络模型的文本生成式隐写方案。该方案通常利用神经网络从大量真实文本样本学习文本模型，在生成过程中根据秘密信息选择相应条件概率的单词，从而实现秘密信息的隐写任务。

在这里插入图片描述

五、音频生成式隐写方案

随着心理声学模型的发展，研究者们能够用数学模型准确地描述音频，这样为音频生成式隐写技术的发展奠定了基础。本节根据秘密信息在生成音频载体过程中的隐藏规则，将现有的音频生成式隐写方案分为基于旋律构造的音频生成式隐写方案、基于上下文推理的音频生成式隐写方案、基于隐空间映射的音频生成式隐写方案。音频生成式隐写方案的分类如表9所示。

在这里插入图片描述

5.1 基于旋律构造的音频生成式隐写方案

由于旋律是音频的主要要素之一，研究者们以秘密信息为驱动生成音频的旋律，提出了基于旋律构造的音频生成式隐写方案。

5.2 基于上下文推理的音频生成式隐写方案

部分研究者提出了基于上下文推理的音频生成式隐写方案，利用神经网络学习真实音频的统计分布特性，并根据秘密信息生成符合该统计分布特性的含密音频载体。

5.3 基于隐空间映射的音频生成式隐写方案

基于隐空间映射的隐写方案将秘密信息编码为隐空间中的隐向量，然后利用可逆网络将该隐向量转换为对应的音频作为含密音频。

六、社交网络行为生成式隐写方案

社交网络如微信、微博和推特等越来越普及，极大地影响了人们的生产生活方式，已经成为人们日常生活种不可或缺的一部分。社交网络环境下的行为生成式隐写受到了广泛的关注。根据行为的类型，现有的社交网络行为生成式隐写方案主要分为：基于社交互动行为的生成式隐写方案、基于商品推荐行为的生成式隐写方案以及基于游戏操作行为的生成式隐写方案，如表10所示。

在这里插入图片描述

6.1 基于社交互动行为的生成式隐写方案

在社交网络中，如聊天、对动态点赞等互动是最为常见的行为。研究者们利用社交网络上的互动行为传递秘密信息，提出了基于社交互动行为的生成式隐写方案。

6.2 基于商品推荐行为的生成式隐写方案

在复杂的社交网络环境中需要传输的载体种类较多，针对单一类型载体所设计的隐写方案已经不能很好地满足隐写的需求。为了在社交网络环境下实现隐蔽通信，一些研究者提出了基于商品推荐行为的生成式隐写方案。然而，在商品推荐行为应用中，需要传输载体数据是一系列商品编码、订单编号等结构化数据，这类数据冗余空间较小，如果直接修改这些数据来隐藏信息将容易导致秘密信息的暴露。

6.3 基于游戏操作行为的生成式隐写方案

各种类型的游戏正成为现代休闲生活中不可或缺的娱乐方式。研究者们通过对游戏中的行为进行编码来传递秘密信息，提出了基于游戏操作行为的隐写方案。

七、实验对比与分析

本章主要对具有代表性的图像生成式隐写和文本生成式隐写方案的实验结果进行对比与分析。

7.1 图像生成式隐写方案的实验结果分析

在这里插入图片描述

7.2 文本生成式隐写方案的实验结果分析

在这里插入图片描述

八、存在的问题

相比传统的嵌入式隐写方案，生成式隐写方案针对现有基于统计特征的隐写分析方法具有较好的抗检测性能，然而仍然存在以下问题。

(1）在高隐写荷载条件下，秘密信息的提取难以达到完全无损。为了从含密载体中提取秘密信息，基于GAN模型的隐空间映射的生成式隐写方法通常利用全卷积神经网络结构来设计和训练秘密信息提取器。然而，随着隐写的荷载增加，提取器的网络模型在训练的过程中难以收敛得到全局最优解，导致提取器提取秘密信息的准确性大大降低。为了解决该问题，另一些研究者基于可逆模型如Glow 等流模型设计了隐写算法，这类模型不仅可以实现秘密信息的隐写，也支持秘密信息的直接提取。然而，以基于隐空间映射的图像生成式隐写方案为例，虽然流模型理论上是可逆的，但是将隐空间向量映射到图像空间再重新映射回隐空间后，所得到的隐向量与原隐向量存在一定的差异。这是因为流模型是将连续的隐空间和离散的图像数据建立映射关系，隐向量映射为图像数据时会产生超出固定范围的异常数据元素并有所损失，这样会显著影响秘密信息的准确提取。

(2) 含密载体生成质量的稳定性较低.生成式隐写方案通过模型生成含密载体，与嵌人式隐写方案相比，含密载体的质量较差，而且并不能保证每个含密载体都有较高质量，即生成的含密载体的质量存在稳定性较差的问题。其原因主要包括以下两点。首先，目前大多数的生成式隐写方案是基于GAN和流模型等生成网络模型实现的。GAN模型存在训练过程不稳定的问题如梯度消失和模式崩溃；流模型是在高维度的连续隐空间和连续数据空间之间建立可逆映射关系，而多媒体数据通常是离散，将连续的隐向量映射为离散的多媒体数据将会存在映射误差。因此，这两类模型均难以保证含密载体生成质量的稳定性。其次，现有的生成网络模型的生成含密载体能力是以庞大数据集上的充分训练为基础，但实际用于生成网络模型训练的数据集大小通常受限，影响生成网络模型的训练效果，进而影响含密载体的生成质量的稳定性。

(3）非空间域的抗隐写分析性能有待提高。现有的生成式隐写方案在多媒体空间域上具有较好的抵抗隐写分析能力，但在隐空间域和通信上下文域的抗隐写分析性能有待提高。①隐空间域:现有的生成网络在训练阶段，通常将服从高斯分布的隐向量映射为多媒体数据。基于隐空间映射的生成式隐写方案，首先将秘密信息映射为隐空间的隐向量，然后将该隐向量输人到训练后的生成网络模型以生成含密载体。然而，在秘密信息映射过程中，由秘密信息映射得到的隐向量难以保持高斯分布，因此攻击者可以将含密载体逆变换为隐向量，在隐空间域可以通过检测该隐向量是否符合高斯分布来判断载体是否存在隐写行为；②通信上下文语义域:当发送方与接收方进行多次隐蔽通信时，通常需要多次传递含密载体数据。然而，现有的隐写方法大多数没有考虑通信数据上下文语义关联性，那么攻击者可以通讨分析通信上下文语义关联从而轻易地检测出通信载体数据是否有可能包含秘密信息。因此为了保证含密载体图像通信的安全性，不仅需要考虑多媒体空间域的抗隐写分析性能，还需要考虑非空间域包括隐空间域、通信上下文域等其他域的抗隐写分析性能。如何同时保证生成式隐写方案在各个域同时保证具有较好的抗隐写分析性能，仍然是一个具有挑战性的问题。

九、总结与展望

相比于嵌入式隐写方案，生成式隐写方案不需要对现有的载体进行修改，而是以秘密信息为驱动直接生成含密载体，因此针对现有基于统计特征的隐写分析方法具有较好的抗检测性能，成为信息隐藏领域具有前景的发展方向。本文根据隐藏秘密信息载体的类别，将生成式隐写分类为图像生成式隐写方案、文本生成式隐写方案、音频生成式隐写方案和社交网络行为生成式隐写方案，分别对其中每一类方案进行了细分，并对其中的方法进行分析和总结。然后，本文通过大量实验，着重对图像生成式隐写方案和文本生成式隐写方案的性能进行了对比和分析。此外，本文总结了现有的生成式隐写存在的问题，包括秘密信息的提取难以达到完全无损、含密载体生成质量的稳定性较低、非空间域的抗隐写分析性能有待提高。

针对所提出的问题，提出相应的解决方案和展望未来的发展方向。

(1）针对在高隐写荷载条件下秘密信息的难以精确提取问题，拟采用基于流模型映射误差校正的生成式隐写方案。由于流模型在构建训练隐空间和多媒体空间的可逆映射时存在大量的映射误差，拟在原始流模型的映射中增加一对校正函数。一方面，在连续隐向量映射到离散多媒体数据过程中，学习一个可逆的校正函数对生成的多媒体数据进行校正；另一方面，在离散多媒体数据映射到连续隐向量映射反过程中，使用校正函数的反函数对原始生成的多媒体数据进行恢复。以上校正函数可以确保超出固定范围的异常多媒体数据校正到固定的范围内，而对其余数据元素进行微调，利用其反函数可以准确地恢复原始图像数据和隐向量，从而保证在高隐写荷载条件下秘密信息的精确提取。

(2）针对含密载体生成质量的稳定性不足的问题，拟采用基于深度自注意力变换(Transformer)网络的生成式隐写方案。与卷积网络和循环网络等网络类型相比，基于Transformer 的模型由于引入了自注意力模块，可以自动地捕获用于多媒体内容的全局依赖关系，Transformer 网络尤其是视觉自注意力变换( Vision Transformer，ViT)网络在各种计算机视觉领域上表现出强大的性能。由于目前用于含密载体生成的生成器大多利用深度卷积网络来实现含密载体的生成，而较小的卷积核很难捕获多媒体数据的有效特征。采用ViT网络设计生成式隐写模型的生成器，可以更加有效捕获多媒体数据的全局相关性，从而提高多媒体数据生成质量和稳定性。为了进一步提高多媒体数据生成质量和稳定性，拟采用自监督学习方法和训练数据自动增强方法，以高效的方式来解决现有生成式隐写方法的训练数据集不足和训练不充分的问题。

(3）针对非空间域的抗隐写分析性能不足的问题，拟采用以下解决方案：①为了提高生成式隐写方案在隐空间域的抗隐写分析性能，应确保秘密信息映射的隐向量仍是服从高斯分布的。为此，并非将秘密信息直接编码为隐向量的元素值，而是拟将秘密信息编码为隐向量元素的位置排列顺序，而元素排列位置的变化将不会改变隐向量的高斯分布特性，因此能够有效保持隐向量的高斯分布特性，从根本上提高了生成式隐写方法在隐空间域的抗隐写分析能力。②为了解决生成的含密多媒体载体在通信上下文环境中语义合理性的问题，拟从已经传递的多媒体数据(图像、文本、语音等)序列中提取语义信息，并用LSTM 建立语义序列自动生成模型，将可以得到与真实语义序列统计特性基本一致的语义序列自动生成模型。然后利用该生成模型，根据已经传递的多媒体数据序列预测当前待传递的多媒体语义信息，然后生成相应语义的含密载体多媒体数据用于隐蔽通信，有效保证了含密多媒体载体在通信上下文环境中语义的合理性，提高了生成式隐写方法在上下文语义域的抗隐写分析能力。

(4）为了进一步提高现有的生成式隐写方案的隐写容量，拟设计秘密信息到多媒体数据的高效可逆转换方式。例如：由于Zhou等的隐写方法在图像的一维轮廓上进行隐写的隐写容量有限，而图像的二维轮廓相比一维轮廓信息承载量更大。因此，在后续的研究中，可以将秘密信息转换为图像的二维轮廓，将该二维轮廓输人到生成网络模型中生成相应的含密载体图像，从而提高隐写容量。

(5）为了进一步验证生成式隐写方法的安全性,将研究面向生成式隐写的安全证明模型。随着各类隐写分析工具的发展，研究者们针对隐写的安全性通常以大量实验的方式进行评价。然而，这些实验数据来说明隐写方法针对某一种或几种隐写分析工具具有抵抗能力，难以从实验上验证对现有其他隐写分析工具和未知的隐写分析工具具有较好的抵抗能力。因此，需要研究如何从理论的角度证明隐写方法的安全性。可证明安全隐写指通过一定的理论推导的方式证明隐写方法是具有安全性的。随着生成数据的越来越普及，其分布特性可以用规范的分布如高维高斯分布拟合并表达，这样为可证明安全隐写的发展提供了数学基础。因此，面向生成式隐写的安全证明模型是信息隐藏领域值得关注的研究方向。

论文地址：生成式隐写研究

这篇关于图像处理之《生成式隐写研究》论文阅读的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！