本文主要是介绍论文阅读《Generalizing Face Forgery Detection with High-frequency Features》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
高频噪声分析会过滤掉图像的颜色内容信息。
本文设计了三个模块来充分利用高频特征,
1.多尺度高频特征提取模块
2.双跨模态注意模块
3.残差引导空间注意模块(也在一定程度上体现了两个模态的交互)
SRM是用于过滤图像的高频噪声
输入的图像X,共两个分支,一部分是用于输入到SRM获得高频特征Xh,一部分是RGB流,RGB的分支同样也会输入到SRM进行提取高频特征,其结果与已经输入SRM中的结果进行相加得到最后的输出结果,和
,该过程经过不断地重复得到最后的特征F,和
第二个模块是DCMA,是跨模态的特征融合的部分,对于特征F来说,会先进行映射为Key 和value ,key用于计算两个模态的相似性,相似性结果再乘以权重矩阵得到系数C,再与Vh相乘得到特征T,对于T'的计算也是同样的道理,完成特征融合。
第三部分,将两个特征再通道维度上进行拼接,输入到全连接神经网络中,得到最后的分类结果。
这篇关于论文阅读《Generalizing Face Forgery Detection with High-frequency Features》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!