ManTra-Net: Manipulation Tracing Network论文阅读记录

2023-10-18 17:50

本文主要是介绍ManTra-Net: Manipulation Tracing Network论文阅读记录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘要:提出Mantra-Net端到端的深度学习框架用于现实生活中的篡改取证,并不包含前后处理操作具有检测和定位 的功能,包括拼接、复制粘贴、移除、增强等未知类型。提出一种可以检测385中类型的篡改痕迹检测简单高效的自监督模型,把图像篡改当做异常检测,实验证明其应对多种篡改操作的组合。

 

5、实验部分

以上部分已经说明了篡改痕迹特征和异常检测网络,在标注数据集中评估其泛化性能、敏感性、鲁棒性能等,使用AUC作为性能评估标准,由于网络中少部分原始像素错误认为篡改像素,在网络中并未得到惩罚(一定程度上会造成误检过高),因此如果mask出现一半以上的篡改区域,我们则不认同。参考文献(Fighting fake news: Image splice detection via learned self-consistency)

5.1预训练模型和一般性测试

在四个数据库中评估,为了评估这些模型的可推广性,选择最新的部分cnn的图像修复算法,作为一种典型的基于域外dnn的操作。另外使用 Photoshope-battle数据集,因为数据集较大具有多样性,并未像素级的标注,我们评估时候是图像水平的评判。

 从表7中可以看出,用全随机权重训练的全随机模型不能很好地泛化,因为它过度拟合合成数据,而使用的合成数据集中呈现的伪造线索与现实世界中的有很大不同。通过冻结图像处理痕迹特征(IMTF)和随机LADN权重训练的半冻结模型可以防止这种情况的发生过拟合,但这也打消了寻找更好功能的希望
对于其他伪造类型,因为已知操作跟踪特征是优化增强数据集


(见表6中的Enhance列),但不是拼接,copy-move或删除。相反,半随机模型这允许这些权值在较低的学习中更新速率5e-5防止过拟合和收敛到一个更好所有伪造类型的特征表示。因此,我们使用半随机模型在以后的实验

5.2 敏感性与鲁棒性评估

1)使用篡改函数和参数P,在dresden testing生成5000块;2)在合成数据上评估 3)在图4 显示数据性能表现 

考虑三种后处理操作,缩放、压缩、边缘模糊,最后,虽然局部模糊在欺骗基于边缘的伪造检测方法方面是非常有效的,但mantranet对这类攻击是相当免疫的。

5.3 比较现有方法

讨论了实验结果,在nist 和columbi上排名第二,原因是对于哥伦比亚数据库并未采用具体的特征,rgb-n利用其噪声差异特征能够很好刻画这一点,nist 图像块的尺寸较大 相较于训练的图片,加上 他们的方法有微调。在coverage 和casia数据集上的图片取得优异的结果,最有可能的解释就是输入图片和训练时的图像尺寸相近。

可以得出初步结论:提出的方法优于现有的方法,在不同数据上性能表现较好,并未需要微调和后处理等。

限制:

在提出的方法有较好的表现外,说明了方法存在的限制 1)通过电脑合成的图片 2)篡改区域与背景区域具有相同时噪声分别时 3)图片中存在多区域篡改的情况下,需要指定区域的情况下,才能判断出篡改区域

6、结论

在本文中,提出新颖的端到端的神经网络篡改定位称为Mantra-Net,首先提取待检测图片的篡改痕迹特征,确定异常区域通过评估局部特征的异常性,并且通过预训练模型证明预训练模型对微小物体的敏感性,后处理操作具有鲁棒性,在不可见数据和未知篡改类型具有能力。

 

 

 

 

 

 

 

 

这篇关于ManTra-Net: Manipulation Tracing Network论文阅读记录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/234218

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get

2、PF-Net点云补全

2、PF-Net 点云补全 PF-Net论文链接:PF-Net PF-Net (Point Fractal Network for 3D Point Cloud Completion)是一种专门为三维点云补全设计的深度学习模型。点云补全实际上和图片补全是一个逻辑,都是采用GAN模型的思想来进行补全,在图片补全中,将部分像素点删除并且标记,然后卷积特征提取预测、判别器判别,来训练模型,生成的像

Node.js学习记录(二)

目录 一、express 1、初识express 2、安装express 3、创建并启动web服务器 4、监听 GET&POST 请求、响应内容给客户端 5、获取URL中携带的查询参数 6、获取URL中动态参数 7、静态资源托管 二、工具nodemon 三、express路由 1、express中路由 2、路由的匹配 3、路由模块化 4、路由模块添加前缀 四、中间件

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓