解读 | 从谷歌AI判定阿波罗登月“造假“来谈谈合成图片检测技术

本文主要是介绍解读 | 从谷歌AI判定阿波罗登月“造假“来谈谈合成图片检测技术,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

整个事情可以爬楼看我的这篇 <有趣!谷歌AI认定阿波罗登月"造假">,这里从这个让大家热议的事件出发来谈谈其中涉及的合成图片检测技术。

看下面的图,格拉西门科所说的 "红色部分是他们的神经网络标出的判定为假的地方,也就是说这张照片上几乎所有物体都被判定是假的"。可以看出来使用的谷歌 AI 并不是 "简单的" "想当然的" 分类任务,而是有类似分割任务的表达 (深度学习中的分类任务指的是对一张图片判断后做出分类判断,比如用于判断一张图片是否合成,可以输出 的分类)。这种从技术上来说会更加精细,想象一下若是直接的二分类任务,会非常的笼统,不能很好表达具体哪里是合成的。而这里使用的技术在表达上会更加细腻:红色部分是合成的,蓝色部分是真的。这样可以很直观观察到图片的哪里伪造了,这个意思可以参考咱们平时的 P 图,我们在 P 图的时候可能会修修脸、抠抠图、推推肚子、拉伸拉伸腿,而往往不是整张图片一股脑的都去修。这个时候如果是用分类任务去做判断,这些具体修图的地方是体现不出来的,它只会告诉你,你是 P 过了还是没有 P 过,而反观用下面的方法,则能够很好地体现出来。具体到图片,可以看到美国登月的人体、影子都是合成的,这种指向性就非常明显了。

图像合成 (Image Composition) 是将一张图的前景剪切并嵌入到另一张背景图中,以生成一张新的合成图。在更泛的层面上,图像合成包括将来自不同图像的多个视觉元素融合到同一张图中。这个技术有着广泛的应用,例如人物换背景、虚拟社交、电影特效、广告图片等的制作生成。为了达到理想的效果,通常会将图像合成与图像生成 (Image Generation) 结合使用。图像生成负责从无到有地创造图像,而图像合成则负责将已有元素巧妙精准地组合在一起。尽管图像生成能够快速、有创造性地生成各种图像,但其可控性有限,生成具有随机性,无法保证生成完全符合预期的图像。因此,从这个角度来看图像合成更擅长于精细控制,通过拼接已有的视觉元素来合成真实而合理的图像。

图像合成和图像生成的代表就是 PS 和 AIGC,现在的 AIGC 十分之火热,下面展示了一些 AIGC 的 "生成创造性",

总有人觉得现在 AIGC 这么火热,对于 PS 这种艺术创造类型的工作就可能直接被取代了。我倒是有不同的观点,还是跟上面的分析一样,AIGC 具有随机性,它适合干的事情是一下让它生成一大堆图像,然后咱们从中挑选,这种模式往往不能够 "指哪打哪"。而 PS 则完全不同,它就能够 "指哪打哪",精确完成期望图像的生成。其实从这个角度来说,若阿波罗登月是假图,他一定是属于图像合成,而非图像生成。原因很简单,它的场景要求 "精准",而非追求 "艺术创造性"。这就跟 PS 很像了,比如下面的人物精修,就很需要这种 "精准性",而非 "创造性",

对于图像合成其实是有多种手段来实现的,从流程上来说主要分为拍摄阶段后期修图阶段。对于拍摄阶段来说,可以使用布景摆拍、光照控制、道具添加、遮挡重叠等来模拟真实环境 或者 先摄影一些待合成的子图用于后期合成制作;对于后期修图阶段,这个就很好理解了,用过 PS 的同学可能会更加清楚一些,比如可以用蒙版、透明度、景深还有其他一些图像处理工具的组合来达到图像合成的目的。

下面来看一些效果展示,做的好的图像合成是非常逼真的,

如果你不知道鲸鱼是在海里的,你能看出下面的图是合成的吗,

你看这修的,

比如更加先进的,比如加勒比海盗电影中的各种特效的合成,

回过头来再看阿波罗登月,阿波罗登月是在 1969 年,若登月的图片真的是伪造的,考虑到那个时候的 P 图软件 或者说 P 图算法没有现在这么先进,那么通过摄影技术来进行图像合成的概率会更大。什么意思呢,比如去模拟月球的环境来进行拍摄,这就像拍摄好莱坞电影那样。但事实真的是这样吗,还是回到下面这张图,注意 "标红为假、标蓝为真",可以很清楚的看到,像人、影子、仪器之类的被标红了,说明这些前景是合成的。这个意思很有可能是宇航员、影子、实验仪器等这些前景是在一个其他干净背景下拍摄,然后做蒙版抠图嵌入到 "月球表面" 背景之中。这样就能解释的通,哈哈 当然前提是这几张图为假。

那么谷歌 AI 是怎么做到来识别图像是否是合成的呢,由于其没有开源,所以也只能猜个大概,但总的来说,目前一些主流的图像合成检测算法也大差不差。使用 AI 识别图像是否是合成主要是利用一些特征提取和匹配的方法来判断图像中的像素是否与其他临近像素或者对等图像有明显的差异,因为在做图像合成的时候,即使你的技术再高超,也势必会引入一些噪声,而这些噪声往往是人眼感受不出来,因为它体现在像素级别。目前有一些常用的方法可以用来检测是否是合成图,如下,

  • 统计分析法:通过对比不同来源或者不同时间段的图像,来计算它们之间在颜色、纹理、形形状等方面的相似度或者差异度 ==> 如果一个图像与其他图像有较高的相似度或者较低的差异度,那么它就很可能是合成或者修改过的;
  • 特征提取法:通过对每个像素进行特征提取和匹配,来判断它们是否与其他像素或者其他图像有明显不匹配。特征提取可以基于颜色、纹理、形形状等方面,也可以基于语义、语义相似性等方面 ==> 如果一个图像中有很多不匹配或者异常的区域,那么它就很可能是合成或者修改过的;
  • 深度学习法:通过使用深度神经网络来学习不同来源或者不同时间段的图像之间在特征上的关系和差异,并且根据这些关系和差异来判断一个新生成或者修改过后的图像是否与其他源之间有明显不符合 ==> 深度学习法可以利用大量数据和强大算力来提高检测效果和准确率;

这里例举了三种方法,而对于谷歌 AI 的识别,你可不要觉得一定就只是深度学习算法。打个比方,比如我之前做过工业视觉检测,其实里面主要使用传统的数字图像处理算法,但是对外都宣称 "智能 AI 检测算法",这种 "宣传","智能 AI",是不是会给你一种深度学习算法的错觉。所以,我觉得谷歌 AI 识别图像是否合成的算法也很可能是数字图像处理算法和深度学习的结合应用。当然,当然,也不排除是用大模型来做的,毕竟大模型是 "万能的"。

当然,这一切前提都是 "阿波罗登月是造假的",时过境迁,现在顺着正向推理已经很难,而通过更加先进的技术来逆向判断是个非常有趣的方式。


【极智视界】

《解读 | 从谷歌AI判定阿波罗登月"造假"来谈谈合成图片检测技术》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球,星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。https://t.zsxq.com/0aiNxERDq

​​​​

这篇关于解读 | 从谷歌AI判定阿波罗登月“造假“来谈谈合成图片检测技术的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/735644

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学