DeepFakes深度造假,AI换脸的技术原理是什么?

2023-12-17 17:18

本文主要是介绍DeepFakes深度造假,AI换脸的技术原理是什么?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

什么是DeepFakes深度造假

DeepFakes深度造假是怎么做出来的?

行业在检测DeepFakes深度造假方面的进展

邪不胜正


什么是DeepFakes深度造假


DeepFakes深度造假实际上是一种人脸交换技术,顾名思义,也就是在图像或视频中把一张脸替换成另一张脸。事实上,人脸交换技术在电影制作领域已经不是个新鲜词了,但是之前电影视频中的人脸交换技术非常复杂,专业的视频剪辑师和CGI专家需要花费大量时间和精力才能完成视频中的人脸交换。


DeepFakes深度造假的出现可以说是人脸交换技术的一个突破。利用DeepFakes技术,你只需要一个GPU和一些训练数据,就能够制作出以假乱真的换脸视频。


这可以说是一个非常了不起的突破了,因为你只需要把上百张人物的样图输入至一个算法,就能完成人脸交换,制作出非常逼真的视频效果。就算你是个对视频剪辑一窍不通的外行,也能做到这样。


DeepFakes的出现还意味着我们可以在视频中进行大规模的“换脸”。我们大多数人都曾经把自己的照片上传到网络上,因此,我们大多数人的脸都能够轻易地被替换到一些视频中,成为视频的“主角”, 凭空捏造一个人根本没有干过的事。不得不说,这是件非常可怕的事情。


DeepFakes深度造假,不仅影响企业、名人,对普通人的生活、工作也产生很大的威胁。随着技术的发展,造假的程度越来越厉害,罪犯能够改变故事背景,降低甚至扭曲我们在网上看到的信息的真实性。 随着DeepFakes深度造假技术大约每六个月翻一番,如何识别DeepFakes深度造假问题变得愈发急迫。


DeepFakes深度造假是怎么做出来的?


DeepFakes深度造假视频通常使用变分自动编码器 (VAE) 和面部识别算法。图像被编码成低维表示,然后再由经过训练的VAEs解码成图像。
举个例子:

  • 有人想为超级碗 (Super Bowl) 广告制作一段明星的DeepFakes深度造假视频
  • 技术人员使用一个自动编码器,该编码器对明星的面部图像进行训练,另一个则对各种面部图像进行训练
  • 每个自动编码器的训练集可通过在视频上部署人脸识别算法来选择,视频可以捕捉各种姿势和光照环境
  • 训练结束后,两个独立的编码器结合在一起,在另一个人的身体上仿制出一段带有演员面孔的真实视频


行业在检测DeepFakes深度造假方面的进展


辨识媒体操纵是一项技术挑战,需要跨行业合作。近年来,以研究为导向的倡议一直在传播,旨在自动检测DeepFakes深度造假的各种表现形式,而这些表现形式人类很难识别。


AWS、微软 (Microsoft)、脸书 (Facebook)、人工智能合作组织 (Partnership on AI) 和学者联合发起了DeepFake检测挑战赛,给全球研究人员提供100万美元的奖金,支持创新技术的开发。一共有2000多名参赛人员,共计生成了35000多个DeepFakes深度造假检测模型。


Detect Fakes(造假检测)是麻省理工学院 (MIT) 的一项研究倡议,旨在努力对抗人工智能的错误信息,并推出了一些让参与者实践,看看他们是否能从真实视频中辨别出DeepFake。


加州大学伯克利分校 (UC Berkeley) 和斯坦福大学 (Stanford) 的研究人员,发明了一种人工智能驱动的方法来检测假唱技术,通过了解人们的嘴型和说话时声音之间的不一致,可以识别80%的假唱。


微软发布了一款深度商业造假检测工具,该工具可分析视频帧,并生成一个软件可信度评分,验证视频帧是真实的还是人工智能造假的。在2020年美国大选中,这项技术派上了用场。


来自英特尔和宾厄姆顿大学的图形和图像计算实验室的研究团队开发了一种工具,该工具利用生物信号和数据来识别和分类DeepFakes深度造假,准确率高达96%。该工具基于的想法是,虽然面部视频可以合成,但是以像素颜色变化表现的细微生理信号,包括心率波动和血流等信息,这些信息是无法轻易复制的。


尽管用于识别DeepFakes深度造假的创新正在涌现,但大多处于研究或开发阶段,她们还有很长的路要走。


邪不胜正


人工智能是一项颠覆性的技术,它可以被坏人利用,用来造假,也可以被好人使用,用于检测DeepFakes深度造假,不允许坏人通过DeepFakes深度造假来对个人、企业、社会造成威胁。随着DeepFakes深度造假日益猖獗,人工智能检测技术将是降低数据操纵风险的关键。


掌握人工智能检测DeepFakes深度造假技术,需要技术人员掌握Keras和TensorFlow的深度学习技术、机器学习技术。通过学习,你将掌握Deep Learning的概念和使用Keras和TensorFlow框架的模型,并精通深度学习算法,为成为一名专业的AI工程师做好准备。

这篇关于DeepFakes深度造假,AI换脸的技术原理是什么?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/505182

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

hdu4407(容斥原理)

题意:给一串数字1,2,......n,两个操作:1、修改第k个数字,2、查询区间[l,r]中与n互质的数之和。 解题思路:咱一看,像线段树,但是如果用线段树做,那么每个区间一定要记录所有的素因子,这样会超内存。然后我就做不来了。后来看了题解,原来是用容斥原理来做的。还记得这道题目吗?求区间[1,r]中与p互质的数的个数,如果不会的话就先去做那题吧。现在这题是求区间[l,r]中与n互质的数的和

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/