ALI比GAN的优势在哪里?

2023-10-09 00:50
文章标签 优势 ali gan

本文主要是介绍ALI比GAN的优势在哪里?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文参考:Adversarially Learned Inference,(2017.2)作者:Vincent Dumoulin(MILA, Université de Montréal,)
原文:https://ishmaelbelghazi.github.io/ALI/

生成模型有三种:(1)VAE,(2)GAN,(3)Autoregressive approaches (这个方法我还没有学习过)。这三种方法皆有优缺点:
1、VAE,image samples from VAE-trained models tend to be blurry,即VAE生成的图像较模糊;
2、GAN,GAN-based approaches represent a good compromise: they learn a generative model that produces higher-quality samples than the best VAE techniques without sacrificing sampling speed and also make use of a latent representation in the generation process. However, GANs lack an efficient inference mechanism, which prevents them from reasoning about data at an abstract level.
3、Autoregressive approaches据文中说是生成效果不错,就是计算量太大,处理得太慢。
ALI(Adversarially Learned Inference,对抗性推断学习)模型的目标是将VAE和GAN联系起来,同时具备速度快、质量好,而且能有效推断。
此处的“有效推断”是什么?就是给定x(数据集样本),产生了什么z(隐变量),即得到以下叙述中的概率分布 q(z|x) q ( z | x ) 。GAN是由z产生x,它不管给定x产生什么z,没有从x到z的推断过程。现在ALI采用了VAE的编码器和解码器结构,于是便具有了此项推断功能,同时,它的训练过程与传统VAE不同,采用的是GAN那样的纳什均衡方式的训练方法,因此说:ALI具有VAE的实现架构,又有GAN的训练方法。实现框架提供了推断方法,训练方法提供了高质量的生成过程。具体如图1:
这里写图片描述
图1 ALI模型

  • 图1中左边为Encoder:样本 x x 从经验分布 q(x) q ( x ) 抽样出来,经过Encoder的映射
    Gz(x) G z ( x ) 得到条件分布 q(z|x) q ( z | x ) ,从中抽样出 ẑ z ^ ,由此形成一个联合分布 q(x,ẑ) q ( x , z ^ ) ,有 q(x,ẑ)=q(x)q(ẑ|x) q ( x , z ^ ) = q ( x ) q ( z ^ | x )
  • 图1右边为Decoder:已知一个分布 zp(z) z ∼ p ( z ) ,例如: p(z)=N(0,I) p ( z ) = N ( 0 , I ) 标准正态分布。从该分布中抽样出一个样本 z z ,经过Decoder映射 Gx(z) G x ( z ) 得到一个条件分布 p(x|z) p ( x | z ) ,从该分布抽样出 x̂ x ^ ,于是形成一个联合分布 p(x̂,z) p ( x ^ , z ) ,有 p(x̂,z)=p(z)p(x̂|z) p ( x ^ , z ) = p ( z ) p ( x ^ | z )
  • 图1中间是一个判别器,它的判别函数为 D(x,z) D ( x , z ) ,它的作用是:分辨输入的联合分布样本来自 q(x,ẑ) q ( x , z ^ ) ,还是来自 p(x̂,z) p ( x ^ , z )

具体的实现可以由以下伪代码来说明:
这里写图片描述

我们从实现的过程来看,ALI虽然也有Encoder和Decoder,但它们却是独立工作的,这与VAE有着巨大的差别:
1、VAE原理

xx̂Encoder mapxx̂Decoder mapp(z|x)sampleẑ x → Encoder map p ( z | x ) ∥ ‖ x − x ^ ‖ ↓ sample x ^ ← Decoder map z ^

VAE的 x x x̂ x ^ 是有关系的: x x 经Encoder map得到条件分布 p(z|x) p ( z | x ) ,经抽样得到 ẑ z ^ ,然后再经过Decoder map得到重建 x̂ x ^ ,Loss与原样本与重建样本的距离有关: Lossxx̂ L o s s ∼ ‖ x − x ^ ‖
2、ALI 的Encoder与Decoder是独立工作的,它们各自生成联合分布,交由判别器判定是否相同分布,期间映射和采样都是独立进行的,这一点从它的Loss构造中可见一斑。ALI的价值函数(Value Function)是直接从GAN中继承过来的:

  • 一般的GAN价值函数:

    minGmaxDV(D,G)=Eq(x)[logD(x)] + Ep(z)[1log(D(G(z)))]=q(x)logD(x)dx+p(z)p(x|z)[1logD(x)]dxdz(1) min G max D V ( D , G ) = E q ( x ) [ log ⁡ D ( x ) ] + E p ( z ) [ 1 − log ⁡ ( D ( G ( z ) ) ) ] = ∫ q ( x ) log ⁡ D ( x ) d x + ∬ p ( z ) p ( x | z ) [ 1 − log ⁡ D ( x ) ] d x d z ( 1 )

  • ALI 的价值函数是将(1)中 D() D ( ⋅ ) 的边沿分布替换成联合分布,有:

    minGmaxDV(D,G)=Eq(x)[logD(x,Gz(x))] + Ep(z)[1log(D(Gx(z),z))]=q(x)q(z|x)logD(x,z)dxdz+p(z)p(x|z)[1logD(x,z)]dxdz(2) min G max D V ( D , G ) = E q ( x ) [ log ⁡ D ( x , G z ( x ) ) ] + E p ( z ) [ 1 − log ⁡ ( D ( G x ( z ) , z ) ) ] = ∬ q ( x ) q ( z | x ) log ⁡ D ( x , z ) d x d z + ∬ p ( z ) p ( x | z ) [ 1 − log ⁡ D ( x , z ) ] d x d z ( 2 )

    匹配了 q(x,z) q ( x , z ) p(x,z) p ( x , z ) ,就意味着匹配了一系列边沿分布和条件分布:
    q(x)p(x)q(z)=p(z)q(x|z)p(x|z)q(z|x)p(z|x) q ( x ) ∼ p ( x ) q ( z ) = p ( z ) q ( x | z ) ∼ p ( x | z ) q ( z | x ) ∼ p ( z | x )

    由上述关系可以完成相应的推断。

ALI的性能可以由下面一个简单实验来说明:
这里写图片描述
图2 各模型效果对比图
这是一个Toy dataset实验:经验分布是一个2D分布,其密度函数 q(x) q ( x ) 由25个2D高斯混合分布合成,如图中第一行。第二行是给定 x x 生成的隐变量 z z 的分布,它也是2D的。第三行是由隐变量重建样本,第四行是 z z 的先验分布: zN(0,I) z ∼ N ( 0 , I ) ,第5行是直接先验分布得到 z z ,并由此生成的重构样本。
由图2,GAN生成的样本模式最少,因而很容易进入模式坍塌;而VAE和ALI生成样本多样性的效果较好;VAE点与点之间的连线明显,这从一个侧面反映出VAE生成图像会较模糊;ALI既能生成多样性样本,点与点之间连线不如VAE明显,是一种较好的方案。
笔者经验:ALI的训练很困难,收敛太慢了。

这篇关于ALI比GAN的优势在哪里?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/169152

相关文章

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

全倒装COB超微小间距LED显示屏的工艺技术,相比SMD小间距有何优势

全倒装COB(Chip On Board)超微小间距LED显示屏,在工艺技术上的革新,相较于传统的SMD(Surface Mount Device)小间距LED显示屏,展现出了多方面的显著优势。 首先,全倒装技术极大地提升了LED芯片的散热性能。通过将芯片直接焊接在基板上,减少了热阻,使得热量能够更快速地传导至基板并散发出去,有效避免了因高温导致的光衰和色彩偏移问题,从而保证了显示屏的长期稳定性

对接话费充值API接口的开发步骤以及各种优势

对接话费充值API接口通常涉及以下步骤: 1.选择API提供商: 研究并选择一个可靠的话费充值API提供商。考虑因素包括覆盖范围、费率、交易限额、客户支持和用户评价。 2.注册和获取API密钥: 在选定的API提供商平台上注册账户,并获取API密钥或访问令牌,这是调用API时进行身份验证的必要信息。 3.阅读API文档: 仔细阅读API文档,了解如何构建请求、需要哪些参数、API的

生成对抗网络(GAN网络)

Generative Adversarial Nets 生成对抗网络GAN交互式可视化网站 1、GAN 基本结构 GAN 模型其实是两个网络的组合: 生成器(Generator) 负责生成模拟数据; 判别器(Discriminator) 负责判断输入的数据是真实的还是生成的。 生成器要不断优化自己生成的数据让判别网络判断不出来,判别器也要优化自己让自己判断得更准确。 二者关系形成

深度学习--对抗生成网络(GAN, Generative Adversarial Network)

对抗生成网络(GAN, Generative Adversarial Network)是一种深度学习模型,由Ian Goodfellow等人在2014年提出。GAN主要用于生成数据,通过两个神经网络相互对抗,来生成以假乱真的新数据。以下是对GAN的详细阐述,包括其概念、作用、核心要点、实现过程、代码实现和适用场景。 1. 概念 GAN由两个神经网络组成:生成器(Generator)和判别器(D

软文发稿相比其他广告形式有哪些持续性优势?

软文发稿在品牌宣发中具有显著的持续性优势,特别是在与其他广告形式的比较中更能体现这些特点。凭借其潜移默化的影响力、增强品牌权威性和公信力、持续性的曝光优势、精准触达目标受众的能力、强互动性与引导性,以及较高的性价比,已经成为品牌推广不可或缺的手段 一 长期存在与持续曝光 长时间的内容可见性     软文发表后,通常会长时间存在于各种平台上,无论是官网、博客、行业网站还是社交媒体帖子。读

过滤器:叠片式过滤器所具备的优势

在制备纯水或超纯水过程中,过滤是必不可少的处理工艺,其主要作用是去除水中的颗粒杂质及悬浮物。目前比较成熟的过滤工艺多是以介质过滤为主,甚至是采用多介质过滤器进行过滤。但是近几年来非介质过滤器的发展步伐也在逐渐加快,在各行各业中的应用也日益广泛,其中叠片式过滤器即为较先进的非介质过滤器。该过滤器结构独特、性能优越、高效、耗电远低于其他同类产品,已能够在很大程度上代替砂滤器等传统的机械过滤装置,受

基于 AC 驱动的电容结构 GaN LED 模型开发和应用

随着芯片尺寸减小,微小尺寸GaN 基 Micro LED 显示面临着显示与驱动高密度集成的难题,传统直流(DC)驱动技术会导致结温上升,降低器件寿命。南京大学团队创新提出交流(AC)驱动的单电极 LED(SC-LED)结构【见图1】,利用隧穿结(TJ)降低器件的交流工作电压。为了深入理解该器件的工作原理,我司技术团队开发了基于 AC 驱动的物理解析模型,揭示了隧穿结降低器件工作电压的

短信PHP接口平台可以为企业带来哪些优势

短信验证码在我们的日常生活中可以说是无处不在,并且短信验证码目前在市场中已经得到了广泛的使用,这种验证方法可以保证注册人事实名认证,并且可以防止恶意注册,不过也有人觉得短信验证码有一些累赘,那么短信验证码真的有存在的价值吗?今天乐讯通短信平台就来为大家介绍一下短信验证码接口的优势。   其实,短信验证码有没有必要存在,不是你说了算,也不是我说了算,而是市场是用户说了算。大部分情况下,我们在注

网站代运维与建设:HTTP虚拟专线的优势

网站代运维与建设:HTTP虚拟专线的优势 企业和个人越来越依赖于网站来展示品牌形象、提供服务和与客户互动。然而,网站的建设和运维往往需要投入大量时间和资金,尤其是在服务器费用和技术维护方面。本文将探讨如何通过使用HTTP虚拟专线来降低网站运维成本,并实现高效的代运维服务。 一、网站建设与运维的挑战 1. 高昂的服务器费用 对于许多中小企业和个人开发者来说,购买和维护服务器的费用是一项不