图文详解:stylegan1 与stylegan2

2024-05-05 15:08

本文主要是介绍图文详解:stylegan1 与stylegan2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 模式映射网络(Mapping Network):

StyleGAN2中,z是从一个标准正态分布中采样的随机向量,它表示图像的潜在特征¹。z经过一个由8层全连接层组成的映射网络,被转换成一个中间潜在空间W,W空间的向量w可以控制图像的风格信息²。w被复制多份,每份对应一个合成网络的层,然后通过一个仿射变换,扩展为放缩因子和偏差因子

  • 输入:512维的随机向量z

  • 共8层全连接网络,每层输入和输出形状是:

    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512(w向量)
  • 样式块(Style Block):

  • 输入:w向量、特征图map(来自于上一层)、Noise
  • w向量控制AdaIN
  • 每层包含:3x3卷积、AdaIN、激活函数等
  • 输出形状与输入特征图相同
  • 生成网络(Synthesis Network):

  • 输入常量512 x 4 x 4

  • 从4x4逐步上采样到1024x1024:

    • 4x4 -> 8x8
    • 8x8 -> 16x16
    • ......
    • 1024x1024 -> 1024x1024
  • 每次上采样接Style Block

  1. Const Layer

  • 输出尺寸与Synthesis Network每层相匹配的噪声,如:

    • 512 x 4 x 4
    • 512 x 8 x 8
    • 512 x 16 x 16

AdaIN的细节

 

stylegan2修改动机

AdaIN的操作是对每个特征图的通道分别进行均值和方差的归一化,然后再乘以放缩因子和加上偏差因子。这样做的问题是,可能会破坏掉特征之间的相对大小信息,导致生成的图像出现水滴状的伪影¹。

第一次修改 

在开始处移除了一些冗余的操作。
原StyleGAN在网络最开始对constant input做了bias和noise添加以及AdaIN操作,这是冗余的,可以移除。

将bias b和noise B的添加移到style block外面。
原来是在style block内部才加的b和B。现在移到style block外面,可以作用在normalized data上。

只调整每个特征图的standard deviation。
原AdaIN要分别调整mean和std。但作者发现仅调整std也足以达到style控制的效果

这几点修改的目的是为了后面提出的weight demodulation做准备,使网络结构更加合理清晰。

总之,Revised architecture简化了冗余操作,并让network行为更加可预测。这为后面进一步改进夯实了基础。

第二次修改

Weight Demodulation方法中对特征图(signal)统计信息的假设,主要包括:

  1. 输入特征图中各元素相互独立(i.i.d.)
  2. 输入特征图元素服从均值为0,标准差为1的分布
  3. 卷积后输出特征图的标准差等于卷积核L2范数的平方根
  4. 卷积核L2范数反映了style modulation的影响
  5. 将卷积核按L2范数归一化,可以消除style modulation带来的影响

从 Revised architecture 到 Weight demodulation 的改进主要有以下步骤:

分析style block中的运算流程:
在Revised architecture中,style block包含Modulation、Convolution和Normalization三个步骤。

理解modulation的等效实现:
Modulation可以看作是缩放convolution weights:

w' = s ⊙ w

其中s是style,w和w'分别是原始和调制后的weights。

直接对weights进行Normalization:
可以跳过modulation层和normalization层,

直接对weights做类似normalization的调整:

w'' = w' / std(w')

std(w')可以看作是modulation s的影响。这样可以直接得到其效果。

合并为weight demodulation:
上面步骤合并起来就是weight demodulation,可以替代原来的Mod-Conv-Norm步骤。

这样可以避免normalization对feature map的影响,移除artifacts。

$s_i$的形状是一个标量,也就是一个单个的数值,它是由一个全连接层从W空间的潜码映射得到的³。$s_i$的作用是将风格向量的信息融合到卷积核中,从而实现风格迁移⁴。
 

 

 “configuration E” 和“configuration F”

 

这篇关于图文详解:stylegan1 与stylegan2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/961998

相关文章

Oracle的to_date()函数详解

《Oracle的to_date()函数详解》Oracle的to_date()函数用于日期格式转换,需要注意Oracle中不区分大小写的MM和mm格式代码,应使用mi代替分钟,此外,Oracle还支持毫... 目录oracle的to_date()函数一.在使用Oracle的to_date函数来做日期转换二.日

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

Mysql 中的多表连接和连接类型详解

《Mysql中的多表连接和连接类型详解》这篇文章详细介绍了MySQL中的多表连接及其各种类型,包括内连接、左连接、右连接、全外连接、自连接和交叉连接,通过这些连接方式,可以将分散在不同表中的相关数据... 目录什么是多表连接?1. 内连接(INNER JOIN)2. 左连接(LEFT JOIN 或 LEFT

Java中switch-case结构的使用方法举例详解

《Java中switch-case结构的使用方法举例详解》:本文主要介绍Java中switch-case结构使用的相关资料,switch-case结构是Java中处理多个分支条件的一种有效方式,它... 目录前言一、switch-case结构的基本语法二、使用示例三、注意事项四、总结前言对于Java初学者

Linux内核之内核裁剪详解

《Linux内核之内核裁剪详解》Linux内核裁剪是通过移除不必要的功能和模块,调整配置参数来优化内核,以满足特定需求,裁剪的方法包括使用配置选项、模块化设计和优化配置参数,图形裁剪工具如makeme... 目录简介一、 裁剪的原因二、裁剪的方法三、图形裁剪工具四、操作说明五、make menuconfig

详解Java中的敏感信息处理

《详解Java中的敏感信息处理》平时开发中常常会遇到像用户的手机号、姓名、身份证等敏感信息需要处理,这篇文章主要为大家整理了一些常用的方法,希望对大家有所帮助... 目录前后端传输AES 对称加密RSA 非对称加密混合加密数据库加密MD5 + Salt/SHA + SaltAES 加密平时开发中遇到像用户的

Springboot使用RabbitMQ实现关闭超时订单(示例详解)

《Springboot使用RabbitMQ实现关闭超时订单(示例详解)》介绍了如何在SpringBoot项目中使用RabbitMQ实现订单的延时处理和超时关闭,通过配置RabbitMQ的交换机、队列和... 目录1.maven中引入rabbitmq的依赖:2.application.yml中进行rabbit

C语言线程池的常见实现方式详解

《C语言线程池的常见实现方式详解》本文介绍了如何使用C语言实现一个基本的线程池,线程池的实现包括工作线程、任务队列、任务调度、线程池的初始化、任务添加、销毁等步骤,感兴趣的朋友跟随小编一起看看吧... 目录1. 线程池的基本结构2. 线程池的实现步骤3. 线程池的核心数据结构4. 线程池的详细实现4.1 初

手把手教你idea中创建一个javaweb(webapp)项目详细图文教程

《手把手教你idea中创建一个javaweb(webapp)项目详细图文教程》:本文主要介绍如何使用IntelliJIDEA创建一个Maven项目,并配置Tomcat服务器进行运行,过程包括创建... 1.启动idea2.创建项目模板点击项目-新建项目-选择maven,显示如下页面输入项目名称,选择

Python绘制土地利用和土地覆盖类型图示例详解

《Python绘制土地利用和土地覆盖类型图示例详解》本文介绍了如何使用Python绘制土地利用和土地覆盖类型图,并提供了详细的代码示例,通过安装所需的库,准备地理数据,使用geopandas和matp... 目录一、所需库的安装二、数据准备三、绘制土地利用和土地覆盖类型图四、代码解释五、其他可视化形式1.