图文详解:stylegan1 与stylegan2

2024-05-05 15:08

本文主要是介绍图文详解:stylegan1 与stylegan2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 模式映射网络(Mapping Network):

StyleGAN2中,z是从一个标准正态分布中采样的随机向量,它表示图像的潜在特征¹。z经过一个由8层全连接层组成的映射网络,被转换成一个中间潜在空间W,W空间的向量w可以控制图像的风格信息²。w被复制多份,每份对应一个合成网络的层,然后通过一个仿射变换,扩展为放缩因子和偏差因子

  • 输入:512维的随机向量z

  • 共8层全连接网络,每层输入和输出形状是:

    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512
    • 512 -> 512(w向量)
  • 样式块(Style Block):

  • 输入:w向量、特征图map(来自于上一层)、Noise
  • w向量控制AdaIN
  • 每层包含:3x3卷积、AdaIN、激活函数等
  • 输出形状与输入特征图相同
  • 生成网络(Synthesis Network):

  • 输入常量512 x 4 x 4

  • 从4x4逐步上采样到1024x1024:

    • 4x4 -> 8x8
    • 8x8 -> 16x16
    • ......
    • 1024x1024 -> 1024x1024
  • 每次上采样接Style Block

  1. Const Layer

  • 输出尺寸与Synthesis Network每层相匹配的噪声,如:

    • 512 x 4 x 4
    • 512 x 8 x 8
    • 512 x 16 x 16

AdaIN的细节

 

stylegan2修改动机

AdaIN的操作是对每个特征图的通道分别进行均值和方差的归一化,然后再乘以放缩因子和加上偏差因子。这样做的问题是,可能会破坏掉特征之间的相对大小信息,导致生成的图像出现水滴状的伪影¹。

第一次修改 

在开始处移除了一些冗余的操作。
原StyleGAN在网络最开始对constant input做了bias和noise添加以及AdaIN操作,这是冗余的,可以移除。

将bias b和noise B的添加移到style block外面。
原来是在style block内部才加的b和B。现在移到style block外面,可以作用在normalized data上。

只调整每个特征图的standard deviation。
原AdaIN要分别调整mean和std。但作者发现仅调整std也足以达到style控制的效果

这几点修改的目的是为了后面提出的weight demodulation做准备,使网络结构更加合理清晰。

总之,Revised architecture简化了冗余操作,并让network行为更加可预测。这为后面进一步改进夯实了基础。

第二次修改

Weight Demodulation方法中对特征图(signal)统计信息的假设,主要包括:

  1. 输入特征图中各元素相互独立(i.i.d.)
  2. 输入特征图元素服从均值为0,标准差为1的分布
  3. 卷积后输出特征图的标准差等于卷积核L2范数的平方根
  4. 卷积核L2范数反映了style modulation的影响
  5. 将卷积核按L2范数归一化,可以消除style modulation带来的影响

从 Revised architecture 到 Weight demodulation 的改进主要有以下步骤:

分析style block中的运算流程:
在Revised architecture中,style block包含Modulation、Convolution和Normalization三个步骤。

理解modulation的等效实现:
Modulation可以看作是缩放convolution weights:

w' = s ⊙ w

其中s是style,w和w'分别是原始和调制后的weights。

直接对weights进行Normalization:
可以跳过modulation层和normalization层,

直接对weights做类似normalization的调整:

w'' = w' / std(w')

std(w')可以看作是modulation s的影响。这样可以直接得到其效果。

合并为weight demodulation:
上面步骤合并起来就是weight demodulation,可以替代原来的Mod-Conv-Norm步骤。

这样可以避免normalization对feature map的影响,移除artifacts。

$s_i$的形状是一个标量,也就是一个单个的数值,它是由一个全连接层从W空间的潜码映射得到的³。$s_i$的作用是将风格向量的信息融合到卷积核中,从而实现风格迁移⁴。
 

 

 “configuration E” 和“configuration F”

 

这篇关于图文详解:stylegan1 与stylegan2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/961998

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

MySQL的JDBC编程详解

《MySQL的JDBC编程详解》:本文主要介绍MySQL的JDBC编程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、前置知识1. 引入依赖2. 认识 url二、JDBC 操作流程1. JDBC 的写操作2. JDBC 的读操作总结前言本文介绍了mysq

Redis 的 SUBSCRIBE命令详解

《Redis的SUBSCRIBE命令详解》Redis的SUBSCRIBE命令用于订阅一个或多个频道,以便接收发送到这些频道的消息,本文给大家介绍Redis的SUBSCRIBE命令,感兴趣的朋友跟随... 目录基本语法工作原理示例消息格式相关命令python 示例Redis 的 SUBSCRIBE 命令用于订

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

SpringBoot日志级别与日志分组详解

《SpringBoot日志级别与日志分组详解》文章介绍了日志级别(ALL至OFF)及其作用,说明SpringBoot默认日志级别为INFO,可通过application.properties调整全局或... 目录日志级别1、级别内容2、调整日志级别调整默认日志级别调整指定类的日志级别项目开发过程中,利用日志

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有

MySQL8 密码强度评估与配置详解

《MySQL8密码强度评估与配置详解》MySQL8默认启用密码强度插件,实施MEDIUM策略(长度8、含数字/字母/特殊字符),支持动态调整与配置文件设置,推荐使用STRONG策略并定期更新密码以提... 目录一、mysql 8 密码强度评估机制1.核心插件:validate_password2.密码策略级

从入门到精通详解Python虚拟环境完全指南

《从入门到精通详解Python虚拟环境完全指南》Python虚拟环境是一个独立的Python运行环境,它允许你为不同的项目创建隔离的Python环境,下面小编就来和大家详细介绍一下吧... 目录什么是python虚拟环境一、使用venv创建和管理虚拟环境1.1 创建虚拟环境1.2 激活虚拟环境1.3 验证虚

详解python pycharm与cmd中制表符不一样

《详解pythonpycharm与cmd中制表符不一样》本文主要介绍了pythonpycharm与cmd中制表符不一样,这个问题通常是因为PyCharm和命令行(CMD)使用的制表符(tab)的宽... 这个问题通常是因为PyCharm和命令行(CMD)使用的制表符(tab)的宽度不同导致的。在PyChar