Pytorch中torch.nn.ConvTranspose2d函数详解

2023-10-16 07:08

本文主要是介绍Pytorch中torch.nn.ConvTranspose2d函数详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原理

ConvTranspose,即反卷积,通过卷积的形式,利用图像特征“恢复”到原图像。

当然,此处卷积核的权重参数与前面下采样卷积核的参数互相独立,且可更新。

也就是说“反”卷积不是之前的逆过程,无法保证完全恢复。

事实上,反卷积仅仅保留了特征与前级特征,点之间的对应关系

代码详解

简明起见,引入“正卷积”概念,意指从 低级特征 到 高级特征 的过程。

ConvTranspose2d 与 Conv2d 的参数形式、含义基本一致。需要注意的仅两点:

  • out_padding 这个也是补零,但是对反卷积后的特征图补零。
    • 设置该参数是由于不同尺寸的特征经卷积(下采样)后可以产生相同尺寸的特征,那么在反卷积对应回去的时候,通过out_padding解决多尺寸的问题。说白了,根本原因在于之前的卷积(下采样)有时会无法利用所有原始信息,有边角料未利用,如:input=5x5,padding=0,kernel_size=2x2,stride=2这种情况。
  • stride & padding 卷积步长和补零。
    • 反直觉的是:padding为之前“正卷积”补零个数
      • padding=0,“正卷积”为valid模式,那么要恢复原尺寸,反卷积就应为full模式,即为该特征两侧各补kernel_size-1个0;
      • padding=kernel_size-1,那么“正卷积”为full模式,则反卷积不用再补零。
      • padding=p,where 0<p<kernel_size-1,反卷积每侧补零数为kernel_size-1-p,即所谓p'=kernel_size-1-p。
    • stride 不再控制上采样的步长,而是控制输入特征图中,像素点间的间隙。原来的步长概念此时恒为1。stride默认为1,即无间隙。若stride=m,则输入特征图的像素点增添间隙,散开来,尺寸变为(input-1)x stride+1。
      • 事实上,这里的增大间隙正是下采样增大步长的对应过程。原来增大步长后,所卷积得到的特征图的相邻点,映射到原特征的区域之间的间距会变大。那么再通过卷积反求原来的低级特征时,就要将这个间距实实在在体现到对高级特征的处理上,即所谓增大间隙。(反卷积又称分数步长卷积,此即分数步长之体现、由来)

综上,给出ConvTranspose2d输入、输出特征大小计算式:

令输入特征大小为 i,输出为 o,反卷积核为 k x k,则有

o=\frac{\left \{ \left [\left ( i-1 \right )\times stride +1 \right ] +\left [ \left ( k-1-padding \right ) \times 2\right ]-k\right \}}{default\equiv 1}+1+outpadding

o=\left ( i-1 \right )\times stride+k-2padding+outpadding

 

可参考如下链接:Transposed convolution arithmetic

这篇关于Pytorch中torch.nn.ConvTranspose2d函数详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/219863

相关文章

Java中注解与元数据示例详解

《Java中注解与元数据示例详解》Java注解和元数据是编程中重要的概念,用于描述程序元素的属性和用途,:本文主要介绍Java中注解与元数据的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参... 目录一、引言二、元数据的概念2.1 定义2.2 作用三、Java 注解的基础3.1 注解的定义3.2 内

JavaScript中的isTrusted属性及其应用场景详解

《JavaScript中的isTrusted属性及其应用场景详解》在现代Web开发中,JavaScript是构建交互式应用的核心语言,随着前端技术的不断发展,开发者需要处理越来越多的复杂场景,例如事件... 目录引言一、问题背景二、isTrusted 属性的来源与作用1. isTrusted 的定义2. 为

使用Python实现操作mongodb详解

《使用Python实现操作mongodb详解》这篇文章主要为大家详细介绍了使用Python实现操作mongodb的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、示例二、常用指令三、遇到的问题一、示例from pymongo import MongoClientf

一文详解Python中数据清洗与处理的常用方法

《一文详解Python中数据清洗与处理的常用方法》在数据处理与分析过程中,缺失值、重复值、异常值等问题是常见的挑战,本文总结了多种数据清洗与处理方法,文中的示例代码简洁易懂,有需要的小伙伴可以参考下... 目录缺失值处理重复值处理异常值处理数据类型转换文本清洗数据分组统计数据分箱数据标准化在数据处理与分析过

详解如何在React中执行条件渲染

《详解如何在React中执行条件渲染》在现代Web开发中,React作为一种流行的JavaScript库,为开发者提供了一种高效构建用户界面的方式,条件渲染是React中的一个关键概念,本文将深入探讨... 目录引言什么是条件渲染?基础示例使用逻辑与运算符(&&)使用条件语句列表中的条件渲染总结引言在现代

详解Vue如何使用xlsx库导出Excel文件

《详解Vue如何使用xlsx库导出Excel文件》第三方库xlsx提供了强大的功能来处理Excel文件,它可以简化导出Excel文件这个过程,本文将为大家详细介绍一下它的具体使用,需要的小伙伴可以了解... 目录1. 安装依赖2. 创建vue组件3. 解释代码在Vue.js项目中导出Excel文件,使用第三

SQL注入漏洞扫描之sqlmap详解

《SQL注入漏洞扫描之sqlmap详解》SQLMap是一款自动执行SQL注入的审计工具,支持多种SQL注入技术,包括布尔型盲注、时间型盲注、报错型注入、联合查询注入和堆叠查询注入... 目录what支持类型how---less-1为例1.检测网站是否存在sql注入漏洞的注入点2.列举可用数据库3.列举数据库

Linux之软件包管理器yum详解

《Linux之软件包管理器yum详解》文章介绍了现代类Unix操作系统中软件包管理和包存储库的工作原理,以及如何使用包管理器如yum来安装、更新和卸载软件,文章还介绍了如何配置yum源,更新系统软件包... 目录软件包yumyum语法yum常用命令yum源配置文件介绍更新yum源查看已经安装软件的方法总结软

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Java访问修饰符public、private、protected及默认访问权限详解

《Java访问修饰符public、private、protected及默认访问权限详解》:本文主要介绍Java访问修饰符public、private、protected及默认访问权限的相关资料,每... 目录前言1. public 访问修饰符特点:示例:适用场景:2. private 访问修饰符特点:示例: