Dilated Convolution膨胀卷积感受野详解

2024-04-21 04:32

本文主要是介绍Dilated Convolution膨胀卷积感受野详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

重温Dilated Convolution膨胀卷积,对论文《MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS》中采用Dilation后的感受野计算示意图产生了迷惑,于是自己重新画图琢磨了一番。
论文中感受野计算示意图
可以看到作者的感受野计算是递进式的,即F1在F0的基础上经3x3,dilation=1卷积得到,即F2在F1的基础上经3x3,dilation=2卷积得到,即F3在F2的基础上经3x3,dilation=4卷积得到,最终F1、F2、F3各自的感受野分别是3x3、7x7、15x15。

这几个数字如果按图示来看无法直观感受到感受野变化的过程,很容易产生迷惑。

在研究变化过程前,需要清楚一个概念,就是每一层的最终感受野是指相对原始图像而言的,在图示中指F0。在清楚这一概念后,则可以开始研究采用dilation后的感受野变化情况。

(1)对原始图F0,采用3x3,dilation=1(即普通卷积)卷积核卷积得到特征图,特征图的每一个单元的感受野则是3x3。这个很好理解。
膨胀卷积1
(2)进一步,对原始图F0,采用3x3,dilation=2卷积核卷积得到特征图,特征图的每一个单元的感受野则是5x5。
膨胀卷积2
(3)再进一步,对原始图F0,采用3x3,dilation=4卷积核卷积得到特征图,特征图的每一个单元的感受野则是9x9。
膨胀卷积3

请注意,以上的计算都是卷积直接在原始图F0上进行,因此可以直观看出特征图单个元素对应的感受野。而在原论文中则是递进式的,采用dilation=2/4的卷积核不再是在原始图F0上进行卷积的,这是主要差异。因此感受野计算需要进一步映射。

(4)对原始图F0,先采用3x3,dilation=1(即普通卷积)卷积核卷积得到特征图F1。再采用3x3,dilation=2卷积核卷积得到特征图F2,特征图F2的每一个单元映射回F1后(临时)感受野是5×5,再从F1映射回原始图F0的感受野是[3×3]+(5-1)=[7×7]。则F2每一个单元的最终感受野是7x7,和论文中的F2感受野一致。

注1:(临时)感受野指的是对应前一层特征图的感受野,非对应原始图,不是最终的感受野。
注2:[3×3]是因为F1中的每一个方格对应F0中的3×3个方格,(5-1)是因为需要将3×3卷积核继续平滑4次来生成F1的剩余部分。

膨胀卷积4
(5)对原始图F0,先采用3x3,dilation=1(即普通卷积)卷积核卷积得到特征图F1。再采用3x3,dilation=2卷积核卷积得到特征图F2,最后采用3x3,dilation=4卷积核卷积得到特征图F3。特征图F3的每一个单元映射回F2后(临时)感受野是9×9,再从F2映射回F1的(临时)感受野是[5×5]+(9-1)=[13×13],最后从F1映射回原始图F0的感受野是[3×3]+(13-1)=[15×15]。则F3每一个单元的最终感受野是15x15,和论文中的F3感受野一致。

注1:(X-1)是因为需要将3×3卷积核继续平滑X-1次来生成特征图的剩余部分,
注2:从F2映射回F1的过程可以直接用F1已映射回F0的感受野来计算,不用再进一步回推。即利用F1对应的原始图感受野[7×7],直接得到F2映射回F0的感受野[7×7]+(9-1)=[15×15]。

膨胀卷积5
结论:
根据以上图示,能够更加清楚采用Dilated Convolution膨胀卷积后感受野变化的情况,再次强调需要注意的是感受野指的是相对于原始图而言的,因此对于经过多层卷积后得到的特征图的感受野计算,需要层层回退到原始图,最终求得的感受野大小则为所得特征图单个元素的真正感受野。

在这里插入图片描述

这篇关于Dilated Convolution膨胀卷积感受野详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/922163

相关文章

Nginx location匹配模式与规则详解

《Nginxlocation匹配模式与规则详解》:本文主要介绍Nginxlocation匹配模式与规则,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、环境二、匹配模式1. 精准模式2. 前缀模式(不继续匹配正则)3. 前缀模式(继续匹配正则)4. 正则模式(大

Android实现在线预览office文档的示例详解

《Android实现在线预览office文档的示例详解》在移动端展示在线Office文档(如Word、Excel、PPT)是一项常见需求,这篇文章为大家重点介绍了两种方案的实现方法,希望对大家有一定的... 目录一、项目概述二、相关技术知识三、实现思路3.1 方案一:WebView + Office Onl

Java实现优雅日期处理的方案详解

《Java实现优雅日期处理的方案详解》在我们的日常工作中,需要经常处理各种格式,各种类似的的日期或者时间,下面我们就来看看如何使用java处理这样的日期问题吧,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言一、日期的坑1.1 日期格式化陷阱1.2 时区转换二、优雅方案的进阶之路2.1 线程安全重构2

Java中的JSONObject详解

《Java中的JSONObject详解》:本文主要介绍Java中的JSONObject详解,需要的朋友可以参考下... Java中的jsONObject详解一、引言在Java开发中,处理JSON数据是一种常见的需求。JSONObject是处理JSON对象的一个非常有用的类,它提供了一系列的API来操作J

HTML5中的Microdata与历史记录管理详解

《HTML5中的Microdata与历史记录管理详解》Microdata作为HTML5新增的一个特性,它允许开发者在HTML文档中添加更多的语义信息,以便于搜索引擎和浏览器更好地理解页面内容,本文将探... 目录html5中的Mijscrodata与历史记录管理背景简介html5中的Microdata使用M

html5的响应式布局的方法示例详解

《html5的响应式布局的方法示例详解》:本文主要介绍了HTML5中使用媒体查询和Flexbox进行响应式布局的方法,简要介绍了CSSGrid布局的基础知识和如何实现自动换行的网格布局,详细内容请阅读本文,希望能对你有所帮助... 一 使用媒体查询响应式布局        使用的参数@media这是常用的

HTML5表格语法格式详解

《HTML5表格语法格式详解》在HTML语法中,表格主要通过table、tr和td3个标签构成,本文通过实例代码讲解HTML5表格语法格式,感兴趣的朋友一起看看吧... 目录一、表格1.表格语法格式2.表格属性 3.例子二、不规则表格1.跨行2.跨列3.例子一、表格在html语法中,表格主要通过< tab

Linux之计划任务和调度命令at/cron详解

《Linux之计划任务和调度命令at/cron详解》:本文主要介绍Linux之计划任务和调度命令at/cron的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux计划任务和调度命令at/cron一、计划任务二、命令{at}介绍三、命令语法及功能 :at

Java使用SLF4J记录不同级别日志的示例详解

《Java使用SLF4J记录不同级别日志的示例详解》SLF4J是一个简单的日志门面,它允许在运行时选择不同的日志实现,这篇文章主要为大家详细介绍了如何使用SLF4J记录不同级别日志,感兴趣的可以了解下... 目录一、SLF4J简介二、添加依赖三、配置Logback四、记录不同级别的日志五、总结一、SLF4J

Java使用ANTLR4对Lua脚本语法校验详解

《Java使用ANTLR4对Lua脚本语法校验详解》ANTLR是一个强大的解析器生成器,用于读取、处理、执行或翻译结构化文本或二进制文件,下面就跟随小编一起看看Java如何使用ANTLR4对Lua脚本... 目录什么是ANTLR?第一个例子ANTLR4 的工作流程Lua脚本语法校验准备一个Lua Gramm