ShuffleNet v2算法详解

2024-02-09 06:38
文章标签 算法 详解 v2 shufflenet

本文主要是介绍ShuffleNet v2算法详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文地址:https://arxiv.org/pdf/1807.11164.pdf

ShuffleNet v1的升级版,文中提供了如何建立weights-light网络的四条准则,并做实验进行了详细的分析,并依照这四点建议,在v1的基础上修改ShuffleNet block

先看图对比shuffleNet v2的效果。对比了GPU和ARM平台下的速度和准确率的分布情况。作者提出:单一的FLOPs(认为这个指标是间接的)不能准确的说明模型的速度,因此应该有其他更加直接的指标来衡量模型的速度。其一是MAC(memory access cost:内存访问消耗时间),其二是:platform(平台:GPU,CPU,ARM);接着就做了四个实验来证明自己的观点,同时这四个实验就是作者提出的建立轻量级网络的准则

一、Equal channel width minimizes memory access cost (MAC).

实验是关于卷积层的输入输出特征通道数对MAC指标的影响。

结论是卷积层的输入和输出特征通道数相等时MAC最小,此时模型速度最快。

证明:

FLOPs数:输入通道为c1,输出通道为吃c2,特征尺寸为h*w,卷积核大小为1*1, B为FLOPs数

存储空间:因为是1*1卷积,所以输入特征和输出特征的尺寸是相同的,这里用h和w表示,其中hwc1表示输入特征所需存储空间,hwc2表示输出特征所需存储空间,c1c2表示卷积核所需存储空间。

将上述两个式子带入下式,就是均值不等式(c1-c2)^2 >=0

实验结果

二、Excessive group convolution increases MAC.

关于卷积的group操作对MAC的影响。

结论是过多的group操作会增大MAC,从而使模型速度变慢。

证明:g为分组数

实验结果 

三、Network fragmentation reduces degree of parallelism.

模型设计的分支数量对模型速度的影响。

结论是模型中的分支数量越少,模型速度越快。

实验结果:x-fragment-series表示一个block中有x个卷积层串行

四、Element-wise operations are non-negligible

关于element-wise操作对模型速度的影响。

结论是element-wise操作所带来的时间消耗远比在FLOPs上的体现的数值要多,因此要尽可能减少element-wise操作。

实验结果:下图是作者多ShuffleNet v1和MobileNet v2的集中操作做了时间的分析

shrot-cut就是ResNet网络中的short-cut结构

ShuffleNet v2的结构

图c是shuffleNet v2的结构图,先做了一个通道的分割,对应实验一的结论。比如说,左半部分的shortcut为c,则有半部分为c`, (c+c` = 输入通道数);取消了1*1卷积,对应实验二的结论;concat操作以后做通道shuffle。最后做通道shuffle的原因也是为了通道之间信息交流。

具体网络结构图

结果

*号表示在每一个shuffleNet block之前做一个3*3的DW conv

这篇关于ShuffleNet v2算法详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/693412

相关文章

Spring组件初始化扩展点BeanPostProcessor的作用详解

《Spring组件初始化扩展点BeanPostProcessor的作用详解》本文通过实战案例和常见应用场景详细介绍了BeanPostProcessor的使用,并强调了其在Spring扩展中的重要性,感... 目录一、概述二、BeanPostProcessor的作用三、核心方法解析1、postProcessB

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

Spring Boot拦截器Interceptor与过滤器Filter详细教程(示例详解)

《SpringBoot拦截器Interceptor与过滤器Filter详细教程(示例详解)》本文详细介绍了SpringBoot中的拦截器(Interceptor)和过滤器(Filter),包括它们的... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)详细教程1. 概述1

Go语言中最便捷的http请求包resty的使用详解

《Go语言中最便捷的http请求包resty的使用详解》go语言虽然自身就有net/http包,但是说实话用起来没那么好用,resty包是go语言中一个非常受欢迎的http请求处理包,下面我们一起来学... 目录安装一、一个简单的get二、带查询参数三、设置请求头、body四、设置表单数据五、处理响应六、超

详解如何使用Python提取视频文件中的音频

《详解如何使用Python提取视频文件中的音频》在多媒体处理中,有时我们需要从视频文件中提取音频,本文为大家整理了几种使用Python编程语言提取视频文件中的音频的方法,大家可以根据需要进行选择... 目录引言代码部分方法扩展引言在多媒体处理中,有时我们需要从视频文件中提取音频,以便进一步处理或分析。本文

SpringIoC与SpringDI详解

《SpringIoC与SpringDI详解》本文介绍了Spring框架中的IoC(控制反转)和DI(依赖注入)概念,以及如何在Spring中使用这些概念来管理对象和依赖关系,感兴趣的朋友一起看看吧... 目录一、IoC与DI1.1 IoC1.2 DI二、IoC与DI的使用三、IoC详解3.1 Bean的存储

Spring Cloud之注册中心Nacos的使用详解

《SpringCloud之注册中心Nacos的使用详解》本文介绍SpringCloudAlibaba中的Nacos组件,对比了Nacos与Eureka的区别,展示了如何在项目中引入SpringClo... 目录Naacos服务注册/服务发现引⼊Spring Cloud Alibaba依赖引入Naco编程s依

C语言中的浮点数存储详解

《C语言中的浮点数存储详解》:本文主要介绍C语言中的浮点数存储详解,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、首先明确一个概念2、接下来,讲解C语言中浮点型数存储的规则2.1、可以将上述公式分为两部分来看2.2、问:十进制小数0.5该如何存储?2.3 浮点

大数据spark3.5安装部署之local模式详解

《大数据spark3.5安装部署之local模式详解》本文介绍了如何在本地模式下安装和配置Spark,并展示了如何使用SparkShell进行基本的数据处理操作,同时,还介绍了如何通过Spark-su... 目录下载上传解压配置jdk解压配置环境变量启动查看交互操作命令行提交应用spark,一个数据处理框架

MySQL中COALESCE函数示例详解

《MySQL中COALESCE函数示例详解》COALESCE是一个功能强大且常用的SQL函数,主要用来处理NULL值和实现灵活的值选择策略,能够使查询逻辑更清晰、简洁,:本文主要介绍MySQL中C... 目录语法示例1. 替换 NULL 值2. 用于字段默认值3. 多列优先级4. 结合聚合函数注意事项总结C