ShuffleNet v2算法详解

2024-02-09 06:38
文章标签 算法 详解 v2 shufflenet

本文主要是介绍ShuffleNet v2算法详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文地址:https://arxiv.org/pdf/1807.11164.pdf

ShuffleNet v1的升级版,文中提供了如何建立weights-light网络的四条准则,并做实验进行了详细的分析,并依照这四点建议,在v1的基础上修改ShuffleNet block

先看图对比shuffleNet v2的效果。对比了GPU和ARM平台下的速度和准确率的分布情况。作者提出:单一的FLOPs(认为这个指标是间接的)不能准确的说明模型的速度,因此应该有其他更加直接的指标来衡量模型的速度。其一是MAC(memory access cost:内存访问消耗时间),其二是:platform(平台:GPU,CPU,ARM);接着就做了四个实验来证明自己的观点,同时这四个实验就是作者提出的建立轻量级网络的准则

一、Equal channel width minimizes memory access cost (MAC).

实验是关于卷积层的输入输出特征通道数对MAC指标的影响。

结论是卷积层的输入和输出特征通道数相等时MAC最小,此时模型速度最快。

证明:

FLOPs数:输入通道为c1,输出通道为吃c2,特征尺寸为h*w,卷积核大小为1*1, B为FLOPs数

存储空间:因为是1*1卷积,所以输入特征和输出特征的尺寸是相同的,这里用h和w表示,其中hwc1表示输入特征所需存储空间,hwc2表示输出特征所需存储空间,c1c2表示卷积核所需存储空间。

将上述两个式子带入下式,就是均值不等式(c1-c2)^2 >=0

实验结果

二、Excessive group convolution increases MAC.

关于卷积的group操作对MAC的影响。

结论是过多的group操作会增大MAC,从而使模型速度变慢。

证明:g为分组数

实验结果 

三、Network fragmentation reduces degree of parallelism.

模型设计的分支数量对模型速度的影响。

结论是模型中的分支数量越少,模型速度越快。

实验结果:x-fragment-series表示一个block中有x个卷积层串行

四、Element-wise operations are non-negligible

关于element-wise操作对模型速度的影响。

结论是element-wise操作所带来的时间消耗远比在FLOPs上的体现的数值要多,因此要尽可能减少element-wise操作。

实验结果:下图是作者多ShuffleNet v1和MobileNet v2的集中操作做了时间的分析

shrot-cut就是ResNet网络中的short-cut结构

ShuffleNet v2的结构

图c是shuffleNet v2的结构图,先做了一个通道的分割,对应实验一的结论。比如说,左半部分的shortcut为c,则有半部分为c`, (c+c` = 输入通道数);取消了1*1卷积,对应实验二的结论;concat操作以后做通道shuffle。最后做通道shuffle的原因也是为了通道之间信息交流。

具体网络结构图

结果

*号表示在每一个shuffleNet block之前做一个3*3的DW conv

这篇关于ShuffleNet v2算法详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/693412

相关文章

Java使用ANTLR4对Lua脚本语法校验详解

《Java使用ANTLR4对Lua脚本语法校验详解》ANTLR是一个强大的解析器生成器,用于读取、处理、执行或翻译结构化文本或二进制文件,下面就跟随小编一起看看Java如何使用ANTLR4对Lua脚本... 目录什么是ANTLR?第一个例子ANTLR4 的工作流程Lua脚本语法校验准备一个Lua Gramm

一文详解如何在Python中从字符串中提取部分内容

《一文详解如何在Python中从字符串中提取部分内容》:本文主要介绍如何在Python中从字符串中提取部分内容的相关资料,包括使用正则表达式、Pyparsing库、AST(抽象语法树)、字符串操作... 目录前言解决方案方法一:使用正则表达式方法二:使用 Pyparsing方法三:使用 AST方法四:使用字

Python列表去重的4种核心方法与实战指南详解

《Python列表去重的4种核心方法与实战指南详解》在Python开发中,处理列表数据时经常需要去除重复元素,本文将详细介绍4种最实用的列表去重方法,有需要的小伙伴可以根据自己的需要进行选择... 目录方法1:集合(set)去重法(最快速)方法2:顺序遍历法(保持顺序)方法3:副本删除法(原地修改)方法4:

python logging模块详解及其日志定时清理方式

《pythonlogging模块详解及其日志定时清理方式》:本文主要介绍pythonlogging模块详解及其日志定时清理方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录python logging模块及日志定时清理1.创建logger对象2.logging.basicCo

前端CSS Grid 布局示例详解

《前端CSSGrid布局示例详解》CSSGrid是一种二维布局系统,可以同时控制行和列,相比Flex(一维布局),更适合用在整体页面布局或复杂模块结构中,:本文主要介绍前端CSSGri... 目录css Grid 布局详解(通俗易懂版)一、概述二、基础概念三、创建 Grid 容器四、定义网格行和列五、设置行

Node.js 数据库 CRUD 项目示例详解(完美解决方案)

《Node.js数据库CRUD项目示例详解(完美解决方案)》:本文主要介绍Node.js数据库CRUD项目示例详解(完美解决方案),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考... 目录项目结构1. 初始化项目2. 配置数据库连接 (config/db.js)3. 创建模型 (models/

SQL表间关联查询实例详解

《SQL表间关联查询实例详解》本文主要讲解SQL语句中常用的表间关联查询方式,包括:左连接(leftjoin)、右连接(rightjoin)、全连接(fulljoin)、内连接(innerjoin)、... 目录简介样例准备左外连接右外连接全外连接内连接交叉连接自然连接简介本文主要讲解SQL语句中常用的表

shell编程之函数与数组的使用详解

《shell编程之函数与数组的使用详解》:本文主要介绍shell编程之函数与数组的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录shell函数函数的用法俩个数求和系统资源监控并报警函数函数变量的作用范围函数的参数递归函数shell数组获取数组的长度读取某下的

Python中局部变量和全局变量举例详解

《Python中局部变量和全局变量举例详解》:本文主要介绍如何通过一个简单的Python代码示例来解释命名空间和作用域的概念,它详细说明了内置名称、全局名称、局部名称以及它们之间的查找顺序,文中通... 目录引入例子拆解源码运行结果如下图代码解析 python3命名空间和作用域命名空间命名空间查找顺序命名空

SpringRetry重试机制之@Retryable注解与重试策略详解

《SpringRetry重试机制之@Retryable注解与重试策略详解》本文将详细介绍SpringRetry的重试机制,特别是@Retryable注解的使用及各种重试策略的配置,帮助开发者构建更加健... 目录引言一、SpringRetry基础知识二、启用SpringRetry三、@Retryable注解