ShuffleNet v1算法详解

2024-02-09 06:38
文章标签 算法 详解 shufflenet v1

本文主要是介绍ShuffleNet v1算法详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文地址:https://arxiv.org/pdf/1707.01083.pdf
Face++的一篇关于降低深度网络计算量的论文

什么是group convlution 群卷积 ?

我们假设上一层的输出feature map有N个,即通道数channel=N,也就是说上一层有N个卷积核。再假设群卷积的群数目M。那么该群卷积层的操作就是,先将channel分成M份。每一个group对应N/M个channel,与之独立连接。然后各个group卷积完成后将输出叠在一起(concatenate),作为这一层的输出channel。

该文章主要采用channel shuffle、pointwise group convolutions和depthwise separable convolution来修改原来的ResNet的bottleneck单元

Channel shuffle

     

  1. 图a做group convolution的方法:对于N个feature map M个filter(卷积核),group组数为g,则N,M都被分为g个组,第一个group中M/g个fliter的每一个filter都和第一个group中N/g个feature map做卷积得到结果,接着第二个,第三个….                   总结:feature map和卷积核都为相同的分组,然后对应组相卷积得到结果,这样做的目的就是可以大幅减少计算量如果有多   个卷积层都有group操作如图(a),这样就会产生边界效应:某个输出channel仅仅来自输入channel的一小部分,只能学习到一小部分的特征,于是提出了channel shuffle;简言之就是:如图a,最终的output输出只和输入的一小部分有关
  2. Channel shuffle图b,在进行Gconv之前,对其输入的feature map做了一个分配:将每个group分成几个subgroup,然后将group的每个subgroup作为GConv2的一个group的输入下一个Gconv的输入,如图c所示。

Pointwise group convolution (卷积核是1*1的卷积)

在ResNet中主要对3*3的卷积做group操作,但是在shuffleNet中,作者对1*1卷积做grounp的操作

文中计算了这三个unit的FLOPS:(我把计算式子写开,更容易理解)

其中c为输入通道数,m为输出通道数,g为group分组数

a为(2cm + 9m*m) = (c+3*3*m+c)*m

b为(2cm + 9m*m/g)= (c/g+3*3*m/g+c/g)*m

  1. 图a是ResNet中的bottleneck unit,不过将原来的3*3 Conv改成3*3 DW Conv
  2. 图b 是添加了group convolution 和channel shuffle
  3. bottleneck中添加average pooling,设置DWConv的步长为2,最后采用contact操作按channel合并代替ADD操作

实验结果

Table1是网络结构,设置不同的分组数的复杂度,Table2计算了不同ShuffleNet复杂度下的错误率。1X, 0.5X, 0,25X表示将网络的filter缩小s*s倍

Table2标题括号中的好像是有错误,应该为更小的s表现更大的分类错误率

此外作者还做了如下的比较,寻找最优的分组数g

不同模型的复杂度和错误率的比较

最后作者得出一个经验值,使用groung=3时可以得到一个准确率和运行时间的一个平衡。

这篇关于ShuffleNet v1算法详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/693410

相关文章

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Spring Boot中WebSocket常用使用方法详解

《SpringBoot中WebSocket常用使用方法详解》本文从WebSocket的基础概念出发,详细介绍了SpringBoot集成WebSocket的步骤,并重点讲解了常用的使用方法,包括简单消... 目录一、WebSocket基础概念1.1 什么是WebSocket1.2 WebSocket与HTTP

java中反射Reflection的4个作用详解

《java中反射Reflection的4个作用详解》反射Reflection是Java等编程语言中的一个重要特性,它允许程序在运行时进行自我检查和对内部成员(如字段、方法、类等)的操作,本文将详细介绍... 目录作用1、在运行时判断任意一个对象所属的类作用2、在运行时构造任意一个类的对象作用3、在运行时判断

MySQL 中的 CAST 函数详解及常见用法

《MySQL中的CAST函数详解及常见用法》CAST函数是MySQL中用于数据类型转换的重要函数,它允许你将一个值从一种数据类型转换为另一种数据类型,本文给大家介绍MySQL中的CAST... 目录mysql 中的 CAST 函数详解一、基本语法二、支持的数据类型三、常见用法示例1. 字符串转数字2. 数字

SpringBoot中SM2公钥加密、私钥解密的实现示例详解

《SpringBoot中SM2公钥加密、私钥解密的实现示例详解》本文介绍了如何在SpringBoot项目中实现SM2公钥加密和私钥解密的功能,通过使用Hutool库和BouncyCastle依赖,简化... 目录一、前言1、加密信息(示例)2、加密结果(示例)二、实现代码1、yml文件配置2、创建SM2工具

MyBatis-Plus 中 nested() 与 and() 方法详解(最佳实践场景)

《MyBatis-Plus中nested()与and()方法详解(最佳实践场景)》在MyBatis-Plus的条件构造器中,nested()和and()都是用于构建复杂查询条件的关键方法,但... 目录MyBATis-Plus 中nested()与and()方法详解一、核心区别对比二、方法详解1.and()

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos