NASNet论文详解

2023-10-31 20:38
文章标签 详解 论文 nasnet

本文主要是介绍NASNet论文详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NASNet,论文的全名叫做Learning Transferable Architectures for Scalable Image Recognition.

这一篇论文是对神经网络架构搜索开篇之作NAS的集成和发展,也是由谷歌的Zoph等人提出来的,针对NAS论文中的缺点进行改进,在分类精度和训练资源、时间上,都优于前者。

NASNet论文的基本设计思想是:

  1. 和NAS论文一样,采用controller RNN来预测子网络参数
  2. 第一次提出了Cell和Block的概念
  3. controller RNN不再用来预测每一层的网络参数,而是用来预测Cell里面的Block参数

首先介绍一下什么是Cell和Block。Cell可以看做是整体网络架构里面的一个单元块,类似ResNet架构的残差块或者MobileNet V2的bottleneck,整个网络就是由这些单元块堆叠连接而成。

Cell分两种:Normal和Reduction。当输入特征和输出特征的分辨率是一致时,采用Normal Cell,当输入特征的分辨率是输入特征的一半时,采用Reduction Cell。Reduction Cell的设计方法Normal Cell基本一样,只是在输入特征上添加了一个stride=2的卷积操作,降低分辨率。在整体网络架构中,Normal Cell和Reduction Cell的设计原则是每N个Normal Cell中插入一个Reduction Cell,如下图所示。
在这里插入图片描述
图1. Cifar-10和ImageNet上的NASNet网络架构

Block是Cell里面的基本单元,共有B个(论文取5)。每个Block有两个输入,分别经过各自的operation之后再结合(相加或者衔接)作为输出,Block的输出称为隐状态。对于第 i i i个Block,输入的候选范围包括前面 i − 1 i-1 i1个Block的隐状态以及前两个Cell的输出,Block的操作的候选空间如下图所示。
在这里插入图片描述
图2. Block操作的候选空间

与NAS论文里controller RNN预测每一个layer的操作参数不同,NASNet的controller RNN是用来预测Cell里面每一个Block的参数。具体如下图所示。
在这里插入图片描述
图3. NASNet的controller RNN

Block的参数预测步骤有:

  1. 从输入候选范围内选择两个隐状态作为Block的两个输入
  2. 从操作候选空间选择operation作为步骤1中两个输入的操作
  3. 选择一个操作用来结合步骤2中的两个输出

预测步骤总共会循环B次,直至预测出Cell所有Block结构为止。

Controller RNN的训练方法和NAS论文中一样,也是通过验证集的精度作为reward来优化controller的参数,采用的强化学习中的PPO(Proximal Policy Optimization)算法。

在训练的时候,只选择一种Normal和Reduction Cell,同一个网络中相同类型的Cell结构是共享的,所以controller RNN只需要预测一个Cell的结构即可。从搜索空间的复杂度来看,这种方法设计极大地减小了搜索的次数和范围,这种思想被后来的其他NAS论文广泛引用,后面的博客介绍的其他方法会持续提到。

作者在训练的过程还加了一种额外的技巧,即先在小的数据集上(如Cifar-10)搜索Cell结构,等搜索结果出来后,再堆叠更多的Cell,应用在大数据集上(如ImageNet)。这样在搜索的过程中,子网络模型训练的时间便大幅减小,提高搜索的效率。

在Cifar-10数据上,论文使用了500个GPU,搜索了4天的时间。相比NAS论文的实验,搜索效率提升了7倍。在训练子网络时,采用Scheduled DropPath的方法,以一定的概率(随着迭代的次数线性增加)随机扔掉Cell里的某些路径。下图是NASNet搜索出来的Normal和Reduction Cell的结构。
在这里插入图片描述
图5. 搜索出来的Normal和Reduction Cell结构图

论文把cifar-10上搜索出来的Cell结构迁移到ImageNet数据集上,表现出了很好的泛化能力。

以下两张图是NASNet搜索出来的Cell按照图1里的方式叠加成网络后训练出来的结果。可以看出,在同一参数量等级的模型上,NASNet比手工设计的网络模型精度更好,也比NAS论文的实验结果更优。
在这里插入图片描述
图6. Cifar-10实验结果和对比

在这里插入图片描述
图7. ImageNet实验结果和对比

这篇关于NASNet论文详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/317973

相关文章

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

Debezium 与 Apache Kafka 的集成方式步骤详解

《Debezium与ApacheKafka的集成方式步骤详解》本文详细介绍了如何将Debezium与ApacheKafka集成,包括集成概述、步骤、注意事项等,通过KafkaConnect,D... 目录一、集成概述二、集成步骤1. 准备 Kafka 环境2. 配置 Kafka Connect3. 安装 D

Java中ArrayList和LinkedList有什么区别举例详解

《Java中ArrayList和LinkedList有什么区别举例详解》:本文主要介绍Java中ArrayList和LinkedList区别的相关资料,包括数据结构特性、核心操作性能、内存与GC影... 目录一、底层数据结构二、核心操作性能对比三、内存与 GC 影响四、扩容机制五、线程安全与并发方案六、工程

Spring Cloud LoadBalancer 负载均衡详解

《SpringCloudLoadBalancer负载均衡详解》本文介绍了如何在SpringCloud中使用SpringCloudLoadBalancer实现客户端负载均衡,并详细讲解了轮询策略和... 目录1. 在 idea 上运行多个服务2. 问题引入3. 负载均衡4. Spring Cloud Load

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

SQL 中多表查询的常见连接方式详解

《SQL中多表查询的常见连接方式详解》本文介绍SQL中多表查询的常见连接方式,包括内连接(INNERJOIN)、左连接(LEFTJOIN)、右连接(RIGHTJOIN)、全外连接(FULLOUTER... 目录一、连接类型图表(ASCII 形式)二、前置代码(创建示例表)三、连接方式代码示例1. 内连接(I

Go路由注册方法详解

《Go路由注册方法详解》Go语言中,http.NewServeMux()和http.HandleFunc()是两种不同的路由注册方式,前者创建独立的ServeMux实例,适合模块化和分层路由,灵活性高... 目录Go路由注册方法1. 路由注册的方式2. 路由器的独立性3. 灵活性4. 启动服务器的方式5.

Java中八大包装类举例详解(通俗易懂)

《Java中八大包装类举例详解(通俗易懂)》:本文主要介绍Java中的包装类,包括它们的作用、特点、用途以及如何进行装箱和拆箱,包装类还提供了许多实用方法,如转换、获取基本类型值、比较和类型检测,... 目录一、包装类(Wrapper Class)1、简要介绍2、包装类特点3、包装类用途二、装箱和拆箱1、装