PNAS论文和算法解析

2023-10-31 20:38
文章标签 算法 解析 论文 pnas

本文主要是介绍PNAS论文和算法解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PNAS,论文的全名是Progressive Neural Architecture Search。这篇论文也是由谷歌团队Chenxi Liu和Zoph等人发表出来的,里面的很多思路承袭了NASNet的设计原则。本论文最大的特点是采用了SMBO(Sequential Model-based Optimization)的方法来训练Predictor(结构和controller RNN相似)。

PNAS的基本设计思想是:

  1. Cell和Block的设计原则(与NASNet一样),不区分Normal和Reduction;
  2. 将Block的备选operation减少到8个
  3. Predictor可以通过loss的SGD来优化参数
  4. Block由少到多,逐步搜索Cell结构

PNAS只搜索一种Cell,而且作者从NASNet里面发现Block的好几种操作在最后的结果都没用到,所以在operation的搜索空间候选上减少到8个。

在搜索算法上,作者也做了一些改进。采用渐进式叠加搜索,即一开始只搜索一个Block,用数据集进行训练和验证,后面再逐渐增加Block进行新一轮的搜索和训练。具体的搜索算法如下图所示。
在这里插入图片描述
图1. PNAS搜索算法流程

PNAS的SMBO搜索算法步骤:

  1. 产生只有一个Block的所有可能性的Cell,再按照NASNet的规则来搭建网络模型;
  2. 训练这一组网络模型,得到它们的精度,利用这些精度值去训练Predictor;
  3. 接下来是循环的步骤。每次循环增加一个Block,和之前选择的Block构成所有可能的子网络;
  4. 用Predictor预测步骤3中所有子网络的精度,从中挑选K个最好的子网络去训练,得到它们的精度。
  5. 用这些精度再去更新Predictor,然后跳到步骤3,开始新一轮的循环,直到Block个数达到上限。

PNASNet的搜索过程如下图所示。从图中可以看出,一开始只搜索一个Block,然后加上第2个Block,通过Predictor选择最好的K个子集进行训练和验证,如此循环下去,每次增加一个Block只要训练K个子网络即可。
在这里插入图片描述
图2. PNASNet搜索过程

Predictor和NASNet中的controller RNN具有基本相同的结构,唯一不同的是在最后一个RNN隐藏层添加一个全连接和Sigmoid回归精度。在步骤2和5中的精度就是从验证集上获得的,在Sigmoid回归那边计算Loss,用于更新Predictor的参数。在步骤4中,每增加一个Block,就让Predictor多递归计算一轮,得到添加Block后的模型预测精度。

作者在Cifar-10和ImageNet数据集上进行实验,在参数设置上,Cell的Block个数为5,第一个Cell的输出通道设为 F = 24 F=24 F=24,Normal Cell的 N = 2 N=2 N=2,每增加一个Block挑选 K = 256 K=256 K=256个子网络进行训练和评估。

下面两张图是搜索出来的PNASNet在ImageNet上的训练结果,可以看出在同等级的模型参数条件下,PNASNet比传统手工设计的网络都更好。跟NASNet、AmoebaNet基本上也是不相上下,但是PNASNet的搜索速度比它们更快,相比NASNet,PNASNet搜索的模型个数少了5倍,搜索速度快了8倍。
在这里插入图片描述
图3. 小模型PNASNet在ImageNet上的性能
在这里插入图片描述
图4. 大模型PNASNet在ImageNet上的性能

这篇关于PNAS论文和算法解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/317976

相关文章

Spring中@Lazy注解的使用技巧与实例解析

《Spring中@Lazy注解的使用技巧与实例解析》@Lazy注解在Spring框架中用于延迟Bean的初始化,优化应用启动性能,它不仅适用于@Bean和@Component,还可以用于注入点,通过将... 目录一、@Lazy注解的作用(一)延迟Bean的初始化(二)与@Autowired结合使用二、实例解

golang字符串匹配算法解读

《golang字符串匹配算法解读》文章介绍了字符串匹配算法的原理,特别是Knuth-Morris-Pratt(KMP)算法,该算法通过构建模式串的前缀表来减少匹配时的不必要的字符比较,从而提高效率,在... 目录简介KMP实现代码总结简介字符串匹配算法主要用于在一个较长的文本串中查找一个较短的字符串(称为

通俗易懂的Java常见限流算法具体实现

《通俗易懂的Java常见限流算法具体实现》:本文主要介绍Java常见限流算法具体实现的相关资料,包括漏桶算法、令牌桶算法、Nginx限流和Redis+Lua限流的实现原理和具体步骤,并比较了它们的... 目录一、漏桶算法1.漏桶算法的思想和原理2.具体实现二、令牌桶算法1.令牌桶算法流程:2.具体实现2.1

C语言中自动与强制转换全解析

《C语言中自动与强制转换全解析》在编写C程序时,类型转换是确保数据正确性和一致性的关键环节,无论是隐式转换还是显式转换,都各有特点和应用场景,本文将详细探讨C语言中的类型转换机制,帮助您更好地理解并在... 目录类型转换的重要性自动类型转换(隐式转换)强制类型转换(显式转换)常见错误与注意事项总结与建议类型

MySQL 缓存机制与架构解析(最新推荐)

《MySQL缓存机制与架构解析(最新推荐)》本文详细介绍了MySQL的缓存机制和整体架构,包括一级缓存(InnoDBBufferPool)和二级缓存(QueryCache),文章还探讨了SQL... 目录一、mysql缓存机制概述二、MySQL整体架构三、SQL查询执行全流程四、MySQL 8.0为何移除查

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

使用Java实现一个解析CURL脚本小工具

《使用Java实现一个解析CURL脚本小工具》文章介绍了如何使用Java实现一个解析CURL脚本的工具,该工具可以将CURL脚本中的Header解析为KVMap结构,获取URL路径、请求类型,解析UR... 目录使用示例实现原理具体实现CurlParserUtilCurlEntityICurlHandler

深入解析Spring TransactionTemplate 高级用法(示例代码)

《深入解析SpringTransactionTemplate高级用法(示例代码)》TransactionTemplate是Spring框架中一个强大的工具,它允许开发者以编程方式控制事务,通过... 目录1. TransactionTemplate 的核心概念2. 核心接口和类3. TransactionT

数据库使用之union、union all、各种join的用法区别解析

《数据库使用之union、unionall、各种join的用法区别解析》:本文主要介绍SQL中的Union和UnionAll的区别,包括去重与否以及使用时的注意事项,还详细解释了Join关键字,... 目录一、Union 和Union All1、区别:2、注意点:3、具体举例二、Join关键字的区别&php

Spring IOC控制反转的实现解析

《SpringIOC控制反转的实现解析》:本文主要介绍SpringIOC控制反转的实现,IOC是Spring的核心思想之一,它通过将对象的创建、依赖注入和生命周期管理交给容器来实现解耦,使开发者... 目录1. IOC的基本概念1.1 什么是IOC1.2 IOC与DI的关系2. IOC的设计目标3. IOC