PNAS论文和算法解析

2023-10-29 05:59
文章标签 算法 解析 论文 pnas

本文主要是介绍PNAS论文和算法解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PNAS,论文的全名是Progressive Neural Architecture Search。这篇论文也是由谷歌团队Chenxi Liu和Zoph等人发表出来的,里面的很多思路承袭了NASNet的设计原则。本论文最大的特点是采用了SMBO(Sequential Model-based Optimization)的方法来训练Predictor(结构和controller RNN相似)。

PNAS的基本设计思想是:

  1. Cell和Block的设计原则(与NASNet一样),不区分Normal和Reduction;
  2. 将Block的备选operation减少到8个
  3. Predictor可以通过loss的SGD来优化参数
  4. Block由少到多,逐步搜索Cell结构

PNAS只搜索一种Cell,而且作者从NASNet里面发现Block的好几种操作在最后的结果都没用到,所以在operation的搜索空间候选上减少到8个。

在搜索算法上,作者也做了一些改进。采用渐进式叠加搜索,即一开始只搜索一个Block,用数据集进行训练和验证,后面再逐渐增加Block进行新一轮的搜索和训练。具体的搜索算法如下图所示。
在这里插入图片描述
图1. PNAS搜索算法流程

PNAS的SMBO搜索算法步骤:

  1. 产生只有一个Block的所有可能性的Cell,再按照NASNet的规则来搭建网络模型;
  2. 训练这一组网络模型,得到它们的精度,利用这些精度值去训练Predictor;
  3. 接下来是循环的步骤。每次循环增加一个Block,和之前选择的Block构成所有可能的子网络;
  4. 用Predictor预测步骤3中所有子网络的精度,从中挑选K个最好的子网络去训练,得到它们的精度。
  5. 用这些精度再去更新Predictor,然后跳到步骤3,开始新一轮的循环,直到Block个数达到上限。

PNASNet的搜索过程如下图所示。从图中可以看出,一开始只搜索一个Block,然后加上第2个Block,通过Predictor选择最好的K个子集进行训练和验证,如此循环下去,每次增加一个Block只要训练K个子网络即可。
在这里插入图片描述
图2. PNASNet搜索过程

Predictor和NASNet中的controller RNN具有基本相同的结构,唯一不同的是在最后一个RNN隐藏层添加一个全连接和Sigmoid回归精度。在步骤2和5中的精度就是从验证集上获得的,在Sigmoid回归那边计算Loss,用于更新Predictor的参数。在步骤4中,每增加一个Block,就让Predictor多递归计算一轮,得到添加Block后的模型预测精度。

作者在Cifar-10和ImageNet数据集上进行实验,在参数设置上,Cell的Block个数为5,第一个Cell的输出通道设为 F = 24 F=24 F=24,Normal Cell的 N = 2 N=2 N=2,每增加一个Block挑选 K = 256 K=256 K=256个子网络进行训练和评估。

下面两张图是搜索出来的PNASNet在ImageNet上的训练结果,可以看出在同等级的模型参数条件下,PNASNet比传统手工设计的网络都更好。跟NASNet、AmoebaNet基本上也是不相上下,但是PNASNet的搜索速度比它们更快,相比NASNet,PNASNet搜索的模型个数少了5倍,搜索速度快了8倍。
在这里插入图片描述
图3. 小模型PNASNet在ImageNet上的性能
在这里插入图片描述
图4. 大模型PNASNet在ImageNet上的性能

这篇关于PNAS论文和算法解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/298699

相关文章

Linux中shell解析脚本的通配符、元字符、转义符说明

《Linux中shell解析脚本的通配符、元字符、转义符说明》:本文主要介绍shell通配符、元字符、转义符以及shell解析脚本的过程,通配符用于路径扩展,元字符用于多命令分割,转义符用于将特殊... 目录一、linux shell通配符(wildcard)二、shell元字符(特殊字符 Meta)三、s

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

使用Python实现批量访问URL并解析XML响应功能

《使用Python实现批量访问URL并解析XML响应功能》在现代Web开发和数据抓取中,批量访问URL并解析响应内容是一个常见的需求,本文将详细介绍如何使用Python实现批量访问URL并解析XML响... 目录引言1. 背景与需求2. 工具方法实现2.1 单URL访问与解析代码实现代码说明2.2 示例调用

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

SpringCloud配置动态更新原理解析

《SpringCloud配置动态更新原理解析》在微服务架构的浩瀚星海中,服务配置的动态更新如同魔法一般,能够让应用在不重启的情况下,实时响应配置的变更,SpringCloud作为微服务架构中的佼佼者,... 目录一、SpringBoot、Cloud配置的读取二、SpringCloud配置动态刷新三、更新@R

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

在C#中合并和解析相对路径方式

《在C#中合并和解析相对路径方式》Path类提供了几个用于操作文件路径的静态方法,其中包括Combine方法和GetFullPath方法,Combine方法将两个路径合并在一起,但不会解析包含相对元素... 目录C#合并和解析相对路径System.IO.Path类幸运的是总结C#合并和解析相对路径对于 C

Java解析JSON的六种方案

《Java解析JSON的六种方案》这篇文章介绍了6种JSON解析方案,包括Jackson、Gson、FastJSON、JsonPath、、手动解析,分别阐述了它们的功能特点、代码示例、高级功能、优缺点... 目录前言1. 使用 Jackson:业界标配功能特点代码示例高级功能优缺点2. 使用 Gson:轻量

Java如何接收并解析HL7协议数据

《Java如何接收并解析HL7协议数据》文章主要介绍了HL7协议及其在医疗行业中的应用,详细描述了如何配置环境、接收和解析数据,以及与前端进行交互的实现方法,文章还分享了使用7Edit工具进行调试的经... 目录一、前言二、正文1、环境配置2、数据接收:HL7Monitor3、数据解析:HL7Busines

python解析HTML并提取span标签中的文本

《python解析HTML并提取span标签中的文本》在网页开发和数据抓取过程中,我们经常需要从HTML页面中提取信息,尤其是span元素中的文本,span标签是一个行内元素,通常用于包装一小段文本或... 目录一、安装相关依赖二、html 页面结构三、使用 BeautifulSoup javascript