PP-LCNet: A Lightweight CPU Convolutional Neural Network

本文主要是介绍PP-LCNet: A Lightweight CPU Convolutional Neural Network，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

轻量级Trick的优化组合。

论文名称：PP-LCNet: A Lightweight CPU Convolutional Neural Network

作者：Cheng Cui, Tingquan Gao, Shengyu Wei,Yuning Du…

Code：https://github.com/PaddlePaddle/PaddleClas

摘要

总结了一些在延迟（latency）几乎不变的情况下精度提高的技术；
提出了一种基于MKLDNN加速策略的轻量级CPU网络，即PP-LCNet。

介绍

目前的轻量级网络在启用MKLDNN的Intel CPU上速度并不理想，考虑了一下三个基本问题：

如何促使网络学习到更强的特征，但不增加延迟？
在CPU上提高轻量级模型精度的要素是什么？
如何有效地结合不同的策略来设计CPU上的轻量级模型？

Method

PP-LCNet使用深度可分离卷积作为基础结构，构建了一个类似MobileNetV1的BaseNet，并在其基础上结合现有的技术，从而得到了PP-LCNet

参数配置：

Better activation function

激活函数是神经网络中非线性的来源，因此其质量一定程度上决定着网络的表达能力。

当激活函数由Sigmoid变为ReLU时，网络的性能得到了很大的提升，近来出现了很多超越ReLU的激活函数，如EfficientNet的Swish，MobileNetV3中将其升级为HSwish，避免了大量的指数运算；因此本网络中使用HSwish激活函数代替ReLU。

首先让我们看一下ReLU函数的近似推导：
$KaTeX parse error: No such environment: align at position 8: \begin{̲a̲l̲i̲g̲n̲}̲ f(x)&=\sum_{i=…$
softplus

出于计算量的考虑和实验验证选择了ReLU

ReLU6：

增加了上界

Swish：
$f(x)=x\cdot sigmoid(\beta x)$
swish

$\beta$ 是个常数或可训练的参数。Swish 具备无上界有下界、平滑、非单调的特性。
Swish 在深层模型上的效果略优于 ReLU。仅仅使用 Swish 单元替换 ReLU 就能把 Mobile NASNetA 在 ImageNet 上的 top-1 分类准确率提高 0.9%，Inception-ResNet-v 的分类准确率提高 0.6%。

导数：

当 $β = 0$ 时,Swish变为线性函数 $f(x)=\frac x 2$
当 $β \to \infty$ , $\sigma(x)=\frac{1}{1+e^{−x}}$ 为0或1，这时Swish变为 $R e L U (x) = m a x (0, x)$
因此Swish函数可以看做是介于线性函数与ReLU函数之间的平滑函数.