Inception-V4和Inception-Resnet论文阅读和代码解析

本文主要是介绍Inception-V4和Inception-Resnet论文阅读和代码解析，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

论文阅读

论文地址：Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning

此论文主要是作者尝试将inception与residual结合，而提出了inception-resnet-v1和inception-resnet-v2网络，并且为了比较inception与resnet结合后是否真的对网络性能有提升而提出了一个inception-v4网络进行对比。试验证明residual能够加速inception网络的训练，并且精度上有少量的提升。

1.介绍

这篇论文的主要思想就是将residual和inception结构相结合，以获得residual带来的好处。

在直接集成这两个思想之前，作者也研究了能否将inception变得更深更宽使其更高效，因为这个原因作者设计了新版本的inception，叫做inception-v4。Inception-v4有更多简化的模型，并且比Inception-v3有更多的inception block。

在这个报告里面，作者会用两个纯inception网络inception-v3和inception-v4和混合的inception-resnet网络进行比较。另外还测试了更大更宽的inception-resnet网络，发现他们的表现都非常相似。

2.相关工作

残差网络的作者认为训练很深的网络时使用残差链接是非常中要的，但是本文的作者说很深的网络即使不使用残差连接，训练网络也并不难，但是使用了残差网络训练速度会大大加快。另外作者还提到了inception的第一代第二代和第三代之间的改进。

3.纯Inception block

Inception的结构是很容易调节的，就是说改变一些fitler最终并不会影响结果。但是作者为了优化训练速度小心的调整了每一层的大小。现在因为tensorflow的优化功能，作者认为不需要再像以前一样根据经验小心的调整每一层，现在可以更加标准化的设置每一层的参数。而提出了Inception-V4，网络结构如下：

具体每个block对应的细节很容易从论文中找到，这里面就不一一贴出了。可以看到很明显的，网络可以很清晰的划分为一个一个block，而且Inception的block都是重复使用，因为它的input和output尺寸是一样的。Reduction主要是用来降低feature map的尺寸。另外每个block中没有标记v的都表示same padding。