本文主要是介绍深度学习小笔记03-,3*3的卷积核为什么可以代替5*5的卷积核和7*7的卷积核以及参数怎么算,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
先贴两个博客:
为什么一个5x5的卷积核可以由两个3x3的卷积核替代?(这个不要重要)
5x5卷积核可以用2个3x3卷积核替代的原因(这个不重要)
看图解决所有
这张图被用烂了。
在一个卷积层,因为权值共享,所以一个3x3只有9个w和一个b这些权值。当stride=1时,5x5的矩阵被卷积成3x3,然后再经过一个3x3后就可以变成1x1,也就是说,经过两个3x3的卷积核后,一个值对应的数据源实际上是一个5x5的覆盖范围(这就是感受野的概念)。同时,因为激活函数的存在,两个3x3对于信息的表现能力要比5x5好,毕竟5x5直接上的话,实际上在5x5的方格内部之间实际上是线性关系,最后的值是线性组合的结果2个3x3和一个5x5的关系就像是线性分类器和有激活函数的神经网络之间的关系。以此类推,我就不画图了,草稿纸上自己画画就好,3个3x3就可以覆盖一个7x7的感受野。特别指出:当stride=2时,两个3x3的卷积核就可以覆盖一个7x7的感受野,第一次卷积,在x方向把1234567提取出246为anchor的卷积结果,然后再来一次,就得到4的anchor的结果(这只是直观的描述,因为我懒得画图),刺激 (加粗的这段是我自己的理解和胡扯,看看就好)
这篇关于深度学习小笔记03-,3*3的卷积核为什么可以代替5*5的卷积核和7*7的卷积核以及参数怎么算的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!