本文主要是介绍CNN的旋转不变性和pooling,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
卷积神经网络本身的设计对旋转不变性没有进行专门的考虑,只不过max-pooling可以稍微补偿一下这个功能,只是角度变化太大,可能会作用不大,但因为max-pooling并不是为此而设计的,所以总体上说CNN提取旋转不变的特征能力是比较弱的。
论文Group Equivariant Convolutional Networks和spherical CNNs对网络结构的旋转不变性设计进行了理论分析,其中提出了群论的思想。那么,引入群论有什么作用呢?群有一个性质,如果两个群满足双射的条件,也即存在一个变换,可以让两个群的元素一一对应,那么就称这两个群是同构的。原文中的同构特指等距同构。等距同构是指在度量空间之间保持距离关系的同构。在几何学中对应全等变换。同构的群具有一样的群性质,研究其中任何一个群得到的结论可以适用于与其同构的群。根据本文的理解,作者的意思是将输入的旋转或者镜面翻转的图像看成是对原图进行操作,对应一个群,要找到另一个群对卷积核进行操作,得到的结果须跟原图原卷积核处理得到的结果一样,也就是等变性。这里同构指的是对原图进行操作的群和对核,或者按照原文的说法,对图像所在空间进行操作的群满足一一对应的关系,并且均满足对称群的条件。既然群性质一样,那么就可以通过分析对核操作的群来间接分析对原图进行操作的群,获取变换后的图像信息。
---------------------
原文:https://blog.csdn.net/legend_hua/article/details/81810666
这篇关于CNN的旋转不变性和pooling的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!