本文主要是介绍convolution backbone network——GCNet,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond
paper: https://arxiv.org/pdf/1904.11492.pdf
github: https://github.com/xvjiarui/GCNet
单位: 清华,香港科技大学,微软
摘要: 非局域网(NLNet)通过将查询特定的全局上下文分配给每个查询位置,提供了一种捕获远程依赖关系的开创性方法。然而,通过严格的实证分析,我们发现由非本地网络建模的全局上下文对于图像内的不同查询位置几乎相同。在本文中,我们利用这一发现创建了一个基于查询独立公式的简化网络,该公式保持了NLNet的准确性,但计算量明显减少。我们进一步观察到这种简化设计与Squeeze-Excitation Network(SENet)具有相似的结构。因此,我们将它们统一为全球背景建模的三步一般框架。在一般框架内,我们设计了一个更好的实例化,称为全局上下文(GC)块,它是轻量级的,可以有效地建模全局上下文。轻量级属性允许我们将其应用于骨干网络中的多个层以构建全局上下文网络(GCNet),该网络通常在各种识别任务的主要基准上优于模拟NLNet和SENet。
引言
- 远程依赖建模
- 第一种是采用自我关注机制来模拟成对关系
- 第二种是建立与查询无关的全局上下文;如SENet,GENet,PSANet执行缩放到不同的通道以使用全局配置来校准通道依赖性。然而,所有这些方法都采用重新缩放来进行特征融合,这对于全局上下文建模来说不够有效
- GCNet是NLNet和一个轻量级SENet的融合。
GCNet框架
这篇关于convolution backbone network——GCNet的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!