本文主要是介绍Progressive Co-Attention Network for Fine-grained Visual Classification,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、动机
细粒度的视觉分类旨在识别属于同一类别中多个子类别的图像。由于高度混淆的类别之间存在固有的细微差异,因此这是一项具有挑战性的任务。大多数现有方法仅将单个图像作为输入,这可能会限制模型识别来自不同图像的对比线索的能力。在本文中,我们提出了一种有效的方法,称为渐进式共同注意力网络(PCA-Net)来解决这个问题。具体来说,我们通过鼓励同类别图像对内的特征通道之间的互动来计算通道的相似性,以捕捉共同的辨别特征。考虑到互补信息对识别也是至关重要的,我们删除了因通道互动而增强的突出区域,以迫使网络专注于其他鉴别性的区域。所提出的模型在三个细粒度的视觉分类基准数据集上取得了有竞争力的结果。CUB-200-2011, Stanford Cars, and FGVC Aircraft.
把同一个类别的两张图片作为一对,输入网络中。
二、数据集
三、网络结构
这篇关于Progressive Co-Attention Network for Fine-grained Visual Classification的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!