本文主要是介绍17-WILDCAT-Weakly-Supervised-Learning-of-DeepConvNets,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
who(对谁有效)
- 弱监督
- 图像语义分割
where
- 只有图像级标签的数据
when
- CVPR 2017
what(WILDCAT是什么)
- 这篇论文提出了一个框架,可以使用弱监督的方法识别一个物体显著的局部特征。
- 首先我们来直观感受下结果,如下图所示,WILDCAT可以识别狗的头部和腿部信息,从而利用这些信息来对狗进行Localization和segmentation.
- 结构
- 从上图我们可以看出,整个网络的架构分成三个部分:最左边是FCN部分,主要是用来提取feature map; 中间的部分是Multi-map transfer layer,主要是将feature map分解为多通道的特征,每个通道对应于一个显著的局部特征;最右边是Pooling操作,主要是将生成的多通道feature map aggregate 到一个值,最后使用image level的ground truth信息进行学习。下面来分别讲解这三个部分。
how (如何实现的)
1. Multi-map transfer layer
这篇文章使用1x1convolution将feature map由w x h x d 转变成 w x h x MC。 其中M代表通道的数目,代表feature map的个数;
这篇关于17-WILDCAT-Weakly-Supervised-Learning-of-DeepConvNets的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!