Revisiting-Dilated-Convolution-A-Simple-Approach-for-Weakly-and-Semi-Supervised

本文主要是介绍Revisiting-Dilated-Convolution-A-Simple-Approach-for-Weakly-and-Semi-Supervised,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

when

  • 魏云超组的18年
  • cvpr spot

who

  • 弱监督语义分割问题的新方法,用扩张卷积得到注意力图,可能能够在GAIN的大框架上面修改

why 提出

  • 尽管弱监督分割方法取得了显着的进步,但仍然不如全监督的方法。我们认为性能差距主要来自他们学习从图像级监督产生高质量密集对象定位图的限制。
  • 为了弥补这种差距,我们重新审视了空洞卷积[1]并揭示了如何以一种新颖的方式利用它来有效地克服弱监督分割方法的这一关键限制。具体而言,我们发现不同的扩张率可以有效地扩大卷积核的感受域,更重要的是将周围的鉴别信息转移到非鉴别对象区域,促进这些区域在对象定位图中的出现。
  • 然后,我们设计了一个通用的分类网络,配备了不同扩张率的卷积块。它可以生成密集可靠的对象定位图,并有效地受益于弱监督和半监督语义分割。尽管显而易见,但我们提出的方法获得了优于现有技术的优越性能。
  • 特别是,它在Pascal VOC 2012测试集上实现了60.8%(弱监督设置,仅有图像级标签可用)和67.6%(半监督设置,1,464个分割mask可用)的mIoU得分,这是最先进的效果。

where(适用范围,优点,缺点, 创新点,以前的方法)

出发点

  • 弱监督的图像识别方法 [11, 15, 16, 19, 23, 38-42, 44]已被广泛研究,因为它们不需要昂贵的人力。 其中,最吸引人的是学习仅从图像级标注中分割图像。 对于这样的方法,可以说仍然未解决的最关键的挑战是如何准确和密集地定位对象区域以获得用于启动和改进分割模型训练的高质量对象线索[1, 20, 45]。

  • 最近,一些自上而下的方法 [43, 46] 提出利用分类网络为对象定位产生特定于类的注意力线索。然而,直接采用由图像分类模型产生的注意力只能识别目标对象的小的鉴别区域,其对于训练良好的分割模型而言不够密集和广泛。例如,在图1(b)的第二行中示出了由现有技术的类激活映射(CAM)[46]产生的一些类特定区域定位的样本。可以观察到CAM在通常存在大对象的情况下几乎不产生密集对象区域,这偏离了语义分割任务的要求。 CAM发现的那些区域通常散布在目标物体周围,例如,一些鉴别性的部分,如孩子的头部和手部。无法学习从图像级监督产生密集对象定位是开发性能良好的弱监督分割模型的关键障碍。基于这样的观察,我们提出将鉴别知识从那些稀疏突出的区域转移到相邻的对象区域,从而形成密集的对象定位,这可以基本上有利地提升分割模型学习。

    img

优点

  • 为此,我们重新审视了流行的扩张卷积,并发现它确实提供了适当利用的有希望的解决方案。 扩张卷积最初由Chen等人 [1, 2] 引入,用于语义分割。 一个关键的优点是它可以有效地扩大感受野大小以结合上下文而不引入额外的参数或计算成本。 我们发现这样的特征很好地适合跨图像区域传播鉴别信息并突出显示非鉴别对象区域以产生密集对象定位。 由此推动,我们引入了多个扩张卷积块来增强标准分类模型,如图1(a)所示。

  • 特别是,我们提出的方法通过改变卷积核的扩张率来扩展多尺度的感受域。 通常,分类网络能够识别具有高响应的一个或多个小鉴别部分以正确识别图像。 通过扩大感受野,具有低响应的物体区域可以通过感知周围的高响应环境而获得改善的鉴别力。 这样,目标对象的高响应部分的鉴别信息可以以多个尺度传播到相邻的对象区域,使得它们更容易被分类模型识别。 我们利用CAM [46]为每个卷积块生成对象定位图。 如图1(a)所示,卷积块只能定位两个小的鉴别区域而不扩大扩张率,即d = 1.通过逐渐增加扩张率(从3到9),发现了更多的物体相关区域。

  • 然而,一些真正的负面区域可能以大的扩张率错误地突出显示(例如,对应于d = 9的定位图)。 然后,我们提出了一种简单而有效的抗噪声融合策略来解决这个问题。 该策略可以有效地抑制由放大的感受野激活的与物体无关的区域,并将由不同的扩张块产生的定位图融合成整体突出的物体区域。 从图1(b)所示的例子可以看出,我们的方法对于尺度变化非常稳健,并且能够密集地定位目标对象。

创新点

  • 我们使用由我们提出的方法生成的定位图来生成用于训练分割模型的分割mask。 我们的方法是通用的,可以用于以弱监督和半监督方式学习语义分割网络。

这篇关于Revisiting-Dilated-Convolution-A-Simple-Approach-for-Weakly-and-Semi-Supervised的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/960490

相关文章

uva 10014 Simple calculations(数学推导)

直接按照题意来推导最后的结果就行了。 开始的时候只做到了第一个推导,第二次没有继续下去。 代码: #include<stdio.h>int main(){int T, n, i;double a, aa, sum, temp, ans;scanf("%d", &T);while(T--){scanf("%d", &n);scanf("%lf", &first);scanf

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes 优势 1、构建了一个用于监督原始视频去噪的基准数据集。为了多次捕捉瞬间,我们手动为对象s创建运动。在高ISO模式下捕获每一时刻的噪声帧,并通过对多个噪声帧进行平均得到相应的干净帧。 2、有效的原始视频去噪网络(RViDeNet),通过探

【tensorflow 使用错误】tensorflow2.0 过程中出现 Error : Failed to get convolution algorithm

如果在使用 tensorflow 过程中出现 Error : Failed to get convolution algorithm ,这是因为显卡内存被耗尽了。 解决办法: 在代码的开头加入如下两句,动态分配显存 physical_device = tf.config.experimental.list_physical_devices("GPU")tf.config.experiment

使用django-simple-captcha遇到的坑

使用django-simple-captcha遇到的坑 一站点gongshare.com在做注册功能时验证码采用的django-simple-captcha,因为笔者开发环境采用的Windows 64bit系统,结果安装使用的时候接二连三遇到好几个坑。 django-simple-captcha需要依赖django1.3+、PIL1.1.7+或者Pillow2.0+,根据文档安装后开始使用时,

HYPERCASUAL - Simple Characters(卡通游戏火柴人物模型)

介绍HyperCasual - 简单角色! 一套低多边形角色资源,用于创建超休闲风格的游戏。 包含演示场景 角色(x10) 生化人、小丑、Flaty_Boss、女孩、守门员、英雄、亚马逊女战士、男人、红衣男人、修理工 每个网格大约有700-2000个顶点 角色设置与Mecanim兼容(本包中不包含动画) 着色器适用于可编写脚本的渲染管线(HD + LW) 下载:​​Unity资源商店链接资源

COD论文笔记 ECCV2024 Just a Hint: Point-Supervised Camouflaged Object Detection

这篇论文的主要动机、现有方法的不足、拟解决的问题、主要贡献和创新点: 1. 动机 伪装物体检测(Camouflaged Object Detection, COD)旨在检测隐藏在环境中的伪装物体,这是一个具有挑战性的任务。由于伪装物体与背景的细微差别和模糊的边界,手动标注像素级的物体非常耗时,例如每张图片可能需要 60 分钟来标注。因此,作者希望通过减少标注负担,提出了一种仅依赖“点标注”的弱

【HDU】4975 A simple Gaussian elimination problem. 网络流——行列建边

传送门:【HDU】4975 A simple Gaussian elimination problem. 题目分析:这题和某一场的多校的题目出奇的像啊!重要的是我一开始还以为不可能会出一样的题。。结果迟迟没写啊。。。后来觉得实在想不出什么对策了,虽然觉得给的是0~9很特殊,但是利用不起来,果断还是敲了网络流了。。首先建图很简单,源点向行建边,容量为行和,列向汇点建边,容量为列和,然后所有的

Splay树(区间更新)—— POJ 3468 A Simple Problem with Integers

对应POJ 题目:点击打开链接 A Simple Problem with Integers Time Limit: 5000MS Memory Limit: 131072KTotal Submissions: 72765 Accepted: 22465Case Time Limit: 2000MS Description You have N integers, A1

大文件上传vue插件vue-simple-uploader

https://www.cnblogs.com/xiahj/p/vue-simple-uploader.html

3D Deeply Supervised Network for Automatic Liver Segmentation from CT Volumes

下面博主详细翻译了该篇论文,可以当做详尽的参考,并认真学习。 【参考】论文笔记:3D Deeply Supervised Network for Automatic Liver Segmentation from CT 数据集: MICCAI-SLiver07[1] 数据预处理: 作者没有讲数据预处理的过程。 CRF 轮廓精细修正: 参考上述博主博客。 参考文献: [1]Heimann,