本文主要是介绍【论文总结】weakly- and semi-supervised learning of a DCNN for semantic Image Segmentation,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、概述
这篇文章研究了如何从弱注释的训练数据(如边界框或图像级标签)或少量强标记图像和许多弱标记图像的组合中学习DCNN用于语义图像分割的问题,在弱超监督和半监督条件下提出了期望最大化(EM)方法。
代码:https://bitbucket.org/deeplab/deeplab-public(caffe框架)
二、研究内容及方法
文章将焦点放在用弱标签训练调参上,所以训练阶段没使用CRF,只在测试阶段使用。
编码:m表示像素,Ym表示像素m的标签。如果图片上出现了第个标签,即 则 zl = 1 。
(一)像素级标注(看不到)通过mini-batch梯度下降优化损失函数J(θ)。
(二)图像级标注(可看到):提出EM方法学习模型参数θ,分为EM-Fixed 和 EM-Adapt。
EM-Fixed 如下图Algorithm 1所示:
算法先将logP(z|y) 因式分解,这样可以独立计算每个像素的E-step分割。设定前景偏置(fg bias)大于背景偏置(bg bias),避免将某些像素归为背景里。过程如下图所示:
这篇关于【论文总结】weakly- and semi-supervised learning of a DCNN for semantic Image Segmentation的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!