2016-CVPR-FCN in the Wild 论文学习笔记

2024-02-19 17:20

本文主要是介绍2016-CVPR-FCN in the Wild 论文学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

1.介绍

 2.详解

(1)Lda:

(2)Lmi:

①存在约束:

②大小约束:

 3.代码(待填坑)


《Fcns in the wild:pixel-level adversarial and constraint-based adaption》

1.介绍

这篇文章发表于 2016 年cvpr,是最早把域自适应⽤到语义分割当中的论文。文章主要针对domain shift 的问题。⼀种是全局域偏移,⽐如说在合成的游戏场景和真实场景之间的差异, 导致特征空间的边际分布产⽣偏移。⼀种是特定类型的偏移,⽐如说两个城市的路标外观不同,所以产⽣了偏移。下⾯这张图⽚来⾃《Learning from Synthetic Data: Addressing Domain Shift for Semantic Segmentation》(2018cvpr),主要说明了 domain shift 的定义。

网络模型如下:

 

简单介绍:

首先第⼀步就是⽤源域的图像和标注对模型进⾏训练。然后解决全局域偏移的问题, 选取了在预测前的最后⼀层特征层,通过源域和目标域的对抗学习,进行特征对齐,来最小化两个域特征层的偏差。然后是特定类别的对齐,采用的是 MI Loss(L_mi(第i个类别的具体参数)是某一个具体类别的参数的适应),对图片中类别是否存在进⾏判断,突出存在的类别,抑制不存在的类别的存在(存疑)。

图⽚中这个class size distribution 说的是对于有标注的源域,针对某⼀个 c,它统计了c 的像素数⽬占整体像素数数目的⽐例,然后排序,计算平均值。把类别 c 的尺寸大小约束在平均值和前百分之 10最⼤值中。

 2.详解

(1)Lda:

设φl−1(θ, I)表示根据网络参数θ进行像素预测前最后一层的输出。然后,我们的领域对抗性损失Lda(IS, IT)由交替最小化目标组成。

一种是关于表示空间的参数θ,在该参数下,我们想要最小化观测源和目标的距离,对于给定的距离函数d(·),min d(φ l−1(θ, IS), φ l−1(θ, IT)。

第二种是通过训练域分类器来估计距离函数,以区分源域和目标域的实例。我们将域分类器参数表示为θD。然后,我们试图学习一个域分类器来识别源和目标区域之间的差异,并使用该分类器来指导源和目标表示的距离最小化

迭代优化这两个目标,即学习相关图像区域的最佳可能的域分类器(Eq(6)),然后利用该域分类器的损失来通知图像表示的训练,从而最小化源和目标域之间的距离(Eq(7))。

(2)Lmi:

修改类别特定的网络参数进一步适应我们的源模型。该算法引入了一个完全卷积约束的多实例学习objective。这项工作使用“大小和存在”约束(constrain)产生一个预测的目标标记,用于进一步训练。

存在约束

MIL LOSS(出自于另外一篇文章)(ICLR2015年上的《Fully Convolutional Multi-Class Multiple Instance Learning》。弱监督语义分割 | 使用图片类别进行图像分割之MIL Loss (baidu.com)

使用图像级别的标注进行语义分割。

大小约束

计算每个源域图像标记(label)统计数据PLS,具体来说,对于包含类c的每个源图像,我们计算具有该类对应的GT标签的图像像素的百分比。(该类所占大小的百分比).这些百分比上计算一个直方图,并表示低的10%为下边界αc,平均值为δc,和高的10%为上边界γc.然后,我们可以使用这个分布来inform我们的目标域大小限制,从而显式地将场景布局信息从源传输到目标域。

例如,在驾驶场景中,道路通常占据图像的很大一部分,而街道标识占据相对较少的图像空间。这一信息对于约束多实例学习过程至关重要。对输出预测映射施加了以下约束:p = arg max φ(θ, IT ).这样标记为c类的图像的百分比就在源域中观察到的预期范围内,实际上,我们用松弛的下界来优化这个目标,以允许出现异常情况,即c在图像中所占的面积比源域的平均值要少。然而,我们不允许在上界约束上有松弛,因为不允许单个类占用任何给定图像的太多空间。注意,我们更新的约束是通用的,可以等价地应用于所有类,不管它们是否符合传统的instance概念(如自行车或人)或things概念(如天空或植被)。存在问题是大类别会过拟合。

我们使用一个简单的大小约束,即如果源类分布的 αc大于0.1,那么我们将这些类的梯度降低0.1倍。这种重新加权的方法可以被视为class的重新抽样,以便更接近一个平衡的集合,使相对较小的class有可能被inform到目标函数。首先预测图像级标签,然后优化像素预测,满足源传输类的大小约束。给定目标图像IT,我们计算输出类预测,p = arg max φ(θ, IT)。对于每个类,我们计算当前预测中分配给该类的像素的百分比dc。最后,如果dc > 0.1 * αc,我们分配一个图像级标签给类c,这意味着我们当前标记的像素,至少为图像中出现的真实类的预期数量的10%。(这里是给的区域吗?需要看一下代码

 3.代码(待填坑)

参考:语义分割-FCNs in the wild: Pixel-level adversarial and constraint-based adaptation 对抗方法实现不同数据集语义分割_HheeFish的博客-CSDN博客FCNs in the Wild: Pixel-level Adversarial and Constraint-based Adaptation_odss的博客-CSDN博客

这篇关于2016-CVPR-FCN in the Wild 论文学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/725369

相关文章

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识