Representation Compensation Networks for Continual Semantic Segmentation

本文主要是介绍Representation Compensation Networks for Continual Semantic Segmentation,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Representation Compensation Networks for Continual Semantic Segmentation

  • Abstract
  • 1. Introduction
  • 2. Related Work
  • 3. Method
  • 3.1. Preliminaries
  • 3.2. Representation Compensation Networks
  • 3.3. Pooled Cube Knowledge Distillation

论文地址
github code
很久没有更新paper reading的内容了,最近发现Continual Semantic Segmentation这个领域有点意思,在这里记录一下。

Abstract

这篇工作研究Continual Semantic Segmentation问题,持续学习的意思是,以语义分割为例,我们经常训练好一个模型后,在后期 的使用中又添加了新的类别信息,这时如果重新和先前的类别一起训练,会耗费大量的时间和资源;如果直接用新的类别的数据集继续训练,会造成catastrophic forgetting的情况,也就是说old knowledge会被遗忘,new knowledge也学不好。本文提出了representation compensation (RC) module,这个模块由两个分支组成,其中一个是冻结的,另一个是可训练的。本文的另一个contribution是设计了一个pooled cube knowledge distillation strategy,在spatial和channel维度上对知识进行蒸馏,提高模型的鲁棒性。

1. Introduction

大概介绍一下Continual Semantic Segmentation,这里解释一些名词,比如Joint Training,也就是在拿到新的类别的训练数据时和先前的老类别训练数据融合在一起重新做训练。模型所具有的能力是,在得到新的类别的训练数据时,模型能很好地分辨旧类别和新类别,同时为了节省花费,新类别的训练数据只标注了新类别,其他类别(包括旧类别)都被归为背景。
本文的网络有两个branch,一个被frozen,保存old knowledge,另一个用来做训练,然后两个分支融合。

2. Related Work

3. Method

3.1. Preliminaries

对于本文一些符号的描述,大家可以阅读原文,这里不再赘述。

3.2. Representation Compensation Networks

对于常规的网络而言,结构都是一个3×3的卷积接一个normalization和激活函数,本文网络添加了一个平行的3×3卷积层+normalization结构,然后两个平行的层最后经过一个融合,然后再经过一个激活函数。
在这里插入图片描述
从图中可以看出,作者的意思是在step t-1,把平行的两个卷积层merge到一起,然后在step t中把merge的这部分冻结,用来保留old knowledge,然后用另外一个分支去学习new knowledge,那么这两个部分是怎么merge到一起的呢?文中给出了公式:
在这里插入图片描述
同时作者也用了一个drop-path策略:
在这里插入图片描述
在训练的时候, η \eta η随机取0,0.5,1,对两个分支在激活函数前做融合,在测试的时候 η \eta η设置为0.5。

3.3. Pooled Cube Knowledge Distillation

知识蒸馏策略,用average pooling在空间和channel维度上对每个stage的特征图做处理,最终要求一个teacher model和student model的loss,说实话这里我不是很理解他的作用机理,可能要看看代码他的细节是如何的。

这篇关于Representation Compensation Networks for Continual Semantic Segmentation的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/275285

相关文章

Chapter 10 Stability and Frequency Compensation

Chapter 10 Stability and Frequency Compensation Chapter 8介绍了负反馈, 这一章介绍稳定性, 如果设计不好, 负反馈系统是要发生震荡的. 首先我们学习理解稳定判断标准和条件, 然后学习频率补偿, 介绍适用于不同运放的补偿方式, 同时介绍不同补偿对两级运放slew rate的影响, 最后介绍Nyquist’s判断标准 10.1 Gener

访问controller404:The origin server did not find a current representation for the target resource

ider build->rebuild project。Rebuild:对选定的目标(Project),进行强制性编译,不管目标是否是被修改过。由于 Rebuild 的目标只有 Project,所以 Rebuild 每次花的时间会比较长。 参考:资料

A Comprehensive Survey on Graph Neural Networks笔记

一、摘要-Abstract 1、传统的深度学习模型主要处理欧几里得数据(如图像、文本),而图神经网络的出现和发展是为了有效处理和学习非欧几里得域(即图结构数据)的信息。 2、将GNN划分为四类:recurrent GNNs(RecGNN), convolutional GNNs,(GCN), graph autoencoders(GAE), and spatial–temporal GNNs(S

Complex Networks Package for MatLab

http://www.levmuchnik.net/Content/Networks/ComplexNetworksPackage.html 翻译: 复杂网络的MATLAB工具包提供了一个高效、可扩展的框架,用于在MATLAB上的网络研究。 可以帮助描述经验网络的成千上万的节点,生成人工网络,运行鲁棒性实验,测试网络在不同的攻击下的可靠性,模拟任意复杂的传染病的传

Convolutional Neural Networks for Sentence Classification论文解读

基本信息 作者Yoon Kimdoi发表时间2014期刊EMNLP网址https://doi.org/10.48550/arXiv.1408.5882 研究背景 1. What’s known 既往研究已证实 CV领域著名的CNN。 2. What’s new 创新点 将CNN应用于NLP,打破了传统NLP任务主要依赖循环神经网络(RNN)及其变体的局面。 用预训练的词向量(如word2v

【机器学习】生成对抗网络(Generative Adversarial Networks, GANs)详解

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 生成对抗网络(Generative Adversarial Networks, GANs)详解GANs的基本原理GANs的训练过程GANs的发展历程GANs在实际任务中的应用小结 生成对

Segmentation简记-Multi-stream CNN based Video Semantic Segmentation for Automated Driving

创新点 1.RFCN & MSFCN 总结 网络结构如图所示。输入视频得到图像分割结果。 简单粗暴

Image Transformation can make Neural Networks more robust against Adversarial Examples

Image Transformation can make Neural Networks more robust against Adversarial Examples 创新点 1.旋转解决误分类 总结 可以说简单粗暴有效

Segmentation简记5-AuxNet: Auxiliary tasks enhanced Semantic Segmentation for Automated Driving

创新点 1.分割网络为主任务,深度估计网络为辅任务 2.loss的设计 总结如图所示 网络结构如图所示 其实很容易理解。 backbone是基于ResNet50 分割网络是基于FCN8 深度估计网络与分割网络类似,最后一层是回归深度层。 最有意思的是两种任务的loss的合并。 分割的loss很常见:cross entropy 深度loss:mean absolute error 算法一:

DS简记1-Real-time Joint Object Detection and Semantic Segmentation Network for Automated Driving

创新点 1.更小的网络,更多的类别,更复杂的实验 2. 一体化 总结 终于看到一篇检测跟踪一体化的文章 网络结构如下: ResNet10是共享的Encoder,yolov2 是检测的Deconder,FCN8 是分割的Deconder。 其实很简单,论文作者也指出:Our work is closest to the recent MultiNet. We differ by focus