[论文分享] Self-Promoted Prototype Refinement for Few-Shot Class-Incremental Learning

本文主要是介绍[论文分享] Self-Promoted Prototype Refinement for Few-Shot Class-Incremental Learning,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这篇论文是CVPR’ 2021的一篇Few-Shot增量学习(FSCIL)文章

No.content
PAPER{CVPR’ 2021} Self-Promoted Prototype Refinement for Few-Shot Class-Incremental Learning
URL论文地址
CODE代码地址

1.1 Motivation

· 小样本增量学习增量类别样本过少,不足以训练好分类和蒸馏过程,不能像现有增量学习方法那样促进表示空间进一步扩展。

· 新类别样本不足以支撑在维持旧类性能的同时在新类上学习到区分性很好的分类器。

· 新类样本不足,用于分类的prototype在增量学习后容易与其他类混淆,从而极大地影响后续任务的完成。

 

1.2 Contribution

· 采用随机episode选择策略(RESS),通过强制特征自适应于各种随机模拟的增量过程来增强特征表示的可扩展性。

· 引入了一种自提升的原型细化机制(SPPR),利用新类样本和旧类prototype表示之间的关系矩阵来更新现有的prototype。

 

1.3 Method


模型结构
1.3.1 Standard Learning Paradigm

对于增量任务中base classes的训练过程,采用标准的分类pipeline。采用VGG或ResNet等分类器提取特征
R q = f e ( Q ; θ e ) R_q=f_e(Q;\theta_e) Rq=fe(Q;θe)
然后通过参数为 θ m \theta_m θm分类器 f m f_m fm进行分类(包括非参数的最近临分类器和余弦分类器、有参数的线性分类器), θ p \theta_p θp是可学习的原型
S = s o f t m a x ( f m ( R q , θ p ; θ m ) ) S=softmax(f_m(R_q,\theta_p;\theta_m)) S=softmax(fm(Rq,θp;θm))
例如余弦分类器上述公式可以写为:
S i = e x p ( η ( θ p i T ⋅ R q ) ) ∑ j e x p ( η ( θ p j T ⋅ R q ) ) S_i=\frac{exp(\eta(\theta^{i^T}_{p}\cdot R_q))}{\sum_jexp(\eta(\theta^{j^T}_{p}\cdot R_q))} Si=jexp(η(θpjTRq))exp(η(θpiTRq))
其中 η \eta η是scale。通过随机采样query图像样本来训练优化 θ \theta θ,通过如下公式最小化损失函数 L L L
θ ∗ = arg ⁡ min ⁡ θ L ( S i , T ) \theta_*=\arg\min\limits_{\theta}L(S_i,T) θ=argθminL(Si,T)
上式中的 θ \theta θ包括 θ e , θ p , θ m \theta_e,\theta_p,\theta_m θe,θp,θm等。分类任务中, L L L大多采用CE Loss。

1.3.2 Incremental Prototype Learning

这部分作者提出了一个增量原型学习策略来解决standard learning中表示缺少可扩展性的问题。

Random Episode Selection

通过随机采集episode强制梯度适应随机生成的不同模拟增量过程,提高了特征表示的可扩展性。

与few-shot任务中识别一个episode的 N w a y N way Nway目的不同,作者提到设计模拟增量过程的目标是通过 N w a y N way Nway的少量样本来识别所有看到的类。

具体来说,除了上面查询的图像 Q Q Q之外,模型的输入还包含一个随机从 b a s e base base训练集 X 1 X^1 X1中选取的 N − w a y K − s h o t N-way \ \ K-shot Nway  Kshot集合 C C C。如图所示,在每次迭代中,从标签空间 Y 1 Y^1 Y1中随机选择 N N N个类,然后选择 K K K个样本用于特征提取器。得到的嵌入对每个类取平均值:
R S = m e a n ( f e ( C ; θ e ) ) R_S = mean(f_e(C;\theta_e)) RS=mean(fe(C;θe))
最后,假设这 N N N个类在此迭代之前没有出现过,因此它们对应的原型将被删除
θ p N = C ∣ Y 1 ∣ ∣ Y 1 ∣ − N ( θ p ) \theta^N_p=\mathbb{C}^{|Y^1|-N}_{|Y^1|}(\theta_p) θpN=CY1Y1N(θp)
∣ Y 1 ∣ |Y^1| Y1即为标签集 Y 1 Y^1 Y1的类别数, C \mathbb{C} C表示确定项目集合中可能分配的数学操作。

最终的分类过程如下
S = P ( R q ∣ R s , θ P N ) S=P(R_q|R_s,\theta^N_P) S=P(RqRs,θPN)

Dynamic Relation Projection

为了保持旧类间的依赖并增强新类间的区分度,作者提出了自促进prototype精炼机制,
θ p ′ = f u ( R s , θ p N ; θ u ) \theta^{'}_p=f_u(R_s,\theta^N_p;\theta_u) θp=fu(Rs,θpN;θu)
首先通过变换将标准学习与增量学习原型转换到统一隐空间
T s = f t 1 ( R s ; θ t 1 ) T p = f t 2 ( θ p N ; θ t 2 ) T_s=f_{t_1}(R_s;\theta_{t_1})\\ T_p=f_{t_2}(\theta^N_p;\theta_{t_2}) Ts=ft1(Rs;θt1)Tp=ft2(θpN;θt2)
f t 1 f_{t_1} ft1 f t 2 f_{t_2} ft2由标准1x1卷积、BatchNorm、ReLU组成。随后在新旧类之间计算余弦相似度
T Y 1 = C o n c a t ( [ T s , T p ] ) C o r r = T p ⋅ T Y 1 T T_{Y^1}=Concat([T_s,T_p])\\ Corr=T_p\cdot T^T_{Y^1} TY1=Concat([Ts,Tp])Corr=TpTY1T
由此可以获得新旧类之间的关系矩阵,将其作为原型优化的过渡系数
θ p ′ = C o r r T ⋅ θ p N \theta_{p}^{'}=Corr^T\cdot \theta^N_p θp=CorrTθpN
由于精炼机制不仅明确考虑了新旧类之间的关系,而且在随机选择过程的指导下,原型动态地向维护已有知识和增强新类辨别能力的方向移动。
作者认为,在设计的这种学习机制下,模型不仅学习表示,而且鼓励网络向更利于后续增量任务的方向优化。

 

1.4 Analysis

作者分析了伪增量设置更新次数的影响,
在这里插入图片描述
发现在base classes上,更新两次效果最好,也就是说,最后60个类的原型将通过50个类的伪base prototype(每次5个类)的两次增量更新获得。如上图(a)所示。

作者还探讨了train、test的way/shot大小的影响以及不同测试方法的影响如上图所示。

【参考文献】
[1] Zhu K, Cao Y, Zhai W, et al. Self-Promoted Prototype Refinement for Few-Shot Class-Incremental Learning[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 6801-6810.

这篇关于[论文分享] Self-Promoted Prototype Refinement for Few-Shot Class-Incremental Learning的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/168768

相关文章

linux进程D状态的解决思路分享

《linux进程D状态的解决思路分享》在Linux系统中,进程在内核模式下等待I/O完成时会进入不间断睡眠状态(D状态),这种状态下,进程无法通过普通方式被杀死,本文通过实验模拟了这种状态,并分析了如... 目录1. 问题描述2. 问题分析3. 实验模拟3.1 使用losetup创建一个卷作为pv的磁盘3.

MySQL8.2.0安装教程分享

《MySQL8.2.0安装教程分享》这篇文章详细介绍了如何在Windows系统上安装MySQL数据库软件,包括下载、安装、配置和设置环境变量的步骤... 目录mysql的安装图文1.python访问网址2javascript.点击3.进入Downloads向下滑动4.选择Community Server5.

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具

10个Python自动化办公的脚本分享

《10个Python自动化办公的脚本分享》在日常办公中,我们常常会被繁琐、重复的任务占据大量时间,本文为大家分享了10个实用的Python自动化办公案例及源码,希望对大家有所帮助... 目录1. 批量处理 Excel 文件2. 自动发送邮件3. 批量重命名文件4. 数据清洗5. 生成 PPT6. 自动化测试

10个Python Excel自动化脚本分享

《10个PythonExcel自动化脚本分享》在数据处理和分析的过程中,Excel文件是我们日常工作中常见的格式,本文将分享10个实用的Excel自动化脚本,希望可以帮助大家更轻松地掌握这些技能... 目录1. Excel单元格批量填充2. 设置行高与列宽3. 根据条件删除行4. 创建新的Excel工作表5

Redis多种内存淘汰策略及配置技巧分享

《Redis多种内存淘汰策略及配置技巧分享》本文介绍了Redis内存满时的淘汰机制,包括内存淘汰机制的概念,Redis提供的8种淘汰策略(如noeviction、volatile-lru等)及其适用场... 目录前言一、什么是 Redis 的内存淘汰机制?二、Redis 内存淘汰策略1. pythonnoe

Golang操作DuckDB实战案例分享

《Golang操作DuckDB实战案例分享》DuckDB是一个嵌入式SQL数据库引擎,它与众所周知的SQLite非常相似,但它是为olap风格的工作负载设计的,DuckDB支持各种数据类型和SQL特性... 目录DuckDB的主要优点环境准备初始化表和数据查询单行或多行错误处理和事务完整代码最后总结Duck

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

VUE动态绑定class类的三种常用方式及适用场景详解

《VUE动态绑定class类的三种常用方式及适用场景详解》文章介绍了在实际开发中动态绑定class的三种常见情况及其解决方案,包括根据不同的返回值渲染不同的class样式、给模块添加基础样式以及根据设... 目录前言1.动态选择class样式(对象添加:情景一)2.动态添加一个class样式(字符串添加:情

C#读取本地网络配置信息全攻略分享

《C#读取本地网络配置信息全攻略分享》在当今数字化时代,网络已深度融入我们生活与工作的方方面面,对于软件开发而言,掌握本地计算机的网络配置信息显得尤为关键,而在C#编程的世界里,我们又该如何巧妙地读取... 目录一、引言二、C# 读取本地网络配置信息的基础准备2.1 引入关键命名空间2.2 理解核心类与方法