本文主要是介绍分享 | 近距离观察少镜头视频分类:一个新的基线和基准,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
今天介绍一篇我们组和蚂蚁网商银行在小样本视频分类领域的工作 A Closer Look at Few-Shot Video Classification: A New Baseline and Benchmark,发表于BMVC 2021。
现有的小样本视频分类方法往往采用元学习范式并且十分依赖ImageNet预训练,当不使用ImageNet预训练时,这些方法的性能下降严重。通过实验,我们发现这些方法在表示学习上存在缺陷,并针对这一点提出了基于预训练-微调的方法。
此外,我们发现元测试阶段的部分动作类和ImageNet自身的某些类存在高度相关性,这表明使用ImageNet预训练这一做法违背了小样本学习的设定。不使用预训练带来性能下降的另一个原因是现有benchmark的基类样本较少,因此我们重新构建了一个有着充足基类样本的小样本视频分类benchmark以推动在不使用预训练下的小样本视频分类研究。
论文链接:https://www.bmvc2021-virtualconference.com/assets/papers/0190.pdf
代码链接:https://link.zhihu.com/?target=https%3A//github.com/MCG-NJU/FSL-Video
元学习方法回顾
这篇关于分享 | 近距离观察少镜头视频分类:一个新的基线和基准的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!