iccv2021专题

冠军方案 | DeepBlueAI 团队包揽 ICCV2021 无人机挑战赛双冠军!

10月11日至10月17日,2021国际计算机视觉大会International Conference on Computer Vision (ICCV)于线上拉开序幕。此次会议,深兰科技DeepBlueAI团队共参加2项比赛4个赛道,分别在VisDrone Object Detection,VisDroneMot,Large-AI-Food三个赛道获得冠军。VisDrone 已成为无人机领域标杆

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows(ICCV2021)

Swin Transformer 摘要引言方法实验 摘要 本文提出了一种新的Vision Transformer,称为Swin Transformer,可以作为计算机视觉领域的通用主干。将Transformer从NLP应用到CV会面临一些挑战,这些挑战主要来自两个方面:一个是尺度问题,视觉领域中的目标往往尺度差异很大(比如一张街景图像,里面的行人和汽车有大有小),而NLP中的

[ICCV2021]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

标题:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 链接:https://arxiv.org/pdf/2103.14030 动机 现在在CV中使用transformer的最大问题是运算量太大,因为图片的信息量远远大过NLP中文本的信息量,然后再做self attention会导致N平方的复杂度,这

【论文笔记】Active Domain Adaptation via Clustering Uncertainty-weighted Embeddings(ICCV2021)

论文:Active Domain Adaptation via Clustering Uncertainty-Weighted Embeddings 代码:https://github.com/virajprabhu/CLUE 本人计算机视觉研究僧,欢迎交流。 Abstract 本文通过主动学习方式,解决在域适应问题(Domain adaptation)中,选择信息量最大的目标域(target

冠军方案 | DeepBlueAI 团队包揽 ICCV2021 无人机挑战赛双冠军!

10月11日至10月17日,2021国际计算机视觉大会International Conference on Computer Vision (ICCV)于线上拉开序幕。此次会议,深兰科技DeepBlueAI团队共参加2项比赛4个赛道,分别在VisDrone Object Detection,VisDroneMot,Large-AI-Food三个赛道获得冠军。VisDrone 已成为无人机领域标杆

ICCV2021 | DeepBlueAI 团队征战四赛道,一举拿下三项冠军!

10月11日至10月17日,2021国际计算机视觉大会International Conference on Computer Vision (ICCV)于线上拉开序幕。此次会议,深兰科技DeepBlueAI团队共参加2项比赛4个赛道,分别在VisDrone Object Detection,VisDroneMot,Large-AI-Food三个赛道获得冠军。VisDrone 已成为无人机领域标杆

【三维编辑】Editing Conditional Radiance Fields 编辑条件NeRF(ICCV2021)

Editing Conditional Radiance Fields(ICCV 2021) 作者单位:Steven Liu, Xiuming Zhang, Zhoutong Zhang, Richard Zhang MIT, Adobe Research, CMU 代码地址:https://github.com/stevliu/editnerf 文章目录 摘要前言一、相关工作二、

ICCV2021-TOCo-微软CMU提出Token感知的级联对比学习方法,在视频文本对齐任务上“吊打”其他SOTA方法...

关注公众号,发现CV技术之美 0 写在前面 对比学习已被广泛应用于训练基于Transformer的视觉语言模型的视频文本对齐和多模态表示学习等任务。在本文中,作者提出了一种新的token感知级联对比学习(TACo)算法,该算法利用两种技术改进了以往对比学习的缺点。 第一个是通过考虑单词的句法类别(比如:名词、动词、介词)来计算的token感知的对比损失 。这是由于作者观察到,对于视频-文本对,文

【数字人】4、AD-NeRF | 使用 NeRF 来实现从声音到数字人人脸的直接驱动(ICCV2021)

文章目录 一、背景二、方法2.1 适用于 talking head 的神经辐射场2.2 使用辐射场来进行体渲染2.3 独立 NeRF 表达 三、效果 论文:AD-NeRF: Audio Driven Neural Radiance Fields for Talking Head Synthesis 代码:https://github.com/YudongGuo/AD-NeRF

ICCV2021 论文略读

前言 我硕士期间主要关注的方向是少样本学习,长尾分布,噪声标签学习等。之前视野不够开阔,只关注了图像分类相关的工作,但是我意识到要真正的和实际需求相结合,就必须也也关注包括图像分割,目标检测等方向的工作,同时也应该对low level方向的工作有所了解,这些在实际中的用处也很丰富。 这篇文章主要整理自己粗略过一遍ICCV2021自己比较感兴趣的文章,主要是对摘要的阅读和自己的对摘要的理解。