referformer专题

CVPR 2022 | 刷新4个SOTA！港大字节开源ReferFormer: 语言作为查询的参考视频目标分割框架...

点击下方卡片，关注“CVer”公众号 AI/CV重磅干货，第一时间送达在本文中，来自香港大学和字节跳动的研究者们提出了一种基于Transformer的参考视频目标分割新框架ReferFormer。其将语言描述视为查询条件，直接在视频中查找目标对象，除此之外，通过实例序列的整体输出自然地完成目标物体的跟踪，无需进行任何后处理。ReferFormer在四个参考视频目标分割数据集上都取得了当前最优的