首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
2021cvpr专题
Context-Aware Attention Network for Image-Text Retrieval——2021CVPR 中科院
一、研究背景 跨模态问题,图像–文本的双向检索严重依赖于每个图像-文本的联合嵌入学习以及相似性度量。很少有人同时探索单个模态中模态和语义相关性之间的对应。 二、作者对本文的贡献 1、提出了上下文感知注意力网络,可以从全局的角度基于给定的上下文来适应的选择信息片段。其中包括a:单个模态内的语义相关性 b:区域与单词之间的可能的对齐方式。 2、提出了使用语义注意力来捕获模态内的潜在相关性。并且图
阅读更多...
VQA论文2021CVPR
2021CVPR VQA2021论文主要分成几个方面: 1)语言先验,泛化能力:CFVQA;GQA-OOD;How transfer 2)鲁棒性评估:Perception Matters; 3)新设定: 4)其他:TextVQA,OKVQA 5)数据集:多是Video QA 6)预训练: Perception Matters: Detecting Perception Failures of V
阅读更多...