首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
transvg专题
RIS 系列 TransVG++: End-to-End Visual Grounding with Language Conditioned Vision Transformer 论文阅读笔记
RIS 系列 TransVG++: End-to-End Visual Grounding with Language Conditioned Vision Transformer 论文阅读笔记 一、Abstract二、引言三、相关工作3.1 视觉定位两阶段方法单阶段方法视觉编码器的融合 3.2 Transformer视觉任务中的 Transformer视觉-语言任务中的 Transform
阅读更多...