首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
mucko专题
论文浅尝 - IJCAI2020 | Mucko:基于事实的多层跨模态知识推理视觉问答
论文笔记整理:陈卓,浙江大学计算机科学与技术系,博士研究生。 论文链接:https://arxiv.org/pdf/2006.09073 代码:https://github.com/astro-zihao/mucko 发表会议:IJCAI 2020 任务定义及背景 VQA(视觉问答)顾名思义,也就是结合视觉的信息来回答问题。其于15年被提出,涉及的方法从最开始的联合编码,到双线性融合,注意力
阅读更多...