本文主要是介绍ICCV 2019 image-text相关论文总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
ICCV 2019 image-text相关论文总结
1. Local Relation Networks for Image Recognition
issue: CNN用固定的filters来提取image feature,但image的空间分布是多变的,不能很好的满足image不同的空间分布。
method: 提出local relation layer,用于改进CNN。通过局部区域的关系(relationship)来计算每个local的权重,从而来融合特征。
2. Visual Semantic Reasoning for Image-Text Matching
issue: image-text matching的语义gap问题,image的表示缺乏全局的语义内容信息。
mehtod: 利用reason model来生成包含关键object和语义信息的visual representation。先建立image regions之间的关系,之后利用GCN生成语义关系的特征,在此基础上利用门机制和memory机制来生成全局的语义特征。如图,这样提取的特征即包含了key obje
这篇关于ICCV 2019 image-text相关论文总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!