ucm专题

【Image captioning】UCM字幕生成Resnet特征

1. 分析数据规模 UCM-Captions数据集是基于UCM-Merced大学土地利用数据集构建的。图像来自美国地质调查局的国家地图城市区域。UCM-Captions数据集包含21个类别,包括飞机、海滩、高架桥和体育场等,总共有2100张遥感图像。UCM-Captions数据集中的一些样本如图5所示。每张遥感图像的分辨率为256 × 256像素,并配备有5个不同的标题标签。整个数据集使用368