Preface 目前我正在处理几个 Video Caption 的数据集,一个是 YoutubeClips 数据集。其标注是微软发布的一个 Microsoft Research Video Description Corpus ,安装完成后,会得到一个 CSV 文件,这个文件如下: 第一列是视频名称,第二列 Start 是标注的开始帧数,第三列 End 是标注的结束帧数,第七
multiple small synopsis from short video I) Douying/Tiktok1.1) Plato1.1.nil) website address1.1.1) 理念论1.1.2) ideal country I) Douying/Tiktok 1.1) Plato 1.1.nil) website address url resou