本文主要是介绍目标检测常见数据集格式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目标检测常见的数据集格式COCO、YOLO、VOC、DATA。
1、COCO
数据标注格式JSON,JSON文件中包含多个关键字段,如info、images、annotations等,分别存储了数据集的基本信息、图像信息和标注信息
COCO数据集的下载
官网地址:http://cocodataset.org/#download
2014年数据集的下载
train2014:http://images.cocodataset.org/zips/train2014.zip
val2014:http://images.cocodataset.org/zips/val2014.zip
http://msvocds.blob.core.windows.net/coco2014/train2014.zip
2017的数据集的下载
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip
2、YOLO
YOLO算法专用的数据集格式,其标签文件为TXT格式。
每个TXT文件对应一张图片,文件中包含了图片中所有目标的类别和边界框坐标。
TXT文件中的每一行代表一个目标,包括目标的类别编号和边界框的中心坐标(x_center, y_center)、宽度(w)和高度(h),这些值都是相对于整张图片的比例
3、VOC
标签格式XML,每个XML文件对应一张图片,文件中包含了图片中所有目标的位置(通过边界框的坐标表示)和类别信息。
XML文件中包含了图片的文件夹名、文件名、尺寸信息以及一个或多个目标对象的信息。每个目标对象的信息包括类别名、姿态、是否被部分遮挡、是否为难以辨识的物体等,以及边界框的坐标(xmin, ymin, xmax, ymax)
下载:
VOC2007:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html
train/val:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
test:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
VOC2012:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html
train/val:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
4、DOTA
DOTA是一个遥感图像数据集,专门用于航空图像中的目标检测任务。
DOTA采用旋转框标注方式,以适应遥感图像中目标的任意方向。
标注格式:xml/txt 四点坐标标注
官网:
https://captain-whu.github.io/DOTA/dataset.html
这篇关于目标检测常见数据集格式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!