使用mmdetection来训练自己的数据集(visdrone)(二)数据集

2024-04-29 15:44

本文主要是介绍使用mmdetection来训练自己的数据集(visdrone)(二)数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据集下载

https://github.com/VisDrone/VisDrone-Dataset

数据集大小:

  • trainset (1.44 GB):
  • valset (0.07 GB):
  • testset-dev (0.28 GB):

VisDrone2019-DET-train.zip
(下载到D:/ultralytics/ultralytics/datasets/VisDrone目录下并解压)
VisDrone2019-DET-val.zip
(下载到D:/ultralytics/ultralytics/datasets/VisDrone目录下并解压)
VisDrone2019-DET-test-dev.zip
(下载到D:/ultralytics/ultralytics/datasets/VisDrone目录下并解压)
VisDrone2019-DET-test-challenge.zip
(下载到D:/ultralytics/ultralytics/datasets/VisDrone目录下并解压)

convert_visdrone2yolo.py (下载到
D:/ultralytics/ultralytics/datasets/VisDrone目录下)
convert_yolo2visdrone.py
注意:VisDrone目录自己创建

visdrone转变代码

import os
from pathlib import Path# 定义一个函数用于将VisDrone数据集的标注转换为YOLO格式的标注
def visdrone2yolo(dir):from PIL import Imagefrom tqdm import tqdm# 定义一个内部函数,用于将VisDrone的bbox坐标转换为YOLO格式的坐标def convert_box(size, box):# VisDrone框转换为YOLO xywh框dw = 1. / size[0]dh = 1. / size[1]return (box[0] + box[2] / 2) * dw, (box[1] + box[3] / 2) * dh, box[2] * dw, box[3] * dh# 创建标签目录,如果不存在则创建(dir / 'labels').mkdir(parents=True, exist_ok=True)# 使用tqdm进度条迭代处理annotations文件夹中的所有txt文件pbar = tqdm((dir / 'annotations').glob('*.txt'), desc=f'Converting {dir}')for f in pbar:# 获取对应图片的大小img_size = Image.open((dir / 'images' / f.name).with_suffix('.jpg')).sizelines = []with open(f, 'r') as file:  # 读取annotation.txt文件for row in [x.split(',') for x in file.read().strip().splitlines()]:if row[4] == '0':  # 忽略VisDrone中的‘ignored regions’类别0continuecls = int(row[5]) - 1box = convert_box(img_size, tuple(map(int, row[:4])))lines.append(f"{cls} {' '.join(f'{x:.6f}' for x in box)}\n")with open(str(f).replace(f'{os.sep}annotations{os.sep}', f'{os.sep}labels{os.sep}'), 'w') as fl:fl.writelines(lines)  # 将转换后的标签写入label.txt文件# 指定数据集的根目录
dir = Path("D:/ultralytics/ultralytics/datasets/VisDrone")# 转换数据集标注
for d in 'VisDrone2019-DET-train', 'VisDrone2019-DET-val', 'VisDrone2019-DET-test-dev':visdrone2yolo(dir / d)  # 转换VisDrone标注为YOLO标签

然后通过yolo转coco的代码

import os
import cv2
import json
from tqdm import tqdm
from sklearn.model_selection import train_test_split
import argparse# 解析命令行参数
parser = argparse.ArgumentParser()
parser.add_argument('--root_dir', default='./dataset/valid', type=str, help="根目录路径,包括./images和./labels及classes.txt")
parser.add_argument('--save_path', type=str, default='./valid.json', help="如果不划分数据集,则提供一个json文件路径")
parser.add_argument('--random_split', action='store_true', help="随机划分数据集,默认比例为8:1:1")
parser.add_argument('--split_by_file', action='store_true', help="根据文件划分数据集,包括./train.txt、./val.txt、./test.txt")arg = parser.parse_args()def train_test_val_split_random(img_paths, ratio_train=0.8, ratio_test=0.1, ratio_val=0.1):# 确保三个比例之和为1assert int(ratio_train + ratio_test + ratio_val) == 1train_img, middle_img = train_test_split(img_paths, test_size=1 - ratio_train, random_state=233)ratio = ratio_val / (1 - ratio_train)val_img, test_img = train_test_split(middle_img, test_size=ratio, random_state=233)print("训练集:验证集:测试集 = {}:{}:{}".format(len(train_img), len(val_img), len(test_img)))return train_img, val_img, test_imgdef train_test_val_split_by_files(img_paths, root_dir):# 根据train.txt, val.txt, test.txt文件定义训练集、验证集和测试集phases = ['train', 'val', 'test']img_split = []for p in phases:define_path = os.path.join(root_dir, f'{p}.txt')print(f'从 {define_path} 读取 {p} 数据集定义')assert os.path.exists(define_path)with open(define_path, 'r') as f:img_paths = f.readlines()# 取消注释下面一行可以使用绝对路径# img_paths = [os.path.split(img_path.strip())[1] for img_path in img_paths]img_split.append(img_paths)return img_split[0], img_split[1], img_split[2]def yolo2coco(arg):root_path = arg.root_dirprint("从路径加载数据", root_path)assert os.path.exists(root_path)originLabelsDir = os.path.join(root_path, 'labels')originImagesDir = os.path.join(root_path, 'images')with open(os.path.join(root_path, 'classes.txt')) as f:classes = f.read().strip().split()indexes = os.listdir(originImagesDir)if arg.random_split or arg.split_by_file:train_dataset = {'categories': [], 'annotations': [], 'images': []}val_dataset = {'categories': [], 'annotations': [], 'images': []}test_dataset = {'categories': [], 'annotations': [], 'images': []}for i, cls in enumerate(classes, 0):category_info = {'id': i, 'name': cls, 'supercategory': 'mark'}train_dataset['categories'].append(category_info)val_dataset['categories'].append(category_info)test_dataset['categories'].append(category_info)if arg.random_split:print("划分模式: 随机划分")train_img, val_img, test_img = train_test_val_split_random(indexes, 0.8, 0.1, 0.1)elif arg.split_by_file:print("划分模式: 根据文件划分")train_img, val_img, test_img = train_test_val_split_by_files(indexes, root_path)else:dataset = {'categories': [], 'annotations': [], 'images': []}for i, cls in enumerate(classes, 0):dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'mark'})ann_id_cnt = 0for k, index in enumerate(tqdm(indexes)):txtFile = index.replace('images', 'txt').replace('.jpg', '.txt').replace('.png', '.txt')im = cv2.imread(os.path.join(root_path, 'images/') + index)height, width, _ = im.shapeif arg.random_split or arg.split_by_file:if index in train_img:dataset = train_datasetelif index in val_img:dataset = val_datasetelif index in test_img:dataset = test_datasetdataset['images'].append({'file_name': index, 'id': k, 'width': width, 'height': height})if not os.path.exists(os.path.join(originLabelsDir, txtFile)):continuewith open(os.path.join(originLabelsDir, txtFile), 'r') as fr:labelList = fr.readlines()for label in labelList:label = label.strip().split()x = float(label[1])y = float(label[2])w = float(label[3])h = float(label[4])H, W, _ = im.shapex1 = (x - w / 2) * Wy1 = (y - h / 2) * Hx2 = (x + w / 2) * Wy2 = (y + h / 2) * Hcls_id = int(label[0])width = max(0, x2 - x1)height = max(0, y2 - y1)dataset['annotations'].append({'area': width * height,'bbox': [x1, y1, width, height],'category_id': cls_id,'id': ann_id_cnt,'image_id': k,'iscrowd': 0,'segmentation': [[x1, y1, x2, y1, x2, y2, x1, y2]]})ann_id_cnt += 1folder = os.path.join(root_path, 'annotations')if not os.path.exists(folder):os.makedirs(folder)if arg.random_split or arg.split_by_file:for phase in ['train', 'val', 'test']:json_name = os.path.join(root_path, 'annotations/{}.json'.format(phase))with open(json_name, 'w') as f:if phase == 'train':json.dump(train_dataset, f)elif phase == 'val':json.dump(val_dataset, f)elif phase == 'test':json.dump(test_dataset, f)print('已保存注释到 {}'.format(json_name))else:json_name = os.path.join(root_path, 'annotations/{}'.format(arg.save_path))with open(json_name, 'w') as f:json.dump(dataset, f)print('已保存注释到 {}'.format(json_name))if __name__ == "__main__":yolo2coco(arg)

运行代码

python yolo2coco.py --root_dir VisDrone2019-DET-train --save_path train.json
python yolo2coco.py --root_dir VisDrone2019-DET-val --save_path val.json
python yolo2coco.py --root_dir VisDrone2019-DET-test-dev --save_path test.json

这篇关于使用mmdetection来训练自己的数据集(visdrone)(二)数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/946502

相关文章

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud