使用mmrotate对自定义数据集进行检测

2024-02-06 00:44

本文主要是介绍使用mmrotate对自定义数据集进行检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这里写自定义目录标题

  • 安装
    • 虚拟环境创建与准备
    • 安装mmrotate
  • 自定义数据集
    • 标注数据与格式转换
    • 数据集划分与大图像切片
  • 训练与测试
    • 修改配置文件
    • 执行训练
    • 进行测试
      • 鸣谢

安装

mmrotate是一个自带工作目录的python工具箱,个人觉得,在不熟悉的情况下,还是每次使用时都git一个新的下来为好。

虚拟环境创建与准备

首先,确保自身已经安装了Anaconda,然后执行以下命令以创建名为openmmlab的虚拟环境:

conda create -n openmmlab python=3.10

随后,进入虚拟环境:

conda activate openmmlab

之后,去pytorch官网下载gpu版本的pytorch,其中package选择使用conda。
pytorch下载界面
本人要执行的命令就是:

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

CUDA不必追求最新版本,适合自身硬件环境即可

安装mmrotate

首先,在openmmlab环境中安装基础库:

pip install -U openmim
mim install mmcv-full
mim install mmdet\<3.0.0

随后,安装mmrotate,因为本人进行的是旋转框检测,所以需要对mmrotate进行开发和参数重写,因此不直接采用pip install mmrotate这种安装,而是采用以下:

git clone https://github.com/open-mmlab/mmrotate.git
cd mmrotate
pip install -v -e .

自定义数据集

标注数据与格式转换

采用labelme将标注成四边形,生成json文件。本检测中mmrotate使用DOTA数据集格式,因此需要进行一次格式转换,转换为如下的DOTA数据集格式并存储于txt文件内:
x1, y1, x2, y2, x3, y3, x4, y4, object_classname, difficult
x1, y1, x2, y2, x3, y3, x4, y4, object_classname, difficult
...
其中x1,y1为第一个点的坐标,x2,y2为第二个点的坐标,以此类推。object_classname 为类别名,中间不要有空格,difficult为难度,一般0或1即可,有些情况下会出现2。
关于DOTA的格式转换,我参考了这篇博客,在此对转换过程略过。
通过labelme标注产生的x1等数字可能是浮点数,这并不会影响检测效果。

数据集划分与大图像切片

由于我采用的是几个遥感图像场景,尺度非常之大,而数量又很少,因此在进行进一步操作前,先手动将其中几景划分为train集,几景划分为test集,分别放在不同的文件夹内。
在/tools/data/dota/split/split_configs/目录下找到ss_train.py、ss_val.py,主要修改img_dirs、ann_dirs,sizes,save_dir,save_ext这几个参数
数据集参数
随后,执行以下命令以完成数据集切片:

python tools/data/dota/split/img_split.py --base_json tools/data/dota/split/split_configs/ss_train.json
# AND
python tools/data/dota/split/img_split.py --base_json tools/data/dota/split/split_configs/ss_val.json

切片完成后的数据集的样本数会非常大,但是对于大场景,尤其是遥感影像来说,很多切片内都是空白的,直接将其输入到model里进行训练未免效率过于低下,因此对数据集做一次精简,排除无标签的数据:

import os
directory = '/path/to/your/train/annfiles'
for filename in os.listdir(directory):if filename.endswith('.txt'):filepath = os.path.join(directory, filename)if os.path.isfile(filepath):with open(filepath, 'r') as file:# 使用 seek 和 tell 来判断文件是否有内容initial_position = file.tell()file.seek(0)content = file.read(1)  # 只读取一个字节file.seek(initial_position)  # 回到初始位置,不影响后续操作# 如果内容为空或只有一个换行符(有些空文件可能含有一个换行符)if not content or content == '\n':# 要对空文件执行的操作if os.path.exists(filepath) and os.path.isfile(filepath):try:os.remove(filepath)print(f"成功删除文件: {filepath}")except Exception as e:print(f"删除文件时发生错误: {e}")else:print(f"文件 {filepath} 不存在或不是普通文件,无法删除")filepath2=filepath.replace('annfiles','images').replace('.txt','.png')if os.path.exists(filepath2) and os.path.isfile(filepath2):try:os.remove(filepath2)print(f"成功删除文件: {filepath2}")except Exception as e:print(f"删除文件时发生错误: {e}")else:print(f"文件 {filepath2} 不存在或不是普通文件,无法删除")

训练与测试

修改配置文件

具体来说,有以下几处地方需要修改:

  1. 在train.py中将config改为–config,然后添加default值,指向configs/rotated_faster_rcnn/rotated_faster_rcnn_r50_fpn_1x_dota_le90.py:
parser.add_argument('--config', default='configs/rotated_faster_rcnn/rotated_faster_rcnn_r50_fpn_1x_dota_le90.py',help='train config file path')
  1. 在train.py中将work-dir改为–work-dir,然后添加default值,指向run
parser.add_argument('--work-dir', default='run',help='the dir to save logs and models')
  1. 在rotated_faster_rcnn_r50_fpn_1x_dota_le90.py中将numclass改为自己数据集的种类数
  2. 在mmrotate/datasets/dota.py中修改自己的类别的名字,仅一个类时,末尾需要加逗号
  3. 在configs/base/datasets/dotav1.py中修改数据路径,其中test数据集无需annfiles
  4. 在/home/zanyinkai/mmrotate/configs/base/schedules/schedule_1x.py中修改自己的epoch等参数

执行训练

python tools/train.py

进行测试

python tools/test.py --show_dir 'work_dir/vis'

鸣谢

本人在进行mmrotate时,参考了以下内容:
基于MMRotate训练自定义数据集 做旋转目标检测 2022-3-30
MMRotate文档

这篇关于使用mmrotate对自定义数据集进行检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/682680

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测