DOTA数据集转VOC数据集,模仿DIOR数据集类型

2023-12-12 02:10

本文主要是介绍DOTA数据集转VOC数据集,模仿DIOR数据集类型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DOTA文本数据集转XML格式

说明:由于本人比较喜欢DIOR数据集格式,所以仿照DIOR数据集转的相同格式

DOTA数据集下载链接:https://pan.baidu.com/s/1lksAYbogYT3OjTBzNuQuNA
提取码:7vwv

DOIR数据集下载链接:
https://pan.baidu.com/s/1QPALicrLHqhblnGu_EBjlw
提取码:jcpg

代码如下(改了网上的代码,此处贴上链接)

import os
from xml.dom.minidom import Document
from xml.dom.minidom import parse
import xml.dom.minidom
import numpy as np
import csv
import cv2
import stringdef WriterXMLFiles(filename,img_name, path, box_list, label_list, w, h, d):# dict_box[filename]=json_dict[filename]doc = xml.dom.minidom.Document()root = doc.createElement('annotation')doc.appendChild(root)# foldername = doc.createElement("folder")# foldername.appendChild(doc.createTextNode("JPEGImages"))# root.appendChild(foldername)nodeFilename = doc.createElement('filename')nodeFilename.appendChild(doc.createTextNode(img_name))root.appendChild(nodeFilename)# pathname = doc.createElement("path")# pathname.appendChild(doc.createTextNode("xxxx"))# root.appendChild(pathname)sourcename=doc.createElement("source")databasename = doc.createElement("database")databasename.appendChild(doc.createTextNode("DOTA"))sourcename.appendChild(databasename)# annotationname = doc.createElement("annotation")# annotationname.appendChild(doc.createTextNode("xxx"))# sourcename.appendChild(annotationname)# imagename = doc.createElement("image")# imagename.appendChild(doc.createTextNode("xxx"))# sourcename.appendChild(imagename)# flickridname = doc.createElement("flickrid")# flickridname.appendChild(doc.createTextNode("0"))# sourcename.appendChild(flickridname)root.appendChild(sourcename)nodesize = doc.createElement('size')nodewidth = doc.createElement('width')nodewidth.appendChild(doc.createTextNode(str(w)))nodesize.appendChild(nodewidth)nodeheight = doc.createElement('height')nodeheight.appendChild(doc.createTextNode(str(h)))nodesize.appendChild(nodeheight)nodedepth = doc.createElement('depth')nodedepth.appendChild(doc.createTextNode(str(d)))nodesize.appendChild(nodedepth)root.appendChild(nodesize)segname = doc.createElement("segmented")segname.appendChild(doc.createTextNode("0"))root.appendChild(segname)for (box, label) in zip(box_list, label_list):nodeobject = doc.createElement('object')nodename = doc.createElement('name')nodename.appendChild(doc.createTextNode(str(label)))nodeobject.appendChild(nodename)nodebndbox = doc.createElement('bndbox')nodex1 = doc.createElement('x1')nodex1.appendChild(doc.createTextNode(str(box[0])))nodebndbox.appendChild(nodex1)nodey1 = doc.createElement('y1')nodey1.appendChild(doc.createTextNode(str(box[1])))nodebndbox.appendChild(nodey1)nodex2 = doc.createElement('x2')nodex2.appendChild(doc.createTextNode(str(box[2])))nodebndbox.appendChild(nodex2)nodey2 = doc.createElement('y2')nodey2.appendChild(doc.createTextNode(str(box[3])))nodebndbox.appendChild(nodey2)nodex3 = doc.createElement('x3')nodex3.appendChild(doc.createTextNode(str(box[4])))nodebndbox.appendChild(nodex3)nodey3 = doc.createElement('y3')nodey3.appendChild(doc.createTextNode(str(box[5])))nodebndbox.appendChild(nodey3)nodex4 = doc.createElement('x4')nodex4.appendChild(doc.createTextNode(str(box[6])))nodebndbox.appendChild(nodex4)nodey4 = doc.createElement('y4')nodey4.appendChild(doc.createTextNode(str(box[7])))nodebndbox.appendChild(nodey4)# ang = doc.createElement('angle')# ang.appendChild(doc.createTextNode(str(angle)))# nodebndbox.appendChild(ang)nodeobject.appendChild(nodebndbox)root.appendChild(nodeobject)fp = open(path + filename, 'w')doc.writexml(fp, indent='\n')fp.close()def load_annoataion(p):'''load annotation from the text file:param p::return:'''text_polys = []text_tags = []if not os.path.exists(p):return np.array(text_polys, dtype=np.float32)with open(p, 'r') as f:for line in f.readlines()[2:]:label = 'text'# strip BOM. \ufeff for python3,  \xef\xbb\bf for python2#line = [i.strip('\ufeff').strip('\xef\xbb\xbf') for i in line]#print(line)x1, y1, x2, y2, x3, y3, x4, y4 ,label= line.split(' ')[0:9]#print(label)text_polys.append([x1, y1, x2, y2, x3, y3, x4, y4])text_tags.append(label)return np.array(text_polys, dtype=np.float), np.array(text_tags, dtype=np.str)txt_path = r'E:/baidudisk/DOTA/train/labelTxt-v1.5/DOTA-v1.5_train/'
xml_path = r'E:/baidudisk/DOTA/train/labelTxt-v1.5-voc/DOTA-v1.5_train/'
img_path = r'E:/baidudisk/DOTA/train/images/images/'
print(os.path.exists(txt_path))
txts = os.listdir(txt_path)
for count, t in enumerate(txts):path = os.path.join(txt_path,t)print(path)# boxes存储的是八个坐标# labels存储的是标签boxes, labels = load_annoataion(os.path.join(txt_path, t))# P0000.xmlxml_name = t.replace('.txt', '.xml')img_name = t.replace('.txt', '.png')# P0000.pngimg = cv2.imread(os.path.join(img_path, img_name))h, w, d = img.shape#print(xml_name, xml_path, boxes, labels, w, h, d)WriterXMLFiles(xml_name,img_name, xml_path, boxes, labels, w, h, d)if count % 1000 == 0:print(count)

说明
1:请务必将自己的文件路径进行修改
2:导包出现如下图横线,感觉也没有影响程序运行
在这里插入图片描述
3:文件转换最终如下图:
在这里插入图片描述

这篇关于DOTA数据集转VOC数据集,模仿DIOR数据集类型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/482891

相关文章

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

Spring Boot 配置文件之类型、加载顺序与最佳实践记录

《SpringBoot配置文件之类型、加载顺序与最佳实践记录》SpringBoot的配置文件是灵活且强大的工具,通过合理的配置管理,可以让应用开发和部署更加高效,无论是简单的属性配置,还是复杂... 目录Spring Boot 配置文件详解一、Spring Boot 配置文件类型1.1 applicatio

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解