Pascal Content数据集

2024-05-08 12:36
文章标签 数据 content pascal

本文主要是介绍Pascal Content数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

如果您想使用Pascal Context数据集,请安装Detail,然后运行以下命令将注释转换为正确的格式。

1.安装Detail

进入项目终端

#即 这是在我自己的项目下直接进行克隆操作:
git clone https://github.com/zhanghang1989/detail-api.git $PASCAL_CTX
# 获得detail_api 

若是出现下面的问题可以手动下载detail-api的压缩包文件到项目中,再进行解压.

我的就是git时候出了问题,然后手动下载的,服务器有时候也不稳定。

5、进行detail_api文件夹的PythonAPI中

cd 你的路径/PythonAPI

然后python setup.py install 

可能没有Cython

直接用pip install Cython

再跑python setup.py install

2.格式转换

Pascal Context的训练和验证集可以从这里下

要从原始数据集中分离训练和验证集,您可以从此处下载trainval_merged. json。下载链接https://codalabuser.blob.core.windows.net/public/trainval_merged.json

python tools/convert_datasets/pascal_context.py data/VOCdevkit data/VOCdevkit/VOC2010/trainval_merged.json

其中pascal_context.py如下

# Copyright (c) OpenMMLab. All rights reserved.
import argparse
import os.path as osp
from functools import partialimport mmcv
import numpy as np
from detail import Detail
from PIL import Image_mapping = np.sort(np.array([0, 2, 259, 260, 415, 324, 9, 258, 144, 18, 19, 22, 23, 397, 25, 284,158, 159, 416, 33, 162, 420, 454, 295, 296, 427, 44, 45, 46, 308, 59,440, 445, 31, 232, 65, 354, 424, 68, 326, 72, 458, 34, 207, 80, 355,85, 347, 220, 349, 360, 98, 187, 104, 105, 366, 189, 368, 113, 115]))
_key = np.array(range(len(_mapping))).astype('uint8')def generate_labels(img_id, detail, out_dir):def _class_to_index(mask, _mapping, _key):# assert the valuesvalues = np.unique(mask)for i in range(len(values)):assert (values[i] in _mapping)index = np.digitize(mask.ravel(), _mapping, right=True)return _key[index].reshape(mask.shape)mask = Image.fromarray(_class_to_index(detail.getMask(img_id), _mapping=_mapping, _key=_key))filename = img_id['file_name']mask.save(osp.join(out_dir, filename.replace('jpg', 'png')))return osp.splitext(osp.basename(filename))[0]def parse_args():parser = argparse.ArgumentParser(description='Convert PASCAL VOC annotations to mmsegmentation format')parser.add_argument('devkit_path', help='pascal voc devkit path')parser.add_argument('json_path', help='annoation json filepath')parser.add_argument('-o', '--out_dir', help='output path')args = parser.parse_args()return argsdef main():args = parse_args()devkit_path = args.devkit_pathif args.out_dir is None:out_dir = osp.join(devkit_path, 'VOC2010', 'SegmentationClassContext')else:out_dir = args.out_dirjson_path = args.json_pathmmcv.mkdir_or_exist(out_dir)img_dir = osp.join(devkit_path, 'VOC2010', 'JPEGImages')train_detail = Detail(json_path, img_dir, 'train')train_ids = train_detail.getImgs()val_detail = Detail(json_path, img_dir, 'val')val_ids = val_detail.getImgs()mmcv.mkdir_or_exist(osp.join(devkit_path, 'VOC2010/ImageSets/SegmentationContext'))train_list = mmcv.track_progress(partial(generate_labels, detail=train_detail, out_dir=out_dir),train_ids)with open(osp.join(devkit_path, 'VOC2010/ImageSets/SegmentationContext','train.txt'), 'w') as f:f.writelines(line + '\n' for line in sorted(train_list))val_list = mmcv.track_progress(partial(generate_labels, detail=val_detail, out_dir=out_dir), val_ids)with open(osp.join(devkit_path, 'VOC2010/ImageSets/SegmentationContext','val.txt'), 'w') as f:f.writelines(line + '\n' for line in sorted(val_list))print('Done!')if __name__ == '__main__':main()

已经在转换啦,慢慢等待就好,可以干点其他的,或者浅休息一下。

two years later...

这篇关于Pascal Content数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/970333

相关文章

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python实现将实体类列表数据导出到Excel文件

《Python实现将实体类列表数据导出到Excel文件》在数据处理和报告生成中,将实体类的列表数据导出到Excel文件是一项常见任务,Python提供了多种库来实现这一目标,下面就来跟随小编一起学习一... 目录一、环境准备二、定义实体类三、创建实体类列表四、将实体类列表转换为DataFrame五、导出Da

Python实现数据清洗的18种方法

《Python实现数据清洗的18种方法》本文主要介绍了Python实现数据清洗的18种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1. 去除字符串两边空格2. 转换数据类型3. 大小写转换4. 移除列表中的重复元素5. 快速统

Python数据处理之导入导出Excel数据方式

《Python数据处理之导入导出Excel数据方式》Python是Excel数据处理的绝佳工具,通过Pandas和Openpyxl等库可以实现数据的导入、导出和自动化处理,从基础的数据读取和清洗到复杂... 目录python导入导出Excel数据开启数据之旅:为什么Python是Excel数据处理的最佳拍档

在Pandas中进行数据重命名的方法示例

《在Pandas中进行数据重命名的方法示例》Pandas作为Python中最流行的数据处理库,提供了强大的数据操作功能,其中数据重命名是常见且基础的操作之一,本文将通过简洁明了的讲解和丰富的代码示例,... 目录一、引言二、Pandas rename方法简介三、列名重命名3.1 使用字典进行列名重命名3.编

Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南

《Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南》在日常数据处理工作中,我们经常需要将不同Excel文档中的数据整合到一个新的DataFrame中,以便进行进一步... 目录一、准备工作二、读取Excel文件三、数据叠加四、处理重复数据(可选)五、保存新DataFram

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

MySQL中删除重复数据SQL的三种写法

《MySQL中删除重复数据SQL的三种写法》:本文主要介绍MySQL中删除重复数据SQL的三种写法,文中通过代码示例讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下... 目录方法一:使用 left join + 子查询删除重复数据(推荐)方法二:创建临时表(需分多步执行,逻辑清晰,但会

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二