Yolov3 训练自己的数据集 Pytorch 最简单 最少代码 最易调参

2023-10-08 07:48

本文主要是介绍Yolov3 训练自己的数据集 Pytorch 最简单 最少代码 最易调参,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2020-3-11更新了接口和修改了示例代码,旧版本读者请注意异同,详细参考博文最后说明

目前烦恼

你是不是已经被网上繁琐的 Yolov3 训练自己数据集的教程搞晕了?
你是不是还在纠结 xxx.cfg 文件到底怎样改又或者网上参差不齐的训练代码难以调参?

如果你仅仅是为了追求工程上的快速搭建开发,这里使用基于Pytorch的第三方库 “芷山” (英文:zisan)来实现最快速的Yolov3训练自己数据集。

这里提供下地址:
zisan官网

zisan Yolov3训练自己数据集 实现文档

安装zisan包

可以参考官网文档:
Install and download weights

(假设你已经配置好了 Pytorch +CUDA+CUDNN)
Pytorch+CUDA+CUDNN配置教程

第一步:

安装zisan包,打开命令行输入:(提示缺哪些辅助库就自己安装哪些)

pip install zisan
第二步:

下载 Yolov3, Yolov3-tiny,Yolov3-spp 的权重文件
这里我们不需要到其他地方额外下载,官网上已经给出了配套的辅助文件,文件夹的名字不要修改,如果修改的话在后面使用的时候传参需要修改比较麻烦,我们按着最简单的步骤取完成即可。
百度云:https://pan.baidu.com/s/1qj-Lpe4OKV0L-w9uKO8EFw
提取码:x9wl
我们只需要完成 训练数据集的目标检测任务,只需要Yolov3的权重,找到 runBox.zip (475 MB)下载:
runBox.zip
下载之后,解压如下目录:
runbox inside
此时,cfgs和weights文件夹是有权重和网络配置文件的,我们不要也不需要取改动它。

我们只需要在data文件夹里面放我们自己的数据即可。

数据集准备

这里实例使用红细胞数据集
下载地址:
链接: https://pan.baidu.com/s/1hYPFJH5XnRV0THV1pW5ALA
提取码: nlbq

数据集解压之后:
dataset
Annotations 文件夹放置的是xml标记文件,JPEGImages 文件夹放置的是 jpg图片
这时,我们无需做任何处理,只需要做两次傻瓜式复制即可:

第一步:把所有的xml文件复制到刚才的runBox/data/Annotations/ 里面
第二步:把所有的图片文件复制到刚才的runBox/data/images/里面

(这是data文件夹的目录,如果是你自己构造目录,睁大你的卡姿兰大眼睛,大小写分清楚!)
data
其余两个文件夹是空的,我们无需理会,但千万不要删除。

开始写 train.py

我们在runBox文件夹新建一个py文件
newtrain
train.py:

from zisan.ObjDetect.Interface import ObjDetect_train, ObjDetect_Preprocess
import os
if __name__ == "__main__":  pr=ObjDetect_Preprocess(classnames=['RBC'],currentpath='D:/xxx/runBox') # cuurentpath is needed, current path parameter is your runBox pathtrainModel=ObjDetect_train(currentpath='D:/xxx/runBox')trainModel.Run(cfg='yolov3-tiny.cfg',epochs=10)

接下来,python train.py 即可
如果你需要 调整训练参数,可以参考:
Package: ObjDetect

epochs: The times you loop training.
batch_size: The sum of once you
put into training. cfg: You can choose ‘yolov3-ting.cfg’,
‘yolov3-spp.cfg’ and ‘yolov3.cfg’, you must sure the weights folder
has the corresponding weight.
img_size: You can set as (height,width),
also like above 416 means (416,416)
resume: Due to the limitation of device resources, you may not be able to train too much data at a time. At this time, you can use resume to continue training for the weight of last cooling
num_workers: Multithreading, you must use main to use this nosave: if save each epoch weight

训练完毕,我们的训练出来的pth就放在weights文件夹里面,自行取用。
有两个weight :
last.pth
best.pth

pth
zisan 还支持 Resume Training
我们只需要使用 resume=True 和把epoches 调大即可

if __name__ == "__main__":  pr=ObjDetect_Preprocess(classnames=['RBC'],currentpath='D:/xxx/runBox') # cuurentpath is needed, it is your runBox pathtrainModel=ObjDetect_train(currentpath='D:/xxx/runBox')trainModel.Run(cfg='yolov3-tiny.cfg',epochs=20,resume=True)

开始写detect.py

同理,在runBox文件夹里面新建一个detect.py 文件:
detect
detect.py

from zisan.ObjDetect.Interface import ObjDetect_detect, ObjDetect_train, ObjDetect_Preprocess
import os
import cv2
from skimage import ioif __name__ == "__main__":  detectModel=ObjDetect_detect(cfg='yolov3-tiny.cfg',currentpath='D:/xxx/runBox') #Your runBox path is neededimg=io.imread('D:/1.jpg')img=cv2.resize(img,(480,640)) # Here rechange for your train images set Height and widthre,im0=detectModel.detect_from_RGBimg(img,is_showPreview=True)print(re) #re is a result list, item is dictionary and the format is: {'class':xx,'x0':xx,'x1':xx,'y0':xx,'y1':xx}

这里放上某一张的检测结果:
result
至此,已经完成所有的Yolov3 训练自己的数据集的任务了

附:zisan底层源码:

或许会有朋友觉得这种高度集成的工具没什么价值,其实zisan是我业余完成的一个工具包,也是里面有部分参考了开源的Pytorch Yolov3改写的版本,已经比其他社区参差不齐的代码好用了,我本意是做一个可以快速搭建CV开发的工具包,现在只完成了目标检测和对象语义分割的接口。

如果有兴趣的朋友可以到zisan 的Github上点个Star
邮箱:jintuzheng@outlook.com
Github:zisan https://github.com/EpsilionJT/zisan

如果本文不够详细可以参见另外一篇Blog:

https://blog.csdn.net/rizero/article/details/104192332

2020-3-11更新补充:

关于部分读者不能成功运行的原因汇总:
(1)最好使用torch版本1.2,部分函数最新的1.4有可能出现兼容问题
(2)current_path参数目的是引入cfg文件和权重文件以及进行预处理,当时写接口的时候没能考虑到部分读者的python解释器是运行在虚拟路径的,我已经对博客和源码进行了修改,获取最新版本只需要重新pip就行了。

pip uninstall zisan
pip install zisan

(3)如果你实在无法传入绝对路径的话,可以尝试以下解决方案:

current_path = os.path.dirname(__file__)

改成:

current_path = os.getcwd()

(4)新的detect文件已经更新了,参见博客原文

zisan1.0.12更新说明:

  1. 新版本已经废除了detectFromFiles函数,建议使用detectFromRGB函数
  2. current_path参数指的你的runBox路径,博客原文已经修改

最后的话

为保证你的环境和你的数据等配置都不出问题,建议:先用本文的红细胞数据集训练和检测成功之后再尝试自己的数据集,只要按照一些照套就会避免很多问题的出现

这篇关于Yolov3 训练自己的数据集 Pytorch 最简单 最少代码 最易调参的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/163787

相关文章

C#提取PDF表单数据的实现流程

《C#提取PDF表单数据的实现流程》PDF表单是一种常见的数据收集工具,广泛应用于调查问卷、业务合同等场景,凭借出色的跨平台兼容性和标准化特点,PDF表单在各行各业中得到了广泛应用,本文将探讨如何使用... 目录引言使用工具C# 提取多个PDF表单域的数据C# 提取特定PDF表单域的数据引言PDF表单是一

SQL Server使用SELECT INTO实现表备份的代码示例

《SQLServer使用SELECTINTO实现表备份的代码示例》在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误,在SQLServer中,可以使用SELECTINT... 在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误。在 SQL Server 中,可以使用 SE

一文详解Python中数据清洗与处理的常用方法

《一文详解Python中数据清洗与处理的常用方法》在数据处理与分析过程中,缺失值、重复值、异常值等问题是常见的挑战,本文总结了多种数据清洗与处理方法,文中的示例代码简洁易懂,有需要的小伙伴可以参考下... 目录缺失值处理重复值处理异常值处理数据类型转换文本清洗数据分组统计数据分箱数据标准化在数据处理与分析过

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

利用Python编写一个简单的聊天机器人

《利用Python编写一个简单的聊天机器人》这篇文章主要为大家详细介绍了如何利用Python编写一个简单的聊天机器人,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 使用 python 编写一个简单的聊天机器人可以从最基础的逻辑开始,然后逐步加入更复杂的功能。这里我们将先实现一个简单的

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

python实现pdf转word和excel的示例代码

《python实现pdf转word和excel的示例代码》本文主要介绍了python实现pdf转word和excel的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、引言二、python编程1,PDF转Word2,PDF转Excel三、前端页面效果展示总结一