本文主要是介绍机器学习笔记 - 基于pytorch的自定义数据集和数据加载器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
PyTorch 提供了torch.utils.data.DataLoader
和torch.utils.data.Dataset
允许您使用预加载的数据集以及您自己的数据。 Dataset
存储样本及其相应的标签,并基于DataLoader
进行迭代Dataset
以访问样本。
自定义 Dataset 类必须实现三个函数:__init__、__len__和__getitem__。
下面的代码,是基于voc格式的目标检测的数据集编写的。
__init__函数里面定义了基本信息,我们可以看到有路径、图像宽高、分类信息、图像后缀等,主要的是所有图像的路径信息的集合。
__len__最简单,就是所有的图像的数量。
__getitem__是根据给定索引找到图像,进行处理,并继续找到对应目标检测的xml文件,读取解析里面的坐标信息等
这篇关于机器学习笔记 - 基于pytorch的自定义数据集和数据加载器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!