【猫狗分类】Pytorch VGG16 实现猫狗分类3-生成器+数据增强

2024-06-17 04:36

本文主要是介绍【猫狗分类】Pytorch VGG16 实现猫狗分类3-生成器+数据增强,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景

进行生成器的构建,还有数据增强。并且封装在data.py函数里。

声明:整个数据和代码来自于b站,链接:使用pytorch框架手把手教你利用VGG16网络编写猫狗分类程序_哔哩哔哩_bilibili

我做了复现,并且记录了自己在做这个项目分类时候,一些所思所得。

构建生成器+数据增强

这段代码定义了一个自定义的数据生成器类`DataGenerator`,用于处理图像数据,特别适用于深度学习中的图像分类或物体检测任务。下面是这个脚本的主要功能和流程总结:

1. **预处理函数定义**:
   - `preprocess_input(x)`: 将图像像素值归一化到[-1, 1]区间,这是许多深度学习模型的标准输入格式。
   - `cvtColor(image)`: 确保图像为RGB格式,如果输入是灰度或其他格式,则转换为RGB。

2. **`DataGenerator`类**:
   - **初始化 (`__init__`)**: 接受图像标注信息的列表、图像输入尺寸和是否进行随机数据增强的标志。
   - **数据长度 (`__len__`)**: 返回数据集的总样本数。
   - **获取样本 (`__getitem__`)**: 
     - 读取图像和标签;
     - 应用数据增强(如果`random=True`),包括缩放、裁剪、翻转、旋转和色域扭曲;
     - 对图像进行预处理(归一化并调整通道顺序);
     - 返回处理后的图像数据和标签。
   - **辅助函数**:
     - `rand(a, b)`: 生成一个在[a, b]范围内的随机数。
     - `get_random_data(image, inpt_shape, jitter, hue, sat, val, random)`: 实现数据增强逻辑,包括调整图像大小、添加灰边、随机翻转、旋转以及HSV空间的颜色调整。

总结来说,这个`DataGenerator`类主要用于读取图片文件,并根据给定的参数执行一系列图像预处理和数据增强操作,以便于后续的深度学习模型训练。它能够生成经过标准化处理和增强的数据,提高模型对图像变化的鲁棒性,适合于训练图像识别、分类或检测模型。

【为什么获取样本放在 (__getitem__)

def __getitem__(self, index):annotation_path=self.annotation_lines[index].split(';')[1].split()[0]image=Image.open(annotation_path)image=self.get_random_data(image,self.input_shape,random=self.random)image=np.transpose(preprocess_input(np.array(image).astype(np.float32)),[2,0,1])y=int(self.annotation_lines[index].split(';')[0])return image,y

在Python的类定义中,`__getitem__`方法是一个特殊方法,当实例化的对象使用方括号`[]`操作符访问元素时,该方法会被自动调用。对于数据处理或者数据集类(如上述的`DataGenerator`)而言,实现`__getitem__`方法具有重要意义,原因如下:

1. **索引访问**: 在深度学习中,我们经常需要按索引从数据集中获取单个样本,用于训练或验证模型。通过重载`__getitem__`,可以像操作列表一样简单地从数据集中提取数据,例如`data = dataset[i]`。

2. **迭代兼容**: 实现了`__getitem__`的数据集类可以被用在for循环中,因为Python的迭代协议会尝试使用`__getitem__`方法来遍历对象。这样使得数据集能够方便地与很多现有的库和框架集成,比如PyTorch的训练循环中直接迭代数据加载器。

3. **兼容PyTorch等框架**: 深度学习框架(如PyTorch)的数据加载器(DataLoader)要求数据集类实现`__getitem__`和`__len__`方法,以便能够高效地按批次加载和处理数据。这允许框架根据需要动态地请求和处理数据,特别是在进行批量训练时,提高了内存效率和训练速度。

4. **灵活的数据处理**: 在`__getitem__`内部,可以根据索引执行复杂的逻辑来处理和返回特定的样本。这包括但不限于加载图像、应用数据增强、预处理等操作,为每个样本提供了定制化的处理流程。

因此,在上述代码中,将获取样本的逻辑放在`__getitem__`方法中,是为了遵循这些最佳实践和框架要求,确保数据集能够高效、灵活地服务于深度学习模型的训练和验证过程。

完整代码

import cv2
import numpy as np
import torch.utils.data as data
from PIL import  Imagedef preprocess_input(x):x/=127.5x-=1.return x
def cvtColor(image):if len(np.shape(image))==3 and np.shape(image)[-2]==3:return imageelse:image=image.convert('RGB')return imageclass DataGenerator(data.Dataset):def __init__(self,annotation_lines,inpt_shape,random=True):self.annotation_lines=annotation_linesself.input_shape=inpt_shapeself.random=randomdef __len__(self):return len(self.annotation_lines)def __getitem__(self, index):annotation_path=self.annotation_lines[index].split(';')[1].split()[0]image=Image.open(annotation_path)image=self.get_random_data(image,self.input_shape,random=self.random)image=np.transpose(preprocess_input(np.array(image).astype(np.float32)),[2,0,1])y=int(self.annotation_lines[index].split(';')[0])return image,ydef rand(self,a=0,b=1):return np.random.rand()*(b-a)+adef get_random_data(self,image,inpt_shape,jitter=.3,hue=.1,sat=1.5,val=1.5,random=True):image=cvtColor(image)iw,ih=image.sizeh,w=inpt_shapeif not random:scale=min(w/iw,h/ih)nw=int(iw*scale)nh=int(ih*scale)dx=(w-nw)//2dy=(h-nh)//2image=image.resize((nw,nh),Image.BICUBIC)new_image=Image.new('RGB',(w,h),(128,128,128))new_image.paste(image,(dx,dy))image_data=np.array(new_image,np.float32)return image_datanew_ar=w/h*self.rand(1-jitter,1+jitter)/self.rand(1-jitter,1+jitter)scale=self.rand(.75,1.25)if new_ar<1:nh=int(scale*h)nw=int(nh*new_ar)else:nw=int(scale*w)nh=int(nw/new_ar)image=image.resize((nw,nh),Image.BICUBIC)#将图像多余的部分加上灰条dx=int(self.rand(0,w-nw))dy=int(self.rand(0,h-nh))new_image=Image.new('RGB',(w,h),(128,128,128))new_image.paste(image,(dx,dy))image=new_image#翻转图像flip=self.rand()<.5if flip: image=image.transpose(Image.FLIP_LEFT_RIGHT)rotate=self.rand()<.5if rotate:angle=np.random.randint(-15,15)a,b=w/2,h/2M=cv2.getRotationMatrix2D((a,b),angle,1)image=cv2.warpAffine(np.array(image),M,(w,h),borderValue=[128,128,128])#色域扭曲hue=self.rand(-hue,hue)sat=self.rand(1,sat) if self.rand()<.5 else 1/self.rand(1,sat)val=self.rand(1,val) if self.rand()<.5 else 1/self.rand(1,val)x=cv2.cvtColor(np.array(image,np.float32)/255,cv2.COLOR_RGB2HSV)#颜色空间转换x[...,1]*=satx[...,2]*=valx[x[:,:,0]>360,0]=360x[:,:,1:][x[:,:,1:]>1]=1x[x<0]=0image_data=cv2.cvtColor(x,cv2.COLOR_HSV2RGB)*255return image_data


 

这篇关于【猫狗分类】Pytorch VGG16 实现猫狗分类3-生成器+数据增强的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1068490

相关文章

java实现docker镜像上传到harbor仓库的方式

《java实现docker镜像上传到harbor仓库的方式》:本文主要介绍java实现docker镜像上传到harbor仓库的方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 前 言2. 编写工具类2.1 引入依赖包2.2 使用当前服务器的docker环境推送镜像2.2

C++20管道运算符的实现示例

《C++20管道运算符的实现示例》本文简要介绍C++20管道运算符的使用与实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录标准库的管道运算符使用自己实现类似的管道运算符我们不打算介绍太多,因为它实际属于c++20最为重要的

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的

浏览器插件cursor实现自动注册、续杯的详细过程

《浏览器插件cursor实现自动注册、续杯的详细过程》Cursor简易注册助手脚本通过自动化邮箱填写和验证码获取流程,大大简化了Cursor的注册过程,它不仅提高了注册效率,还通过友好的用户界面和详细... 目录前言功能概述使用方法安装脚本使用流程邮箱输入页面验证码页面实战演示技术实现核心功能实现1. 随机

Golang如何对cron进行二次封装实现指定时间执行定时任务

《Golang如何对cron进行二次封装实现指定时间执行定时任务》:本文主要介绍Golang如何对cron进行二次封装实现指定时间执行定时任务问题,具有很好的参考价值,希望对大家有所帮助,如有错误... 目录背景cron库下载代码示例【1】结构体定义【2】定时任务开启【3】使用示例【4】控制台输出总结背景

Golang如何用gorm实现分页的功能

《Golang如何用gorm实现分页的功能》:本文主要介绍Golang如何用gorm实现分页的功能方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录背景go库下载初始化数据【1】建表【2】插入数据【3】查看数据4、代码示例【1】gorm结构体定义【2】分页结构体

在Golang中实现定时任务的几种高效方法

《在Golang中实现定时任务的几种高效方法》本文将详细介绍在Golang中实现定时任务的几种高效方法,包括time包中的Ticker和Timer、第三方库cron的使用,以及基于channel和go... 目录背景介绍目的和范围预期读者文档结构概述术语表核心概念与联系故事引入核心概念解释核心概念之间的关系