本文主要是介绍目标检测——图像增广(legacy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
2 Youki常用的图像增广技巧
2.1 rotation
也就是选择变换,一般我们采用的是随机旋转;
一个随机旋转的实现为,
transforms.transforms.RandomRotation(10)
# 此代码的含义是,在[-10°, 10°]的区间范围内随机旋转一个角度
但是,值得注意的是,我们在PyTorch中无法直接在ndarray的数据格式下进行这样的变换,
否则就会报错,
这里报错的信息显示,进行变换的img必须是 PIL Image格式,所以我们在进行变换之前还需要将图像数据转换为 PIL Image格式,
一个对ndarray格式的图像数据进行变换的实现代码如下,
transform = transforms.Compose([transforms.ToPILImage(),transforms.transforms.RandomRotation(10),transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,))])
这里我们首先使用transforms.ToPILImage()函数将ndarray的图像数据转换为 PIL Image格式,
2.2 亮度变换
亮度变化,是实际环境中照片可能出现变化的原因之一,(不过在game中不会出现)
这篇关于目标检测——图像增广(legacy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!