本文主要是介绍Albumentations数据增强部分方法使用和可视化展示,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Albumentations数据增强方法
- 常用数据增强方法
-
- Blur 模糊
- VerticalFlip 水平翻转
- HorizontalFlip 垂直翻转
- Flip 翻转
- Normalize 归一化
- Transpose 转置
- RandomCrop 随机裁剪
- RandomGamma 随机Gamma
- RandomRotate90 随机旋转90度
- Rotate旋转
- ShiftScaleRotate 平移缩放旋转
- CenterCrop 中心裁剪
- OpticalDistortion 光学畸变
- GridDistortion 网格失真
- ElasticTransform 弹性变换
- RandomGridShuffle 随机网格洗牌
- HueSaturationValue 色调饱和度值
- PadIfNeeded 填充
- RGBShift RGB平移
- RandomBrightness 随机亮度
- RandomContrast 随机对比度
- MotionBlur 运动模糊
- MedianBlur 中心模糊
- GaussianBlur 高斯模糊
- GaussNoise 高斯噪声
- CLAHE 对比度受限自适应直方图均衡
- InvertImg 反转图像
- ChannelShuffle 通道洗牌
- Cutout
- CoarseDropout
- ToFloat
- Crop 裁剪
- RandomScale 随机缩放
- LongestMaxSize
- SmallestMaxSize
- Resize缩放
- RandomSizedCrop 随机裁剪缩放
- RandomBrightnessContrast 随机亮度对比度
- RandomCropNearBBox
- ISONoise
- Solarize
常用数据增强方法
本人根据非常棒的Albumentations数据增强库总结了常用的数据增强方法(本人能力有限,如有错误,请指出。有人使用Albumentations库的Blur, Flip, RandomBrightnessContrast, ShiftScaleRotate, ElasticTransform, Transpose, GridDistortion, HueSaturationValue, CLAHE, CoarseDropout在图像分类比赛中取得第二名,所以本人写了这篇文章)。
Albumentations官方手册
Blur 模糊
Blur(blur_limit = 7,always_apply = False,p = 0.5 )
图像均值平滑滤波。
VerticalFlip 水平翻转
VerticalFlip(always_apply = False,p = 0.5 )
HorizontalFlip 垂直翻转
HorizontalFlip(always_apply = False,p = 0.5 )
Flip 翻转
Flip(always_apply = False,p = 0.5 )
水平和垂直翻转
Normalize 归一化
Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225), max_pixel_value=255.0, always_apply=False, p=1.0)
将像素值除以255 = 2 ** 8 - 1,减去每个通道的平均值并除以每个通道的std
Transpose 转置
Transpose(always_apply=False, p=0.5)
将图像行和列互换
RandomCrop 随机裁剪
RandomCrop(height, width, always_apply=False, p=1.0)
随机从图像裁剪一块区域(参数是高宽,而且必须是整数,所以使用这个函数一定会裁剪一定区域的图片)
RandomGamma 随机Gamma
*RandomGamma(gamma_limit=(80, 120), eps=1e-07, always_apply=False, p=0.5)
随机伽马变换。
RandomRotate90 随机旋转90度
RandomRotate90(always_apply=False, p=0.5)
随机旋转0个或多个90度。
Rotate旋转
Rotate(limit=90, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
随机旋转图片(默认使用reflect方法扩充图片,可以改为参数等其他方法填充)。
ShiftScaleRotate 平移缩放旋转
ShiftScaleRotate(shift_limit=0.0625, scale_limit=0.1, rotate_limit=45, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
随机平移、缩放、旋转图片。
CenterCrop 中心裁剪
CenterCrop(height, width, always_apply=False, p=1.0)
随机中心裁剪图片(参数为高宽,一定会进行裁剪,注意其输入为整数)。
OpticalDistortion 光学畸变
OpticalDistortion(distort_limit=0.05, shift_limit=0.05, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
对图像进行光学畸变。
GridDistortion 网格失真
GridDistortion(num_steps=5, distort_limit=0.3, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
对图像进行网格失真。
ElasticTransform 弹性变换
ElasticTransform(alpha = 1,sigma = 50,alpha_affine = 50,interpolation = 1,border_mode = 4,value = None,mask_value = None,always_apply = False,approximate = False,p = 0.5 )
随机对图像进行弹性变换。
RandomGridShuffle 随机网格洗牌
RandomGridShuffle(grid=(3, 3), always_apply=False, p=1.0)
参数:将图像以网格方式生成几块,并随机打乱。
HueSaturationValue 色调饱和度值
HueSaturationValue(hue_shift_limit=20, sat_shift_limit=30, val_shift_limit=20, always_apply=False, p=0.5)
参数:随机色调、饱和度、值变化。
PadIfNeeded 填充
PadIfNeeded(min_height=1024, min_width=1024, border_mode=4, value=None, mask_value=None, always_apply=False, p=1.0)
填充图像。
RGBShift RGB平移
RGBShift(r_shift_limit=20, g_shift_limit=20, b_shift_limit=20, always_apply=False, p=0.5)
参数:随机平移R、G、B通道值。
RandomBrightness 随机亮度
RandomBrightness(limit=0.2, always_apply=False, p=0.5)y = False,p = 0.5 )
随机亮度变化。
RandomContrast 随机对比度
RandomContrast(limit=0.2, always_apply=False, p=0.5)
随机对比度变化。
MotionBlur 运动模糊
MotionBlur(blur_limit=7, always_apply=False, p=0.5)
给图像加上运动模糊。运动模糊是景物图象中的移动效果。它比较明显地出现在长时间暴光或场景内的物体快速移动的情形里。
MedianBlur 中心模糊
MedianBlur(blur_limit=7, always_apply=False, p=0.5)
图像中值滤波。
GaussianBlur 高斯模糊
GaussianBlur(blur_limit=7, always_apply=False, p=0.5)
图像高斯平滑滤波。
GaussNoise 高斯噪声
*GaussNoise(var_limit=(10.0, 50.0), mean=None, always_apply=False, p=0.5)
给图像增加高斯噪声。
CLAHE 对比度受限自适应直方图均衡
CLAHE(clip_limit=4.0, tile_grid_size=(8, 8), always_apply=False, p=0.5)
将对比度受限的自适应直方图均衡化应用于输入图像。。
InvertImg 反转图像
InvertImg(always_apply=False, p=0.5)
通过用255减去像素值来反转输入图像。
ChannelShuffle 通道洗牌
ChannelShuffle(always_apply=False, p=0.5)
随机改变RGB三个通道的顺序。
Cutout
Cutout(num_holes=8, max_h_size=8, max_w_size=8, fill_value=0, always_apply=False, p=0.5)
在图像中生成正方形区域。
CoarseDropout
*CoarseDropout(max_holes=8, max_height=8, max_width=8, min_holes=None, min_height=None, min_width=None, fill_value=0, always_apply=False, p=0.5)
在图像上生成矩形区域。
ToFloat
ToFloat(max_value=None, always_apply=False, p=1.0)
图像除一个值,默认值为图像数据类型的最大值。
Crop 裁剪
Crop(x_min=0, y_min=0, x_max=1024, y_max=1024, always_apply=False, p=1.0)
裁剪图像,其与RandomCrop的区别是可以指定最小值和最大值,而RandomCrop只能指定宽高。
RandomScale 随机缩放
RandomScale(scale_limit = 0.1,interpolation = 1,always_apply = False,p = 0.5 )
随机缩放图像大小。
LongestMaxSize
LongestMaxSize(max_size = 1024,interpolation = 1,always_apply = False,p = 1 )
缩放图像,使最大边等于max_size,保持初始图像的纵横比。
SmallestMaxSize
SmallestMaxSize(max_size = 1024,interpolation = 1,always_apply = False,p = 1 )
缩放图像,使最小边等于max_size,保持初始图像的纵横比。## VerticalFlip 水平旋转。
Resize缩放
Resize(height,width,interpolation = 1,always_apply = False,p = 1 )
将输入图像调整为给定的高度和宽度。
RandomSizedCrop 随机裁剪缩放
RandomSizedCrop(min_max_height,height,width,w2h_ratio = 1.0,interpolation = 1,always_apply = False,p = 1.0 )
随机裁剪图像并缩放到固定大小。
RandomBrightnessContrast 随机亮度对比度
RandomBrightnessContrast(brightness_limit = 0.2,contrast_limit = 0.2,brightness_by_max = None,always_apply = False,p = 0.5 )
随机更改输入图像的亮度和对比度。
RandomCropNearBBox
RandomCropNearBBox(max_part_shift = 0.3,always_apply = False,p = 1.0 )
随机平移bbox的x,y坐标并从图像中裁剪。
ISONoise
ISONoise(color_shift=(0.01, 0.05), intensity=(0.1, 0.5), always_apply=False, p=0.5)
施加摄像头传感器噪音。
Solarize
Solarize(threshold=128, always_apply=False, p=0.5)
反转高于阈值的所有像素值。
这篇关于Albumentations数据增强部分方法使用和可视化展示的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!