Albumentations数据增强部分方法使用和可视化展示

本文主要是介绍Albumentations数据增强部分方法使用和可视化展示,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Albumentations数据增强方法

  • 常用数据增强方法
    • Blur 模糊
    • VerticalFlip 水平翻转
    • HorizontalFlip 垂直翻转
    • Flip 翻转
    • Normalize 归一化
    • Transpose 转置
    • RandomCrop 随机裁剪
    • RandomGamma 随机Gamma
    • RandomRotate90 随机旋转90度
    • Rotate旋转
    • ShiftScaleRotate 平移缩放旋转
    • CenterCrop 中心裁剪
    • OpticalDistortion 光学畸变
    • GridDistortion 网格失真
    • ElasticTransform 弹性变换
    • RandomGridShuffle 随机网格洗牌
    • HueSaturationValue 色调饱和度值
    • PadIfNeeded 填充
    • RGBShift RGB平移
    • RandomBrightness 随机亮度
    • RandomContrast 随机对比度
    • MotionBlur 运动模糊
    • MedianBlur 中心模糊
    • GaussianBlur 高斯模糊
    • GaussNoise 高斯噪声
    • CLAHE 对比度受限自适应直方图均衡
    • InvertImg 反转图像
    • ChannelShuffle 通道洗牌
    • Cutout
    • CoarseDropout
    • ToFloat
    • Crop 裁剪
    • RandomScale 随机缩放
    • LongestMaxSize
    • SmallestMaxSize
    • Resize缩放
    • RandomSizedCrop 随机裁剪缩放
    • RandomBrightnessContrast 随机亮度对比度
    • RandomCropNearBBox
    • ISONoise
    • Solarize

常用数据增强方法

本人根据非常棒的Albumentations数据增强库总结了常用的数据增强方法(本人能力有限,如有错误,请指出。有人使用Albumentations库的Blur, Flip, RandomBrightnessContrast, ShiftScaleRotate, ElasticTransform, Transpose, GridDistortion, HueSaturationValue, CLAHE, CoarseDropout在图像分类比赛中取得第二名,所以本人写了这篇文章)。
Albumentations官方手册

image_75367a00.png

Blur 模糊

Blur(blur_limit = 7,always_apply = False,p = 0.5 )
图像均值平滑滤波。
image_f58bcf3f.png

VerticalFlip 水平翻转

VerticalFlip(always_apply = False,p = 0.5 )
image_1fe08a34.png

HorizontalFlip 垂直翻转

HorizontalFlip(always_apply = False,p = 0.5 )
image_f8f72cba.png

Flip 翻转

Flip(always_apply = False,p = 0.5 )
水平和垂直翻转
image_9b559138.png

Normalize 归一化

Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225), max_pixel_value=255.0, always_apply=False, p=1.0)
将像素值除以255 = 2 ** 8 - 1,减去每个通道的平均值并除以每个通道的std

Transpose 转置

Transpose(always_apply=False, p=0.5)
将图像行和列互换
image_c3eabb0d.png

RandomCrop 随机裁剪

RandomCrop(height, width, always_apply=False, p=1.0)
随机从图像裁剪一块区域(参数是高宽,而且必须是整数,所以使用这个函数一定会裁剪一定区域的图片)
image_cf02d61c.png

RandomGamma 随机Gamma

*RandomGamma(gamma_limit=(80, 120), eps=1e-07, always_apply=False, p=0.5)
随机伽马变换。image_420e05a1.png

RandomRotate90 随机旋转90度

RandomRotate90(always_apply=False, p=0.5)
随机旋转0个或多个90度。
image_a8b2b2fa.png

Rotate旋转

Rotate(limit=90, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
随机旋转图片(默认使用reflect方法扩充图片,可以改为参数等其他方法填充)。
image_e038aae5.png

ShiftScaleRotate 平移缩放旋转

ShiftScaleRotate(shift_limit=0.0625, scale_limit=0.1, rotate_limit=45, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
随机平移、缩放、旋转图片。
image_7d08a393.png

CenterCrop 中心裁剪

CenterCrop(height, width, always_apply=False, p=1.0)
随机中心裁剪图片(参数为高宽,一定会进行裁剪,注意其输入为整数)。
image_91c46a7a.png

OpticalDistortion 光学畸变

OpticalDistortion(distort_limit=0.05, shift_limit=0.05, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
对图像进行光学畸变。
image_c45c44ab.png

GridDistortion 网格失真

GridDistortion(num_steps=5, distort_limit=0.3, interpolation=1, border_mode=4, value=None, mask_value=None, always_apply=False, p=0.5)
对图像进行网格失真。
image_d64353ca.png

ElasticTransform 弹性变换

ElasticTransform(alpha = 1,sigma = 50,alpha_affine = 50,interpolation = 1,border_mode = 4,value = None,mask_value = None,always_apply = False,approximate = False,p = 0.5 )
随机对图像进行弹性变换。
image_2abede88.png

RandomGridShuffle 随机网格洗牌

RandomGridShuffle(grid=(3, 3), always_apply=False, p=1.0)
参数:将图像以网格方式生成几块,并随机打乱。
image_112a59ef.png

HueSaturationValue 色调饱和度值

HueSaturationValue(hue_shift_limit=20, sat_shift_limit=30, val_shift_limit=20, always_apply=False, p=0.5)
参数:随机色调、饱和度、值变化。
image_cb66ee0e.png

PadIfNeeded 填充

PadIfNeeded(min_height=1024, min_width=1024, border_mode=4, value=None, mask_value=None, always_apply=False, p=1.0)
填充图像。
image_ac4eefc7.png

RGBShift RGB平移

RGBShift(r_shift_limit=20, g_shift_limit=20, b_shift_limit=20, always_apply=False, p=0.5)
参数:随机平移R、G、B通道值。
image_f52fa600.png

RandomBrightness 随机亮度

RandomBrightness(limit=0.2, always_apply=False, p=0.5)y = False,p = 0.5 )
随机亮度变化。
image_8db05e6e.png

RandomContrast 随机对比度

RandomContrast(limit=0.2, always_apply=False, p=0.5)
随机对比度变化。
image_4cbead65.png

MotionBlur 运动模糊

MotionBlur(blur_limit=7, always_apply=False, p=0.5)
给图像加上运动模糊。运动模糊是景物图象中的移动效果。它比较明显地出现在长时间暴光或场景内的物体快速移动的情形里。
image_32ef43b6.png

MedianBlur 中心模糊

MedianBlur(blur_limit=7, always_apply=False, p=0.5)
图像中值滤波。
image_3cc0ac51.png

GaussianBlur 高斯模糊

GaussianBlur(blur_limit=7, always_apply=False, p=0.5)
图像高斯平滑滤波。
image_63301667.png

GaussNoise 高斯噪声

*GaussNoise(var_limit=(10.0, 50.0), mean=None, always_apply=False, p=0.5)
给图像增加高斯噪声。
image_47b2016d.png

CLAHE 对比度受限自适应直方图均衡

CLAHE(clip_limit=4.0, tile_grid_size=(8, 8), always_apply=False, p=0.5)
将对比度受限的自适应直方图均衡化应用于输入图像。。
image_5c5d1c6c.png

InvertImg 反转图像

InvertImg(always_apply=False, p=0.5)
通过用255减去像素值来反转输入图像。
image_d69ac373.png

ChannelShuffle 通道洗牌

ChannelShuffle(always_apply=False, p=0.5)
随机改变RGB三个通道的顺序。
image_55dea620.png

Cutout

Cutout(num_holes=8, max_h_size=8, max_w_size=8, fill_value=0, always_apply=False, p=0.5)
在图像中生成正方形区域。
image_0d8a4c3c.png

CoarseDropout

*CoarseDropout(max_holes=8, max_height=8, max_width=8, min_holes=None, min_height=None, min_width=None, fill_value=0, always_apply=False, p=0.5)
在图像上生成矩形区域。
image_49b778d0.png

ToFloat

ToFloat(max_value=None, always_apply=False, p=1.0)
图像除一个值,默认值为图像数据类型的最大值。

Crop 裁剪

Crop(x_min=0, y_min=0, x_max=1024, y_max=1024, always_apply=False, p=1.0)
裁剪图像,其与RandomCrop的区别是可以指定最小值和最大值,而RandomCrop只能指定宽高。
image_d6b60b96.png

RandomScale 随机缩放

RandomScale(scale_limit = 0.1,interpolation = 1,always_apply = False,p = 0.5 )
随机缩放图像大小。

LongestMaxSize

LongestMaxSize(max_size = 1024,interpolation = 1,always_apply = False,p = 1 )
缩放图像,使最大边等于max_size,保持初始图像的纵横比。

SmallestMaxSize

SmallestMaxSize(max_size = 1024,interpolation = 1,always_apply = False,p = 1 )
缩放图像,使最小边等于max_size,保持初始图像的纵横比。## VerticalFlip 水平旋转。

Resize缩放

Resize(height,width,interpolation = 1,always_apply = False,p = 1 )
将输入图像调整为给定的高度和宽度。

RandomSizedCrop 随机裁剪缩放

RandomSizedCrop(min_max_height,height,width,w2h_ratio = 1.0,interpolation = 1,always_apply = False,p = 1.0 )
随机裁剪图像并缩放到固定大小。
image_96d3c926.png

RandomBrightnessContrast 随机亮度对比度

RandomBrightnessContrast(brightness_limit = 0.2,contrast_limit = 0.2,brightness_by_max = None,always_apply = False,p = 0.5 )
随机更改输入图像的亮度和对比度。

image_e3d48806.png

RandomCropNearBBox

RandomCropNearBBox(max_part_shift = 0.3,always_apply = False,p = 1.0 )
随机平移bbox的x,y坐标并从图像中裁剪。
image_cbb7bf11.png

ISONoise

ISONoise(color_shift=(0.01, 0.05), intensity=(0.1, 0.5), always_apply=False, p=0.5)
施加摄像头传感器噪音。
image_45eac03b.png

Solarize

Solarize(threshold=128, always_apply=False, p=0.5)
反转高于阈值的所有像素值。
image_f3050a03.png

这篇关于Albumentations数据增强部分方法使用和可视化展示的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/281381

相关文章

postgresql使用UUID函数的方法

《postgresql使用UUID函数的方法》本文给大家介绍postgresql使用UUID函数的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录PostgreSQL有两种生成uuid的方法。可以先通过sql查看是否已安装扩展函数,和可以安装的扩展函数

Java中Arrays类和Collections类常用方法示例详解

《Java中Arrays类和Collections类常用方法示例详解》本文总结了Java中Arrays和Collections类的常用方法,涵盖数组填充、排序、搜索、复制、列表转换等操作,帮助开发者高... 目录Arrays.fill()相关用法Arrays.toString()Arrays.sort()A

如何使用Lombok进行spring 注入

《如何使用Lombok进行spring注入》本文介绍如何用Lombok简化Spring注入,推荐优先使用setter注入,通过注解自动生成getter/setter及构造器,减少冗余代码,提升开发效... Lombok为了开发环境简化代码,好处不用多说。spring 注入方式为2种,构造器注入和setter

MySQL中比较运算符的具体使用

《MySQL中比较运算符的具体使用》本文介绍了SQL中常用的符号类型和非符号类型运算符,符号类型运算符包括等于(=)、安全等于(=)、不等于(/!=)、大小比较(,=,,=)等,感兴趣的可以了解一下... 目录符号类型运算符1. 等于运算符=2. 安全等于运算符<=>3. 不等于运算符<>或!=4. 小于运

使用zip4j实现Java中的ZIP文件加密压缩的操作方法

《使用zip4j实现Java中的ZIP文件加密压缩的操作方法》本文介绍如何通过Maven集成zip4j1.3.2库创建带密码保护的ZIP文件,涵盖依赖配置、代码示例及加密原理,确保数据安全性,感兴趣的... 目录1. zip4j库介绍和版本1.1 zip4j库概述1.2 zip4j的版本演变1.3 zip4

Python 字典 (Dictionary)使用详解

《Python字典(Dictionary)使用详解》字典是python中最重要,最常用的数据结构之一,它提供了高效的键值对存储和查找能力,:本文主要介绍Python字典(Dictionary)... 目录字典1.基本特性2.创建字典3.访问元素4.修改字典5.删除元素6.字典遍历7.字典的高级特性默认字典

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处

Nginx安全防护的多种方法

《Nginx安全防护的多种方法》在生产环境中,需要隐藏Nginx的版本号,以避免泄漏Nginx的版本,使攻击者不能针对特定版本进行攻击,下面就来介绍一下Nginx安全防护的方法,感兴趣的可以了解一下... 目录核心安全配置1.编译安装 Nginx2.隐藏版本号3.限制危险请求方法4.请求限制(CC攻击防御)

python生成随机唯一id的几种实现方法

《python生成随机唯一id的几种实现方法》在Python中生成随机唯一ID有多种方法,根据不同的需求场景可以选择最适合的方案,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习... 目录方法 1:使用 UUID 模块(推荐)方法 2:使用 Secrets 模块(安全敏感场景)方法

一文详解如何使用Java获取PDF页面信息

《一文详解如何使用Java获取PDF页面信息》了解PDF页面属性是我们在处理文档、内容提取、打印设置或页面重组等任务时不可或缺的一环,下面我们就来看看如何使用Java语言获取这些信息吧... 目录引言一、安装和引入PDF处理库引入依赖二、获取 PDF 页数三、获取页面尺寸(宽高)四、获取页面旋转角度五、判断