本文主要是介绍深度学习两种图像数据预处理具体方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
vgg 预处理
输入图片 height, width
RESIZE_SIDE_MIN = 256
RESIZE_SIDE_MAX = 512
R_MEAN = 123.68G_MEAN = 116.78B_MEAN = 103.94
训练预处理
- scale = width < height ? small_size / width : small_size / height 其中 small_size 为 RESIZE_SIDE_MIN 到 RESIZE_SIDE_MAX 的随机数
- new_width = width * scale new_height = height * scale
- 用二分插值法将 (height, width) 转为 (new_height, new_width)
- 将 new_height, new_width 的图片 crop 为 crop_height(224), crop_width(224) 其中必须满足 new_height >= crop_height, new_width >= crop_width
- 将图片左右翻转(50% 的概率会翻转)
- RGB 分别减去其平均值,其中依次为 R_MEAN, G_MEAN B_MEAN
测试预处理
- 用二分插值法将 (height, width) 转为 (new_height, new_width) 其中 new_height = new_width = 256
- 从 crop 中心的 crop_height, crop_width
- RGB 分别减去其平均值,其中依次为 R_MEAN, G_MEAN B_MEAN
采用上述预处理方法的模型
- resnet_v1_50
- resnet_v1_101
- resnet_v1_152
- resnet_v1_200
- resnet_v2_50
- resnet_v2_101
- resnet_v2_152
- resnet_v2_200
- vgg
- vgg_a
- vgg_16
- vgg_19
inception 预处理
训练预处理
- 对图片进行随机 crop, 使其与 bbox 的重叠部分大于 0.1,长宽比在 (0.75, 1.33) 之间,croped 之后的图片大小为原图的(0.05, 1.0)。
- 将 crop 之后的图片大小 resize 为 crop_height(224), crop_width(224)
- 将 crop 图片左右翻转(50% 的概率会翻转)
- 调整 crop 图片的亮度(32. / 255.)和饱和度(0.5, 1.5)
- 每个元素减去 0.5,再乘以 2.0
测试预处理
- central crop
- 二分法插值,将图片变为 height, width
- 每个元素减去 0.5,再乘以 2.0
采用上述预处理方法的模型
- inception
- inception_v1
- inception_v2
- inception_v3
- inception_v4
- inception_resnet_v2
- mobilenet_v1
- nasnet_mobile
- nasnet_large
- pnasnet_large,
这篇关于深度学习两种图像数据预处理具体方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!