深度学习第二周 tensorflow实现彩色图片识别识别

2023-10-29 07:20

本文主要是介绍深度学习第二周 tensorflow实现彩色图片识别识别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 🍨 本文为🔗365天深度学习训练营 内部限免文章(版权归 K同学啊 所有)
  • ** 参考文章地址:🔗深度学习100例-卷积神经网络(CNN)彩色图片分类 | 第2天 **
  • 🍖 作者:K同学啊

    文章目录

    • 一、本周学习内容:
      • 1、卷积层
      • 2、池化层
    • 二、前言
    • 三、电脑环境
    • 四、前期准备
      • 1、导入相关依赖项
      • 2、设置GPU(我下载的tensorflow-gpu 默认使用GPU)
      • 3、加载数据集和展示
        • (1)、数据集加载
        • (2)、数据展示
    • 五、数据预处理
    • 六、搭建CNN网络
    • 七、绘制损失函数图像和准确度图像

一、本周学习内容:

1、卷积层

卷积层的作用为提取输入数据中的特征
假如输入图片为33,卷积核为22,不填充,步长为1,卷积效果如下
在这里插入图片描述
从左到右从上到下一次依次相乘再求和
如:19=0x0+1x1+3x2+4x3
25=1x0+2x1+4x2+5x3
加入填充层,输入图片为33,卷积核为22,填充宽高都为1,步长为1,卷积效果如下
在这里插入图片描述
在加入填充层的情况下把步长改为2,卷积效果如下:
在这里插入图片描述
注意如果当输入维度进行卷积移动时,余下的不够进行再次计算,则余下那列(或行)被舍弃,当然有时为了计算快速,则跳过一列(或一行)进行计算,如上图中,进行列移动时,就跳过了一行
卷积后宽高的计算公式
在这里插入图片描述
如:上面三个的输出维度计算分别为:
动图1:(3-2+2x0)÷1+1=2
动图2:(3-2+2x1)÷1+1=4
动图3:(3-2+2x1)÷2+1=2.5(保留整数)=2
注意:宽高要分别计算。

2、池化层

池化层对提取到的特征信息进行降维,一方面使特征图变小,简化网络计算复杂度;另一方面进行特征压缩,提取主要特征,增加平移不变性,减少过拟合风险。但其实池化更多程度上是一种计算性能的一个妥协,强硬地压缩特征的同时也损失了一部分信息,所以现在的网络比较少用池化层或者使用优化后的如SoftPool。
池化层有最大池化层和平均池化层,选择一个区域内的最大值或平均值。
如输入图片为3x3,选择的池化从尺寸为2x2的
在这里插入图片描述

二、前言

CIFAR-10数据集由6万张32*32的彩色图片组成,一共有10个类别。每个类别6000张图片。其中有5万张训练图片及1万张测试图片。它的收集者是:Alex Krizhevsky, Vinod Nair, Geoffrey Hinton。
类别包括:[ ‘airplane’, ‘automobile’, ‘bird’, ‘cat’, 'deer ’ , ’ dog ', ‘frog’, 'horse ', ‘ship’, ‘truck’]

三、电脑环境

电脑系统:Windows 10
语言环境:Python 3.8.8
编译器:Pycharm 2021.1.3
深度学习环境:TensorFlow 2.8.0,keras 2.8.0
显卡及显存:RTX 3070 8G

四、前期准备

1、导入相关依赖项

from keras.datasets import cifar10
from keras.models import *
from keras.layers import *
from tensorflow import keras
import matplotlib.pyplot as plt

2、设置GPU(我下载的tensorflow-gpu 默认使用GPU)

只使用GPU

if gpus:gpu0 = gpus[0]                                        #如果有多个GPU,仅使用第0个GPUtf.config.experimental.set_memory_growth(gpu0, True)  #设置GPU显存用量按需使用tf.config.set_visible_devices([gpu0],"GPU")

使用cpu和gpu
os.environ[“CUDA_VISIBLE_DEVICES”] = “-1”

3、加载数据集和展示

(1)、数据集加载

# 数据加载
(x_train,y_train),(x_test,y_test) = cifar10.load_data()

这里的数据集加载方式和上篇文章mnist有些区别
运行上面命令后 会在.C:\Users\用户名(此处填你自己的)\.keras\datasets中有这么一个压缩包
在这里插入图片描述
解压后里面就是相关数据集和html文件介绍
如果直接加载数据集报错,数据集下载失败的,参考第一周文章

(2)、数据展示

直接使用第一周文章代码进行展示
分别展示训练集和测试集各自的前十张图片

# 图片展示
plt.figure(figsize=(20, 5))  # 创建一个画布,画布大小为宽20、高5(单位为英寸inch)
for i, imgs in enumerate(x_train[:10]):# 将整个画布分成2行10列,绘制第i+1个子图。plt.subplot(2, 10, i+1)plt.imshow(imgs, cmap=plt.cm.binary)plt.axis('off')
for i, imgs in enumerate(x_test[:10]):# 将整个画布分成2行10列,绘制第i+11个子图。plt.subplot(2, 10, i+11)plt.imshow(imgs, cmap=plt.cm.binary)plt.axis('off')
plt.show()  #使用pycharm的需要加入这行代码才能将图像显示出来

在这里插入图片描述

五、数据预处理

我们需要将验证集和测数据数据增加一个维度,并将其像素从0-255划分到0-1之间减少计算量,我们还需要将标签集进行热编码处理

# 数据预处理
x_train,x_test=x_train/255.,x_test/255.
# 标签热编码
y_train,y_test = keras.utils.to_categorical(y_train),keras.utils.to_categorical(y_test)

六、搭建CNN网络

相关网络模型和参数与第一周

# 网络模型
model = Sequential([Conv2D(filters=32,kernel_size=3,activation='relu',input_shape=(28,28,1)),MaxPool2D((2,2)),Conv2D(filters=64,kernel_size=3,activation='relu'),MaxPool2D((2,2)),Flatten(),Dense(64,activation='relu'),Dense(10,activation='softmax')  # 输出为10类别
])
# 设置优化器相关
model.compile(optimizer=keras.optimizers.SGD(learning_rate=0.01),loss=keras.losses.binary_crossentropy,metrics=['acc'])
evaluate = model.evaluate(x_test,y_test)
print(evaluate)
Epoch 1/10
1667/1667 [==============================] - 22s 3ms/step - loss: 0.3390 - acc: 0.1615 - val_loss: 0.3214 - val_acc: 0.1835
Epoch 2/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.3158 - acc: 0.2204 - val_loss: 0.3093 - val_acc: 0.2504
Epoch 3/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.3020 - acc: 0.2741 - val_loss: 0.2947 - val_acc: 0.2989
Epoch 4/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2918 - acc: 0.3025 - val_loss: 0.2878 - val_acc: 0.3235
Epoch 5/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2858 - acc: 0.3235 - val_loss: 0.2819 - val_acc: 0.3452
Epoch 6/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2796 - acc: 0.3437 - val_loss: 0.2754 - val_acc: 0.3592
Epoch 7/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2732 - acc: 0.3641 - val_loss: 0.2696 - val_acc: 0.3739
Epoch 8/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2667 - acc: 0.3831 - val_loss: 0.2630 - val_acc: 0.3902
Epoch 9/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2604 - acc: 0.4003 - val_loss: 0.2573 - val_acc: 0.4097
Epoch 10/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2549 - acc: 0.4123 - val_loss: 0.2521 - val_acc: 0.4195
313/313 [==============================] - 1s 2ms/step - loss: 0.2521 - acc: 0.4195
[0.25214818120002747, 0.4194999933242798]

七、绘制损失函数图像和准确度图像

绘制代码与第一周文章相同

# 画准确度图
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs_range = range(10)
plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')
plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

在这里插入图片描述
以上就是我本周的学习内容
在这里插入图片描述

这篇关于深度学习第二周 tensorflow实现彩色图片识别识别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/299128

相关文章

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

51单片机学习记录———定时器

文章目录 前言一、定时器介绍二、STC89C52定时器资源三、定时器框图四、定时器模式五、定时器相关寄存器六、定时器练习 前言 一个学习嵌入式的小白~ 有问题评论区或私信指出~ 提示:以下是本篇文章正文内容,下面案例可供参考 一、定时器介绍 定时器介绍:51单片机的定时器属于单片机的内部资源,其电路的连接和运转均在单片机内部完成。 定时器作用: 1.用于计数系统,可

问题:第一次世界大战的起止时间是 #其他#学习方法#微信

问题:第一次世界大战的起止时间是 A.1913 ~1918 年 B.1913 ~1918 年 C.1914 ~1918 年 D.1914 ~1919 年 参考答案如图所示

[word] word设置上标快捷键 #学习方法#其他#媒体

word设置上标快捷键 办公中,少不了使用word,这个是大家必备的软件,今天给大家分享word设置上标快捷键,希望在办公中能帮到您! 1、添加上标 在录入一些公式,或者是化学产品时,需要添加上标内容,按下快捷键Ctrl+shift++就能将需要的内容设置为上标符号。 word设置上标快捷键的方法就是以上内容了,需要的小伙伴都可以试一试呢!

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

Javascript高级程序设计(第四版)--学习记录之变量、内存

原始值与引用值 原始值:简单的数据即基础数据类型,按值访问。 引用值:由多个值构成的对象即复杂数据类型,按引用访问。 动态属性 对于引用值而言,可以随时添加、修改和删除其属性和方法。 let person = new Object();person.name = 'Jason';person.age = 42;console.log(person.name,person.age);//'J

大学湖北中医药大学法医学试题及答案,分享几个实用搜题和学习工具 #微信#学习方法#职场发展

今天分享拥有拍照搜题、文字搜题、语音搜题、多重搜题等搜题模式,可以快速查找问题解析,加深对题目答案的理解。 1.快练题 这是一个网站 找题的网站海量题库,在线搜题,快速刷题~为您提供百万优质题库,直接搜索题库名称,支持多种刷题模式:顺序练习、语音听题、本地搜题、顺序阅读、模拟考试、组卷考试、赶快下载吧! 2.彩虹搜题 这是个老公众号了 支持手写输入,截图搜题,详细步骤,解题必备

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue:

通过SSH隧道实现通过远程服务器上外网

搭建隧道 autossh -M 0 -f -D 1080 -C -N user1@remotehost##验证隧道是否生效,查看1080端口是否启动netstat -tuln | grep 1080## 测试ssh 隧道是否生效curl -x socks5h://127.0.0.1:1080 -I http://www.github.com 将autossh 设置为服务,隧道开机启动

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为