深度学习第二周 tensorflow实现彩色图片识别识别

2023-10-29 07:20

本文主要是介绍深度学习第二周 tensorflow实现彩色图片识别识别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 🍨 本文为🔗365天深度学习训练营 内部限免文章(版权归 K同学啊 所有)
  • ** 参考文章地址:🔗深度学习100例-卷积神经网络(CNN)彩色图片分类 | 第2天 **
  • 🍖 作者:K同学啊

    文章目录

    • 一、本周学习内容:
      • 1、卷积层
      • 2、池化层
    • 二、前言
    • 三、电脑环境
    • 四、前期准备
      • 1、导入相关依赖项
      • 2、设置GPU(我下载的tensorflow-gpu 默认使用GPU)
      • 3、加载数据集和展示
        • (1)、数据集加载
        • (2)、数据展示
    • 五、数据预处理
    • 六、搭建CNN网络
    • 七、绘制损失函数图像和准确度图像

一、本周学习内容:

1、卷积层

卷积层的作用为提取输入数据中的特征
假如输入图片为33,卷积核为22,不填充,步长为1,卷积效果如下
在这里插入图片描述
从左到右从上到下一次依次相乘再求和
如:19=0x0+1x1+3x2+4x3
25=1x0+2x1+4x2+5x3
加入填充层,输入图片为33,卷积核为22,填充宽高都为1,步长为1,卷积效果如下
在这里插入图片描述
在加入填充层的情况下把步长改为2,卷积效果如下:
在这里插入图片描述
注意如果当输入维度进行卷积移动时,余下的不够进行再次计算,则余下那列(或行)被舍弃,当然有时为了计算快速,则跳过一列(或一行)进行计算,如上图中,进行列移动时,就跳过了一行
卷积后宽高的计算公式
在这里插入图片描述
如:上面三个的输出维度计算分别为:
动图1:(3-2+2x0)÷1+1=2
动图2:(3-2+2x1)÷1+1=4
动图3:(3-2+2x1)÷2+1=2.5(保留整数)=2
注意:宽高要分别计算。

2、池化层

池化层对提取到的特征信息进行降维,一方面使特征图变小,简化网络计算复杂度;另一方面进行特征压缩,提取主要特征,增加平移不变性,减少过拟合风险。但其实池化更多程度上是一种计算性能的一个妥协,强硬地压缩特征的同时也损失了一部分信息,所以现在的网络比较少用池化层或者使用优化后的如SoftPool。
池化层有最大池化层和平均池化层,选择一个区域内的最大值或平均值。
如输入图片为3x3,选择的池化从尺寸为2x2的
在这里插入图片描述

二、前言

CIFAR-10数据集由6万张32*32的彩色图片组成,一共有10个类别。每个类别6000张图片。其中有5万张训练图片及1万张测试图片。它的收集者是:Alex Krizhevsky, Vinod Nair, Geoffrey Hinton。
类别包括:[ ‘airplane’, ‘automobile’, ‘bird’, ‘cat’, 'deer ’ , ’ dog ', ‘frog’, 'horse ', ‘ship’, ‘truck’]

三、电脑环境

电脑系统:Windows 10
语言环境:Python 3.8.8
编译器:Pycharm 2021.1.3
深度学习环境:TensorFlow 2.8.0,keras 2.8.0
显卡及显存:RTX 3070 8G

四、前期准备

1、导入相关依赖项

from keras.datasets import cifar10
from keras.models import *
from keras.layers import *
from tensorflow import keras
import matplotlib.pyplot as plt

2、设置GPU(我下载的tensorflow-gpu 默认使用GPU)

只使用GPU

if gpus:gpu0 = gpus[0]                                        #如果有多个GPU,仅使用第0个GPUtf.config.experimental.set_memory_growth(gpu0, True)  #设置GPU显存用量按需使用tf.config.set_visible_devices([gpu0],"GPU")

使用cpu和gpu
os.environ[“CUDA_VISIBLE_DEVICES”] = “-1”

3、加载数据集和展示

(1)、数据集加载

# 数据加载
(x_train,y_train),(x_test,y_test) = cifar10.load_data()

这里的数据集加载方式和上篇文章mnist有些区别
运行上面命令后 会在.C:\Users\用户名(此处填你自己的)\.keras\datasets中有这么一个压缩包
在这里插入图片描述
解压后里面就是相关数据集和html文件介绍
如果直接加载数据集报错,数据集下载失败的,参考第一周文章

(2)、数据展示

直接使用第一周文章代码进行展示
分别展示训练集和测试集各自的前十张图片

# 图片展示
plt.figure(figsize=(20, 5))  # 创建一个画布,画布大小为宽20、高5(单位为英寸inch)
for i, imgs in enumerate(x_train[:10]):# 将整个画布分成2行10列,绘制第i+1个子图。plt.subplot(2, 10, i+1)plt.imshow(imgs, cmap=plt.cm.binary)plt.axis('off')
for i, imgs in enumerate(x_test[:10]):# 将整个画布分成2行10列,绘制第i+11个子图。plt.subplot(2, 10, i+11)plt.imshow(imgs, cmap=plt.cm.binary)plt.axis('off')
plt.show()  #使用pycharm的需要加入这行代码才能将图像显示出来

在这里插入图片描述

五、数据预处理

我们需要将验证集和测数据数据增加一个维度,并将其像素从0-255划分到0-1之间减少计算量,我们还需要将标签集进行热编码处理

# 数据预处理
x_train,x_test=x_train/255.,x_test/255.
# 标签热编码
y_train,y_test = keras.utils.to_categorical(y_train),keras.utils.to_categorical(y_test)

六、搭建CNN网络

相关网络模型和参数与第一周

# 网络模型
model = Sequential([Conv2D(filters=32,kernel_size=3,activation='relu',input_shape=(28,28,1)),MaxPool2D((2,2)),Conv2D(filters=64,kernel_size=3,activation='relu'),MaxPool2D((2,2)),Flatten(),Dense(64,activation='relu'),Dense(10,activation='softmax')  # 输出为10类别
])
# 设置优化器相关
model.compile(optimizer=keras.optimizers.SGD(learning_rate=0.01),loss=keras.losses.binary_crossentropy,metrics=['acc'])
evaluate = model.evaluate(x_test,y_test)
print(evaluate)
Epoch 1/10
1667/1667 [==============================] - 22s 3ms/step - loss: 0.3390 - acc: 0.1615 - val_loss: 0.3214 - val_acc: 0.1835
Epoch 2/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.3158 - acc: 0.2204 - val_loss: 0.3093 - val_acc: 0.2504
Epoch 3/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.3020 - acc: 0.2741 - val_loss: 0.2947 - val_acc: 0.2989
Epoch 4/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2918 - acc: 0.3025 - val_loss: 0.2878 - val_acc: 0.3235
Epoch 5/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2858 - acc: 0.3235 - val_loss: 0.2819 - val_acc: 0.3452
Epoch 6/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2796 - acc: 0.3437 - val_loss: 0.2754 - val_acc: 0.3592
Epoch 7/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2732 - acc: 0.3641 - val_loss: 0.2696 - val_acc: 0.3739
Epoch 8/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2667 - acc: 0.3831 - val_loss: 0.2630 - val_acc: 0.3902
Epoch 9/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2604 - acc: 0.4003 - val_loss: 0.2573 - val_acc: 0.4097
Epoch 10/10
1667/1667 [==============================] - 5s 3ms/step - loss: 0.2549 - acc: 0.4123 - val_loss: 0.2521 - val_acc: 0.4195
313/313 [==============================] - 1s 2ms/step - loss: 0.2521 - acc: 0.4195
[0.25214818120002747, 0.4194999933242798]

七、绘制损失函数图像和准确度图像

绘制代码与第一周文章相同

# 画准确度图
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs_range = range(10)
plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')
plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

在这里插入图片描述
以上就是我本周的学习内容
在这里插入图片描述

这篇关于深度学习第二周 tensorflow实现彩色图片识别识别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/299128

相关文章

Nginx实现高并发的项目实践

《Nginx实现高并发的项目实践》本文主要介绍了Nginx实现高并发的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录使用最新稳定版本的Nginx合理配置工作进程(workers)配置工作进程连接数(worker_co

python中列表list切分的实现

《python中列表list切分的实现》列表是Python中最常用的数据结构之一,经常需要对列表进行切分操作,本文主要介绍了python中列表list切分的实现,文中通过示例代码介绍的非常详细,对大家... 目录一、列表切片的基本用法1.1 基本切片操作1.2 切片的负索引1.3 切片的省略二、列表切分的高

基于Python实现一个PDF特殊字体提取工具

《基于Python实现一个PDF特殊字体提取工具》在PDF文档处理场景中,我们常常需要针对特定格式的文本内容进行提取分析,本文介绍的PDF特殊字体提取器是一款基于Python开发的桌面应用程序感兴趣的... 目录一、应用背景与功能概述二、技术架构与核心组件2.1 技术选型2.2 系统架构三、核心功能实现解析

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Nginx中location实现多条件匹配的方法详解

《Nginx中location实现多条件匹配的方法详解》在Nginx中,location指令用于匹配请求的URI,虽然location本身是基于单一匹配规则的,但可以通过多种方式实现多个条件的匹配逻辑... 目录1. 概述2. 实现多条件匹配的方式2.1 使用多个 location 块2.2 使用正则表达式

使用Apache POI在Java中实现Excel单元格的合并

《使用ApachePOI在Java中实现Excel单元格的合并》在日常工作中,Excel是一个不可或缺的工具,尤其是在处理大量数据时,本文将介绍如何使用ApachePOI库在Java中实现Excel... 目录工具类介绍工具类代码调用示例依赖配置总结在日常工作中,Excel 是一个不可或缺的工http://

SpringBoot实现导出复杂对象到Excel文件

《SpringBoot实现导出复杂对象到Excel文件》这篇文章主要为大家详细介绍了如何使用Hutool和EasyExcel两种方式来实现在SpringBoot项目中导出复杂对象到Excel文件,需要... 在Spring Boot项目中导出复杂对象到Excel文件,可以利用Hutool或EasyExcel

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常