T1打卡——mnist手写数字识别

2024-09-08 01:36

本文主要是介绍T1打卡——mnist手写数字识别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 🍨 本文为🔗365天深度学习训练营中的学习记录博客
  • 🍖 原作者:K同学啊

1.定义GPU

import tensorflow as tfgpus=tf.config.list_physical_devices("GPU")if gpus:gpu0=gpus[0]tf.config.experimental.set_memort_groth(gpu0,True)   #设置GPU现存用量按需使用tf.config.experimental.set_visible_devices([gpu0],"GPU")

2.数据预处理

#导入数据
import tensorflow as tf
from tensorflow.keras import datasets,layers,models
import matplotlib.pyplot as plt(train_images,train_labels),(test_images,test_labels)=datasets.mnist.load_data()#标准化
train_images,test_images=train_images/255.0,test_images/255.0
#查看维数
train_images.shape,test_images.shape,train_labels.shape,test_labels.shape
#数据可视化
plt.figure(figsize=(20,5))
for i in range(20):plt.subplot(2,10,i+1)#不显示x轴刻度plt.xticks([])#不显示y轴刻度plt.yticks([])#不显示子图网格线plt.grid(False)#cmap是颜色图谱,plt.cm.binary是色表plt.imshow(train_images[i],cmap=plt.cm.binary)plt.xlabel(train_labels[i])
plt.show()#重塑数据维度使其可易于被模型处理
train_images=train_images.reshape((60000,28,28,1))
test_images=test_images.reshape((10000,28,28,1))train_images.shape,test_images.shape,train_labels.shape,test_labels.shape

55f75a2526564d6b8a3e6401b0fffd84.png3.定义CNN网络模型

#定义cnn模型
model=models.Sequential([## 设置二维卷积层1,设置32个3*3卷积核layers.Conv2D(32,(3,3),activation='relu',input_shape=(28,28,1)),#池化层1,2*2采样layers.MaxPooling2D((2,2)),# 设置二维卷积层2,设置64个3*3卷积核,layers.Conv2D(64,(3,3),activation='relu'),#池化层2,2*2采样layers.MaxPooling2D((2,2)),#连接卷积层和全连接层layers.Flatten(),#全连接层,64是输出维度layers.Dense(64,activation='relu'),#输出层,输出维度是10layers.Dense(10)
])
model.summary()
#定义优化器损失函数
model.compile(optimizer='adam',#交叉熵损失函数(tf.keras.losses.SparseCategoricalCrossentropy(), from_logits为True时,会将y_pred转化为概率(用softmax),否则不进行转换,通常情况下用True结果更稳定loss=tf.losses.SparseCategoricalCrossentropy(from_logits=True),metrics=(['accuracy'])
)

4e3d56a10e5f436c855e795924ee218e.png

4.训练模型

history=model.fit(train_images,train_labels,epochs=10,validation_data=(test_images,test_labels))

36ee9364253e470a81f0462e5dd2fb49.png

5.预测数据

plt.imshow(test_images[1])pre=model.predict(test_images)
pre[1]

e017f98a7c024cf58b37464c984a25f7.png7d6aa815cfca4a698de75129b32c28ed.png

 

知识点总结:

1.CNN网络

7cf628d80a7e42eb86799850b101a741.png

         卷积层:通过卷积操作对输入图像进行降维和特征抽取
         池化层:是一种非线性形式的下采样。主要用于特征降维,压缩数据和参数的数量,减小过拟合,同时提高模型的鲁棒性。
         全连接层:在经过几个卷积和池化层之后,神经网络中的高级推理通过全连接层来完成。

        作用:         

  • 输入层:用于将数据输入到训练网络
  • 卷积层:使用卷积核提取图片特征
  • 池化层:进行下采样,用更高层的抽象表示图像特征
  • Flatten层:将多维的输入一维化,常用在卷积层到全连接层的过渡
  • 全连接层:起到“特征提取器”的作用
  • 输出层:输出结果

2.定义gpu的方法:

import tensorflow as tfgpus=tf.config.list_physical_devices("GPU")if gpus:gpu0=gpus[0]tf.config.experimental.set_memort_groth(gpu0,True)   #设置GPU现存用量按需使用tf.config.experimental.set_visible_devices([gpu0],"GPU")

 

 

这篇关于T1打卡——mnist手写数字识别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1146738

相关文章

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的

java字符串数字补齐位数详解

《java字符串数字补齐位数详解》:本文主要介绍java字符串数字补齐位数,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java字符串数字补齐位数一、使用String.format()方法二、Apache Commons Lang库方法三、Java 11+的St

Pytorch微调BERT实现命名实体识别

《Pytorch微调BERT实现命名实体识别》命名实体识别(NER)是自然语言处理(NLP)中的一项关键任务,它涉及识别和分类文本中的关键实体,BERT是一种强大的语言表示模型,在各种NLP任务中显著... 目录环境准备加载预训练BERT模型准备数据集标记与对齐微调 BERT最后总结环境准备在继续之前,确

讯飞webapi语音识别接口调用示例代码(python)

《讯飞webapi语音识别接口调用示例代码(python)》:本文主要介绍如何使用Python3调用讯飞WebAPI语音识别接口,重点解决了在处理语音识别结果时判断是否为最后一帧的问题,通过运行代... 目录前言一、环境二、引入库三、代码实例四、运行结果五、总结前言基于python3 讯飞webAPI语音

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

Java数字转换工具类NumberUtil的使用

《Java数字转换工具类NumberUtil的使用》NumberUtil是一个功能强大的Java工具类,用于处理数字的各种操作,包括数值运算、格式化、随机数生成和数值判断,下面就来介绍一下Number... 目录一、NumberUtil类概述二、主要功能介绍1. 数值运算2. 格式化3. 数值判断4. 随机

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推