什么是LeNet-5?

2024-08-28 18:44
文章标签 lenet

本文主要是介绍什么是LeNet-5?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

LeNet-5是由Yann LeCun教授在1998年提出的,是一种经典的卷积神经网络(CNN),是现代卷积神经网络的起源之一。该网络最初被用于手写邮政编码的识别,并以其良好的学习和识别能力而著称。LeNet-5在深度学习领域,特别是在计算机视觉领域的发展中占据了重要地位。

LeNet-5的网络结构

LeNet-5网络结构相对简洁,但包含了卷积神经网络的基本组件。具体来说,LeNet-5由以下几个层次组成:

  • 输入层:接收归一化大小的字符图像,通常图像大小为32x32像素。
  • 卷积层(Convolutional Layer)
    • C1层:这是第一个卷积层,使用6个5x5的卷积核对输入图像进行卷积操作,生成6个特征图(Feature Map),每个特征图的大小为28x28。
    • C3层:这是第二个卷积层,它接收来自S2层的输出,并使用16个5x5的卷积核进行卷积操作,生成16个特征图,每个特征图的大小为10x10。
    • C5层:这是一个特殊的卷积层,它使用120个5x5的卷积核对S4层的输出进行卷积,但由于S4层的大小与卷积核相同,因此C5层的输出为1x1x120,即一个120维的向量。
  • 池化层(Pooling Layer)
    • S2层:对C1层的特征图进行下采样(池化)操作,通常采用最大池化或平均池化,生成6个14x14的特征图。
    • S4层:对C3层的特征图进行下采样操作,同样生成16个5x5的特征图。
  • 全连接层(Fully Connected Layer)
    • F6层:这是一个全连接层,有84个神经元,它将C5层的输出(120维向量)转换为一个84维的向量。
    • 输出层:这是最后一个全连接层,也是输出层,它包含10个神经元(对应10个数字类别),使用softmax函数进行分类。

LeNet-5的特点

  • 局部感受野:通过局部感受野机制,每个神经元只连接输入数据的一个局部区域,有助于提取图像的局部特征。
  • 权值共享:同一特征图中的所有神经元共享相同的权值,这有助于网络检测图像中不同位置的相同特征。
  • 下采样(池化):通过池化操作降低特征图的维度,减少计算量,并增强模型对形变的鲁棒性。
  • 稀疏连接:层与层之间的稀疏连接减少了计算复杂度,使得网络更加高效。

LeNet-5的应用

LeNet-5最初被用于手写数字识别,特别是在MNIST数据集上取得了显著的效果。随着深度学习的发展,LeNet-5的结构被广泛应用于各种图像识别任务中,并成为卷积神经网络研究的基础之一。

总之,LeNet-5作为深度学习领域中的早期重要里程碑之一,其简洁而有效的结构为卷积神经网络的发展奠定了坚实的基础。

class LeNet5(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(1, 6, 5, padding=2)self.pool1 = nn.AvgPool2d(2)self.conv2 = nn.Conv2d(6, 16, 5)self.pool2 = nn.AvgPool2d(2)self.fc1 = nn.Linear(16 * 5 * 5, 120)self.fc2 = nn.Linear(120, 84)self.fc3 = nn.Linear(84, 10)def forward(self, x):x = torch.tanh(self.conv1(x))x = self.pool1(x)x = torch.tanh(self.conv2(x))x = self.pool2(x)x = x.view(-1, 16 * 5 * 5)x = self.fc1(x)x = self.fc2(x)x = self.fc3(x)return x

这篇关于什么是LeNet-5?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1115583

相关文章

一文彻底搞懂CNN - 手写数字识别(LeNet-5)

LeNet-5是Yann LeCun在1998年设计的用于手写数字识别的卷积神经网络,是深度学习领域中的早期重要里程碑之一。它是第一个成功应用于手写数字识别的卷积神经网络,标志着深度学习在计算机视觉领域的初步应用。 MNIST数据集 LeNet-5以其简洁而有效的结构,成为了早期卷积神经网络中最具代表性之一。它成功奠定了卷积神经网络在计算机视觉领域的地位。 LeNet-5 一、CN

穿越时光的经典:从LeNet到ResNet,机器学习中的CNN架构进化史

在机器学习的浩瀚星空中,卷积神经网络(Convolutional Neural Networks, CNNs)无疑是最为耀眼的星辰之一,它们以其卓越的图像处理能力,在计算机视觉领域书写了无数辉煌篇章。从最初的简单架构到如今复杂而高效的模型,经典CNN架构的演变不仅见证了人工智能技术的飞速进步,也深刻影响了我们对图像理解方式的认知。本文将带您踏上一场从LeNet到ResNet的经典CNN架构进化

计算机视觉-卷积神经网络CNN之LeNet

文章目录 一. LeNet网络结构二. LeNet结构剖析1. 卷积块层2. 全连接层块 三. 笔者个人理解 一. LeNet网络结构 二. LeNet结构剖析 LeNet是卷积神经网络之父Yann Lecun在1998年提出,用于解决手写数字识别的视觉任务。LeNet是如今各大深度CNN模型的鼻祖。LeNet分为卷积层块和全连接层块两部分。 1. 卷积块层 基本单位包

Deep Learning学习 之 卷积神经网络(文字识别系统LeNet-5)

部分预备知识可以先看博文,统一了一些专业名词。 原文摘自,在此文中对原文增加了一些注释和修改,统一了与之前博文的专业名词说法,有助于理解。 !!!如果读者发现一些数学符号后面有一些奇怪的竖线,那是CSDN的Latex除了问题,大家自行过滤。 在经典的模式识别中,一般是事先提取特征。提取诸多特征后,要对这些特征进行相关性分析,找到最能代表字符的特征,去掉对分类无关和自相关的特征。然而,这些特征

秃姐学AI系列之:LeNet + 代码实现

目录 LeNet  MNIST数据集 LeNet模型图 ​编辑 总结 代码实现:卷积神经网络 LeNet LeNet(LeNet-5)由两个部分组成:卷积编码器核全连接层密集块  检查模型 LeNet  卷积神经网络里面最为著名的一个网络,80年代末提出来的,被广泛应用在银行、邮递行业 用于手写数字识别的一个模型 MNIST数据集 50000个训练数据(在80年

深度学习------------------卷积神经网络(LeNet)

目录 LeNet网络手写的数字识别MNIST总结卷积神经网络(LeNet) 问题 LeNet网络 手写的数字识别 MNIST ①输入的是:32×32的image ②放到一个5×5的卷积层里面(为什么是5?因为32-x+1=28,∴x=5),然后它的输出通道是6,6个通道数,高宽是28的输出。 ③用一个Pooling层,2×2的Pooling层

动手学深度学习(Pytorch版)代码实践 -卷积神经网络-23卷积神经网络LeNet

23卷积神经网络LeNet import torchfrom torch import nnimport liliPytorch as lpimport matplotlib.pyplot as plt# 定义一个卷积神经网络net = nn.Sequential(nn.Conv2d(1, 6, kernel_size=5, padding=2), # 卷积层1:输入通道数1,输出

【深度学习基础】详解Pytorch搭建CNN卷积神经网络LeNet-5实现手写数字识别

目录 写在开头 一、CNN的原理 1. 概述 2. 卷积层 内参数(卷积核本身) 外参数(填充和步幅) 输入与输出的尺寸关系  3. 多通道问题  多通道输入 多通道输出 4. 池化层 平均汇聚 最大值汇聚 二、手写数字识别 1. 任务描述和数据集加载 2. 网络结构(LeNet-5) 3. 模型训练 4. 模型测试 5. 直观显示预测结果 写在最后 写在

LeNet-5训练神经网络训练

LeNet-5训练 导包 import tensorflow as tf from tensorflow.keras import layers, models, datasets, optimizers  加载Fashion-MNIST数据集  (train_images, train_labels), (test_images, test_labels) = datasets.fash

【深度学习笔记2.1】LeNet-5

概述 LeNet-5中的-5是个啥? Gradient-Based Learning Applied to Document Recognition 图1 [3] ![enter image description here](https://lh3.googleusercontent.com/-KPfsR5nep9A/W2rbZF4xk-I/AAAAAAAAAFc/PtinL8z9