前馈(向)网络之卷积神经网络

2024-03-11 17:58

本文主要是介绍前馈(向)网络之卷积神经网络,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

传统的神经网络:

多层感知器(DNN,MLP等),对图片这类数据可能不太适合!

 图片数据,比如:32*32*3,展开大概是4000维的向量,如果一层神经元是1024个那么进行全连接每层会有400W个参数

ps:参数过多主要是会导致过拟合的,而且网络学习很缓慢。

ps:一般是没有足够的样本量来去学习这么复杂的网络。

ps:基于参数的问题,于是引出了卷积神经网络(CNN)!

引出卷积神经网络

数据输入层/input  layer

   :主要进行数据的预处理,数据标准化(图像数据乘1/255即可),PCA降维,图片加噪声。

卷积计算层/CONV layer

计算示例的标准格式:

      :深度(depth)是神经元的个数,步长stride是滑窗滑动的格数(比如3*3的矩阵每次滑动1格),矩阵的padd填充                       值为0!公式:(8-3)/s+1。O=(I-K+2P)/S+1   p=padding=SAME  s=stride[1,2,2,1]

      :参数共享机制,一个神经元对应图片每个滑窗的权重一样,但是不同神经元的权重是不同的

ps:可以促使参数量降低很多,是跟每层的卷积核个数,卷积核的size,以及深度有关。

ps:第一,能够很好的把参数量降低下来,

ps:第二,卷积的过程也是在进行内积的运算促使特征进行组合。

正常情况的卷积计算示例:(上下每次移动4格)

1*1的卷积核示例:其实就是利用数值将通道数量缩减了(512==>32)

ps:1*1卷积核,可以进一步降低参数量,将通道深度进行内积整合到一起进行了特征组合。

全连接计算:

激励层/Activation  layer(通常卷积层后面会默认跟一个激励层)

       :把卷积层的的输出结果做一个非线性映射

ps:通过卷积层也可以看成是一种特征的组合。

ps:非线性的变换也可看成是一种特征的组合。

       :激活函数

ps:激活函数可能会引来梯度弥散的问题。

ps:比如sigmod和tanh函数对于bp反向传播的梯度优化会造成此问题,当模型层数过深也会导致此问题。

ps:sigmoid和tanh的值域是对称的形式;       

       :ReLu是修正线性单元,大于0就有斜率,小于0就为0,可以达到随机失活(dropout)的特性!

       :Leakly ReLu 是对ReLu斜率的线性修正,斜率不会直接为零。

       :Maxout,是用两条线段进行组合,不同的值在哪条线上斜率大就取谁。

       :ELu,是对ReLu的一种修正,是指数修正

ps:一般会先使用Relu激活函数,一般效率高而且效果还好。

池化层/pooling  layer(下采样层)

         :Max Pooling最大池化:保留数据当中最明显的特征(用的最多)

         :Average Pooling平均池化:保留数据中的平均值特性(用的不多)

ps:降维, 来降低过拟合的风险。   

ps:满足特征不变性,我们只关注明显的特征值,而不是特征的边缘位置信息,使用池化层可以把这些不重要的位置信息去除掉,而保留最重要的特征!

全连接层/FC layer

         :两层之间所有的神经元都有权重连接

ps:相当于就是一个笛卡尔积。

         :通常全连接层在卷积神经网络尾部

         :全连接层,是把图像展开成一维向量,然后与权重相乘得到一个val来实现全连接!

ps:展开后会造成大量的参数。

过拟合之正则化与Dropout:

:当模型过拟合的时候。

ps:L1和L2正则项处理效果不明显,在这里提出随机失活的思路!

:每一轮训练中,在每一层中的神经元会有一个开关,有概率失活也有概率打开

:开关是闭合的该怎么算就怎摸算,当开关一旦打开,不管前面算到的甚么结果都会失效,值为零,从新进行学习!

Dropout的理解:

:第一种,神经网络学到的东西太复杂了,要保持泛化能力,就要通过舍弃信息,让学习变得的缓慢一点!

ps:通过舍弃信息来保持泛化能力,减缓学习速度,来提升效果。

:第二种,每轮训练都关掉一部分感知器,每一轮都会得到一个新模型,相当于是进行模型融合bagging减少方差!

ps:通过训练多个模型来解决过拟合的问题。

ResNet网络

ps:基于模型来解决梯度消失这一问题,引出ResNet。

这个网络的连接不是一层扣一层的,每层都会有一个高速通道(算是一条捷径)可以进行跳跃。

ps:通过高速通道天然的防止过拟合!

ps:就是通过在梯度连乘的基础上引进了加法。

ps:基于此很好的处理了梯度弥散的问题。

这篇关于前馈(向)网络之卷积神经网络的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/798591

相关文章

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

【机器学习】高斯网络的基本概念和应用领域

引言 高斯网络(Gaussian Network)通常指的是一个概率图模型,其中所有的随机变量(或节点)都遵循高斯分布 文章目录 引言一、高斯网络(Gaussian Network)1.1 高斯过程(Gaussian Process)1.2 高斯混合模型(Gaussian Mixture Model)1.3 应用1.4 总结 二、高斯网络的应用2.1 机器学习2.2 统计学2.3