直觉化深度学习教程——什么是前向传播

2024-01-23 21:18

本文主要是介绍直觉化深度学习教程——什么是前向传播,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

所谓前向传播,就是给网络输入一个样本向量,该样本向量的各元素,经过各隐藏层的逐级加权求和+非线性激活,最终由输出层输出一个预测向量的过程。

看完这篇博客,你要是还不懂,一定是我哪里没写清楚,请联系我。

文章目录

    • @[toc]
  • 一个简化的例子
  • 加权和的计算
  • 激活值的计算
  • 矩阵化表示的好处

一个简化的例子

因为神经网络两层之间的连线、符号、上下标,确实让人头大,我们可以由一个简化的网络来计算出神经网络两层之间激活值的传递关系。

如图1所示,我们假设一第l层的神经元有2个,第l-1层(也就是上一层)的神经元有3个。每类符号的含义已在图中说明。

在这里插入图片描述

图1.简化的局部网络

由于符号和下标实在太多,因此我们只要计算第一个神经元的 z 1 l z^l_1 z1l a 1 l a^l_1 a1l,第二个神经元的 z 2 l z^l_2 z2l a 2 l a^l_2 a2l简直就是照猫画虎了。图1中有一个会让人初次接触时感觉别扭,就是权重 w w w的下标由其所连接的两个神经元的各自层的索引下标组成,前一层的索引在右边,而后一层的神经元左边,这是为了后面构造矩阵乘法显得简洁。


加权和的计算

根据图1,我们可以按照图2所示,将 z 1 l z^l_1 z1l求出来,然后同理求出 z 2 l z^l_2 z2l,两个元素对堆叠起来,即可用一个矩阵乘积再加上偏置向量来表示。

在这里插入图片描述

图2.加权和的计算

由图2,显然可以看出:

  • 上一层神经元越多,W的列数越多,即越宽
  • 本层神经元越多,W的行数越多,即越高。
  • 偏置 b ⃗ \vec{b} b 的元素个数,等于本层神经元个数,与上一层神经元个数无关。

进一步地,有时候我们追求简洁,干脆将偏置融入权重矩阵中,构造出增广的 W W W;同时,给上一层的激活值向量 a ⃗ \vec{a} a 也增加一个元素1,这样能得到更简洁的纯粹矩阵乘法的形式。如图3所示。

在这里插入图片描述

图3.加权和的两种表示方法

激活值的计算

ok,现在我们有了加权和 z ⃗ \vec{z} z 的计算表达式,即由上一层输出的激活值向量获得本层的加权和,而且我们有两种形式的表达式,因此激活值的计算表达式也是两种。如图4所示。

注意,这里的激活 σ ( ) \sigma() σ()指的是对输入向量的每个元素进行激活,即标量运算。输入的向量 z ⃗ l \vec{z}^l z l有多少个元素,输出也对应多少个元素。

在这里插入图片描述

图4.激活值前向传播的两种常见表示方法

图4的两种表示方法,均表达了由上一层的激活值 a ⃗ l − 1 \vec{a}^{l-1} a l1是如何通过本层的权重和偏置,计算出本层的激活值 a ⃗ l \vec{a}^{l} a l来的。为了强调偏置 b b b,我们用常规表示法。

这样,即构成了一种传递,或者传播。叫啥都行,关键是理解。

如此,便可以如图5所示,对于输入层的一个样本向量 x ⃗ \vec{x} x ,我们可以通过简洁且固定规律的表达式,来迭代出最终的网络输出 l ⃗ \vec{l} l ,神经网络千丝万缕的符号、连接海洋,被这么简单的且重复的表达式搞定了,来,让我们向线性代数致敬!

图5假定为总共l+1层网络。

在这里插入图片描述

图5.前向传播的总过程

图5描述的是前向传播的总过程,我们可以仔细解读一下:

  • 重复的同与不同

    虽然隐藏层中是重复地做加权和+非线性激活,但是每层网络的权重矩阵 W W W、偏置 b ⃗ \vec{b} b 并不相同,各层的加权和 z ⃗ \vec{z} z 因此并非一样的运算。

  • 输出层激活函数的特殊性

    输出层的激活函数由于与目标函数有“组合效应”,因此常常根据目标函数的构造,选用搭配的激活函数,后面反向传播时会详细讨论。

  • W W W与两层网络间的线性变换的对应

    只要每次看到 W W W x ⃗ \vec{x} x 进行线性变换,请自动脑补:两层网络之间网络连接,以及加权和的生成公式。

    由于很多表达式为了追求简洁,省略了偏置 b b b的表示,但偏置 b b b可能被省略,但它一直存在。因此别忘了它。

  • σ ( W ⋅ ) \sigma(W·) σ(W)表示一层神经网络前向传播。

    一层的完整传播,必须包括 W W W σ ( ⋅ ) \sigma(·) σ()

  • 后面我们将看到RNN、LSTM里的 W W W σ ( W ⋅ ) \sigma(W·) σ(W),请自动脑补成加权和网络,或者一层完整前向传播


矩阵化表示的好处

好了,简单总结一下应用上述推导结果的好处。

  • 有利于模型的准确定义

  • 方便软件实现

  • 方便硬件的加速(AI芯片或显卡)

  • 化繁为简,给思维减负,有利于创新。

这篇关于直觉化深度学习教程——什么是前向传播的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/637556

相关文章

Ubuntu中远程连接Mysql数据库的详细图文教程

《Ubuntu中远程连接Mysql数据库的详细图文教程》Ubuntu是一个以桌面应用为主的Linux发行版操作系统,这篇文章主要为大家详细介绍了Ubuntu中远程连接Mysql数据库的详细图文教程,有... 目录1、版本2、检查有没有mysql2.1 查询是否安装了Mysql包2.2 查看Mysql版本2.

Elasticsearch 在 Java 中的使用教程

《Elasticsearch在Java中的使用教程》Elasticsearch是一个分布式搜索和分析引擎,基于ApacheLucene构建,能够实现实时数据的存储、搜索、和分析,它广泛应用于全文... 目录1. Elasticsearch 简介2. 环境准备2.1 安装 Elasticsearch2.2 J

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

SpringCloud动态配置注解@RefreshScope与@Component的深度解析

《SpringCloud动态配置注解@RefreshScope与@Component的深度解析》在现代微服务架构中,动态配置管理是一个关键需求,本文将为大家介绍SpringCloud中相关的注解@Re... 目录引言1. @RefreshScope 的作用与原理1.1 什么是 @RefreshScope1.

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Java使用Curator进行ZooKeeper操作的详细教程

《Java使用Curator进行ZooKeeper操作的详细教程》ApacheCurator是一个基于ZooKeeper的Java客户端库,它极大地简化了使用ZooKeeper的开发工作,在分布式系统... 目录1、简述2、核心功能2.1 CuratorFramework2.2 Recipes3、示例实践3

springboot简单集成Security配置的教程

《springboot简单集成Security配置的教程》:本文主要介绍springboot简单集成Security配置的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录集成Security安全框架引入依赖编写配置类WebSecurityConfig(自定义资源权限规则

MySQL Workbench 安装教程(保姆级)

《MySQLWorkbench安装教程(保姆级)》MySQLWorkbench是一款强大的数据库设计和管理工具,本文主要介绍了MySQLWorkbench安装教程,文中通过图文介绍的非常详细,对大... 目录前言:详细步骤:一、检查安装的数据库版本二、在官网下载对应的mysql Workbench版本,要是

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

通过Docker Compose部署MySQL的详细教程

《通过DockerCompose部署MySQL的详细教程》DockerCompose作为Docker官方的容器编排工具,为MySQL数据库部署带来了显著优势,下面小编就来为大家详细介绍一... 目录一、docker Compose 部署 mysql 的优势二、环境准备与基础配置2.1 项目目录结构2.2 基