本文主要是介绍[deeplearning-003] 一般形式的反向传导算法BP最简推导-1,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1.神经网络结构
设神经网络的层数是 p ,
神经网络有三种层:一个输入层,若干个隐层,一个输出层,分别简称 L1 , L2 ,…, Lp 。
设每层神经元数量分别是 d1 , d2 ,…, dp 。每个神经元的应激函数是 f(x) 。
2.分析第一层和第二层并推导全局变量
设一个样本是 x∈Rd1×1 ,它从 L1 层输入。
设 L1 和 L2 之间的连接权重矩阵是 W1 ,那么:
W1 的第一行就是:
其中, W11,i ,就是 L1 层的第 i 个神经元和第
那么, L2 的第一个神经元的激活值,就是:
令 z21=W1[1:]x+b11 ,上式又可以写为:
更进一步地, L2 的每个神经元激活值可以写为:
更进一步地, Lj+1 层的每个神经元激活值可以写为:
为简便起见,令
则:
对于输出层 L1 , j=1 , a1i 可以视为样本 x 的第 i 分量。
3.反向传播
3.1 代价函数
设训练集是
研究一个样本 (xk,yk) ,对它而言,代价函数是:
其中, ykq 表示,第 yk 的第 q 个分量。
为简便起见,也可以写成
考虑整个训练集,代价函数是:
考虑到对 W1 和 W2 进行正则化,以避免过拟合,代价函数是:
这篇关于[deeplearning-003] 一般形式的反向传导算法BP最简推导-1的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!