【自学记录】【Pytorch2.0深度学习从零开始学 王晓华】第四章 深度学习的理论基础

本文主要是介绍【自学记录】【Pytorch2.0深度学习从零开始学 王晓华】第四章 深度学习的理论基础,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

4.3.5 反馈神经网络原理的Python实现

遇到的疑问:

1、对神经网络前向计算中,关于系数矩阵W的讨论。

上一章讲到了层结构是【out,in】,所以我觉得在计算Y=WX+b的时候,W矩阵也应该是【out,in】的形状。但是该代码(或者正规代码实现流程)不是的,他是一个这样的结构:
请添加图片描述
请添加图片描述
所以,W矩阵还是【in,out】结构,a1=X1W11+X2W12+b1,为了计算a1,会以列优先循环W矩阵:

 for j in range(self.hidden_n):total = 0.0for i in range(self.input_n):total += self.input_cells[i] * self.input_weights[i][j] #列优先循环W矩阵          

以上self.input_weights[i][j]代码:
j=1,依次输出(1,1),(2,1),对应W11,W12
j=2,依次输出(1,2),(2,2),对应W21,W22
j=3,依次输出(1,3),(2,3),对应W31,W32

以下是神经网络前向传播函数:

 def predict(self,inputs):for i in range(self.input_n - 1):self.input_cells[i] = inputs[i]for j in range(self.hidden_n):total = 0.0for i in range(self.input_n):total += self.input_cells[i] * self.input_weights[i][j]self.hidden_cells[j] = sigmoid(total)for k in range(self.output_n):total = 0.0for j in range(self.hidden_n):total += self.hidden_cells[j] * self.output_weights[j][k]self.output_cells[k] = sigmoid(total)return self.output_cells[:]#浅拷贝

2、有关self.output_cells[:]浅拷贝

神经网络前向传播函数最后使用 return self.output_cells[:] 而不是 return self.output_cells 的主要目的是返回 self.output_cells 的一个浅拷贝(shallow copy),而不是原始对象的引用。这意味着调用者将获得输出值的一个新列表,而不是对原始列表的引用。这可以确保原始 self.output_cells 列表的内部状态在函数返回后不会被意外修改,从而保持对象的封装性和数据的安全性。

源码\第四章\4_3.py

import numpy as np
import math
import random
def rand(a, b):return (b - a) * random.random() + a
def make_matrix(m,n,fill=0.0):mat = []for i in range(m):mat.append([fill] * n)return mat
def sigmoid(x):return 1.0 / (1.0 + math.exp(-x))
def sigmod_derivate(x):return x * (1 - x)
class BPNeuralNetwork:def __init__(self):self.input_n = 0self.hidden_n = 0self.output_n = 0self.input_cells = []self.hidden_cells = []self.output_cells = []self.input_weights = []self.output_weights = []def setup(self,ni,nh,no):self.input_n = ni + 1 #+1是加了一个隐藏层self.hidden_n = nhself.output_n = noself.input_cells = [1.0] * self.input_nself.hidden_cells = [1.0] * self.hidden_nself.output_cells = [1.0] * self.output_nself.input_weights = make_matrix(self.input_n,self.hidden_n)####这里,权重矩阵设定的是【in,out】self.output_weights = make_matrix(self.hidden_n,self.output_n)####这里,权重矩阵设定的是【in,out】# random activatefor i in range(self.input_n):for h in range(self.hidden_n):self.input_weights[i][h] = rand(-0.2, 0.2)for h in range(self.hidden_n):for o in range(self.output_n):self.output_weights[h][o] = rand(-2.0, 2.0)def predict(self,inputs):for i in range(self.input_n - 1):self.input_cells[i] = inputs[i]for j in range(self.hidden_n):total = 0.0for i in range(self.input_n):total += self.input_cells[i] * self.input_weights[i][j]self.hidden_cells[j] = sigmoid(total)for k in range(self.output_n):total = 0.0for j in range(self.hidden_n):total += self.hidden_cells[j] * self.output_weights[j][k]self.output_cells[k] = sigmoid(total)return self.output_cells[:]#浅拷贝def back_propagate(self,case,label,learn):self.predict(case)#计算输出层的误差output_deltas = [0.0] * self.output_nfor k in range(self.output_n):error = label[k] - self.output_cells[k]output_deltas[k] = sigmod_derivate(self.output_cells[k]) * error#误差项#计算隐藏层的误差hidden_deltas = [0.0] * self.hidden_nfor j in range(self.hidden_n):error = 0.0for k in range(self.output_n):error += output_deltas[k] * self.output_weights[j][k]hidden_deltas[j] = sigmod_derivate(self.hidden_cells[j]) * error#更新输出层权重for j in range(self.hidden_n):for k in range(self.output_n):self.output_weights[j][k] += learn * output_deltas[k] * self.hidden_cells[j]#更新隐藏层权重for i in range(self.input_n):for j in range(self.hidden_n):self.input_weights[i][j] += learn * hidden_deltas[j] * self.input_cells[i]error = 0for o in range(len(label)):error += 0.5 * (label[o] - self.output_cells[o]) ** 2return errordef train(self,cases,labels,limit = 100,learn = 0.05):for i in range(limit):error = 0for i in range(len(cases)):label = labels[i]case = cases[i]error += self.back_propagate(case, label, learn)passdef test(self):cases = [[0, 0],[0, 1],[1, 0],[1, 1],]labels = [[0], [1], [1], [0]]self.setup(2, 5, 1)self.train(cases, labels, 1000000, 0.05)for case in cases:print(self.predict(case))
if __name__ == '__main__':nn = BPNeuralNetwork()nn.test()

运行结果:原有的训练结果不太理想,直接把训练次数后面加了2个0,效果好多了~
请添加图片描述

这篇关于【自学记录】【Pytorch2.0深度学习从零开始学 王晓华】第四章 深度学习的理论基础的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/870153

相关文章

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

从基础到高级详解Python数值格式化输出的完全指南

《从基础到高级详解Python数值格式化输出的完全指南》在数据分析、金融计算和科学报告领域,数值格式化是提升可读性和专业性的关键技术,本文将深入解析Python中数值格式化输出的相关方法,感兴趣的小伙... 目录引言:数值格式化的核心价值一、基础格式化方法1.1 三种核心格式化方式对比1.2 基础格式化示例

redis-sentinel基础概念及部署流程

《redis-sentinel基础概念及部署流程》RedisSentinel是Redis的高可用解决方案,通过监控主从节点、自动故障转移、通知机制及配置提供,实现集群故障恢复与服务持续可用,核心组件包... 目录一. 引言二. 核心功能三. 核心组件四. 故障转移流程五. 服务部署六. sentinel部署

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

从基础到进阶详解Python条件判断的实用指南

《从基础到进阶详解Python条件判断的实用指南》本文将通过15个实战案例,带你大家掌握条件判断的核心技巧,并从基础语法到高级应用一网打尽,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录​引言:条件判断为何如此重要一、基础语法:三行代码构建决策系统二、多条件分支:elif的魔法三、

Python WebSockets 库从基础到实战使用举例

《PythonWebSockets库从基础到实战使用举例》WebSocket是一种全双工、持久化的网络通信协议,适用于需要低延迟的应用,如实时聊天、股票行情推送、在线协作、多人游戏等,本文给大家介... 目录1. 引言2. 为什么使用 WebSocket?3. 安装 WebSockets 库4. 使用 We

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程