深度学习课程总结（stage1）

2023-10-18 14:10

文章标签 学习总结深度课程 stage1

本文主要是介绍深度学习课程总结（stage1），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、线性分类与感知机

线性回归

（1）定义:利用数理统计中回归分析，来确定两种或两种以上变量间相

互依赖的定量关系的一种统计分析方法。

（2）要素：训练集（即输入数据），比如预测房价和面积的关系时，面积就是训练集

输出数据，模型（映射关系），条目数

（3）多维问题：

假设原问题和n个因素有关，则可以构造代价函数：

$\text{[math]}$

其中前者是真实值，后者是预测值，我们的目标是使损失函数最小

线性二分类问题

（1）定义：线性分类器则透过特征的线性组合来做出分类决定，以达到

此种目的。简言之，样本通过直线(或超平面)可分

（2）输入是特征向量，输出有多种可能，如果是二分类问题，则是0和1，如果输出是某类的概率，则是0到1之间的数字

（3）为了最终获得0到1之间的概率，我们构造了sigmoid函数：

$\text{[math]}$

其中，z是特征x的线性组合

因此，可以构造如下的损失函数：

$\text{[math]}$

其中， $\text{[math]}$ 是gt，只能取0或者1，而 $\text{[math]}$ 是通过sigmoid函数获得的，这种回归叫做softmax

（4）求解对应J最小时 $\text{[math]}$ 的大小的方法

可以认为J是通过 $\text{[math]}$ 的一个差分的方式构成的，因此我们可以采用以下方法：

$\text{[math]}$

而由sigmoid函数的性质，可知：

$\text{[math]}$

对数回归和多分类回归

二分类问题的交叉熵

由于二分类问题的输出只有0和1，因此可以将损失函数写作：

$\text{[math]}$

对其最小化，可得： $\text{[math]}$

感知机模型

（1）由输入到输出的模型如下：

$\text{[math]}$

$\text{[math]}$

为损失函数，我们的目标是使损失函数最小

二、多层前馈网络与误差反传算法

多层感知机：

（1）用处：解决线性不可分问题

（2）结构：在输入和输出之间加入隐藏层

（3）定理：① 若隐层节点（单元）可任意设置，用三层阈值节点的

网络，可以实现任意的二值逻辑函数。

② 若隐层节点（单元）可任意设置，用三层S型非线性特

性节点的网络，可以一致逼近紧集上的连续函数或按范数逼近紧

集上的平方可积函数。

多层前馈网络以及BP算法：

（1）组成：

① 网络结构：一般称为BP神经网络

② 正向传播：输入信号从输入层经隐层，传向输出层，若输出层得到了期望的输出，则学习算法结束；否则，转至反向传播

③ 反向传播：是将误差(样本输出与网络输出之差）按原联接通路反向计算，由梯度下降法调整各层节点的权值和阈值，使误差减小。

（2）算法流程（来源于本人的另一篇博客，链接：https://blog.csdn.net/aliezaliezaliez/article/details/126540495?spm=1001.2014.3001.5502）

以一维度的w和b为例，

我们希望从起始点沿着梯度最大的路径以一定的步长向下降，直到达到最优解，或者接近最优解

在代码中，经常把

写作

成为学习率，决定了每次下降的步长

对于J（w，b）同理

编辑

即分别沿着两个变量的最大梯度下降

数学基础 ————导数

① 计算图

例：

编辑

该过程的逆过程，就是导数的求取过程

编辑

说完数学基础后，可以进一步研究logistics 中的梯度下降

下面这个图万分的重要！！！！！！！！！！！

则：

当输入有m个样本时：

编辑

代码实现思路如下：

这里面

编辑不加带i的角标，因为他们是求和的形式

编辑（这个前面用链式法则推过）

（这个右侧本质上加的就是某个输入的

,对J求导即可，那也就是用链式法则推导，其实就是对z先求导，然后z对w求导所以出来了

...

这里

这些，代表的是特征的个数，例如图片识别时，每一个图片分为r，g，b三原色，每一种原色都有64×64的像素，因此在这里，

编辑的个数为3×64×64个

如果这里x的维度n比较大，可能也需要写一个循环

对于m，是输入的个数，以图片识别为例，就是图片的张数

（z对b求偏导数是1）

编辑（前文公式可以看出来）

编辑

编辑

（梯度下降法）

使用for循环会使代码变得低效，因此我们可以用向量化来代替for循环

5.向量化

编辑

这篇关于深度学习课程总结（stage1）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/233080。 23002807@qq.com

相关文章

Python中logging模块用法示例总结

Python中logging模块用法示例总结

《Python中logging模块用法示例总结》在Python中logging模块是一个强大的日志记录工具,它允许用户将程序运行期间产生的日志信息输出到控制台或者写入到文件中,：本文主要介绍Pyt... 目录前言一. 基本使用1. 五种日志等级2. 设置报告等级3. 自定义格式4. C语言风格的格式化方法

阅读更多...

深度解析Python中递归下降解析器的原理与实现

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言：解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

阅读更多...

深度解析Java @Serial 注解及常见错误案例

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

阅读更多...

Spring 依赖注入与循环依赖总结

Spring 依赖注入与循环依赖总结

《Spring依赖注入与循环依赖总结》这篇文章给大家介绍Spring依赖注入与循环依赖总结篇,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1. Spring 三级缓存解决循环依赖1. 创建UserService原始对象2. 将原始对象包装成工

阅读更多...

Java MCP 的鉴权深度解析

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧（负责传递，比较简单）（1）常见的 mcpServers json 配置

阅读更多...

Maven中生命周期深度解析与实战指南

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解（高频使用）三、clean生命周期核心阶

阅读更多...

深度剖析SpringBoot日志性能提升的原因与解决

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章：日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

阅读更多...

MySQL中查询和展示LONGBLOB类型数据的技巧总结

MySQL中查询和展示LONGBLOB类型数据的技巧总结

《MySQL中查询和展示LONGBLOB类型数据的技巧总结》在MySQL中LONGBLOB是一种二进制大对象（BLOB）数据类型,用于存储大量的二进制数据,：本文主要介绍MySQL中查询和展示LO... 目录前言1. 查询 LONGBLOB 数据的大小2. 查询并展示 LONGBLOB 数据2.1 转换为十

阅读更多...

Unity新手入门学习殿堂级知识详细讲解（图文）

Unity新手入门学习殿堂级知识详细讲解（图文）

《Unity新手入门学习殿堂级知识详细讲解（图文）》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

阅读更多...

深度解析Python yfinance的核心功能和高级用法

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?

阅读更多...