[UFLDL-1] 监督学习和优化

2023-12-02 18:08
文章标签 学习 优化 监督 ufldl

本文主要是介绍[UFLDL-1] 监督学习和优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 线性回归
    • 问题简介 
    • 函数最小化
  • 逻辑回归

线性回归

问题简介 

http://ufldl.stanford.edu/tutorial/supervised/LinearRegression/

作为一个回顾,我们将学习怎样实现线性回归。主要的目的是学习目标函数,计算它们的梯度并且在参数集上优化。这些基本的工具之后将成为更加复杂算法的基础。读者希望了解更多细节可以参考讲义上面的监督学习。

在线性回归中我们的目标是从输入向量 xRn 中预测目标值 y 。举个例子,我们可能对房子价格做预测,y 就代表房子的价格。 x 中的元素xj代表房子的特征(比如他的大小和卧室的数码)。假定我们有很多房子的样例,第i个房子的特征表示为 x(i) ,它的价格是 y(i) 。为了简便,我们的目标是为了找到一个函数 y=h(x) ,所以对于每一个训练样例我们有 y(i)h(x(i)) .如果我们成果找到了 h(x) 这样的函数,同时我们看到了足够多的房子和它们的价格。我们希望这样的函数 h(x) 对于一个新给定的不知道价格的房子的特征,也能对房子的价格有好的预测。

为了找到使得 y(i)h(x(i)) 的函数 h(x) 我们必须决定如何表达函数 h(x) .要开始了,我们使用线性函数 hθ(x)=jθjxj=θx .这里 hθ(x) 表示由 θ 参数化的一个很大的簇函数 (我们把这个函数空间称为“假设类”).通过这样的 h 的表示,我们的任务是找到一个θ使得 hθ(xi) 尽可能的靠近 y(i) .特别的,我们搜索 θ 来最小化 J(θ) :

J(θ)=12i(hθ(x(i))y(i))2=12i(θx(i)y(i))2

这个函数是损失函数,我们的问题是度量一个选定的 θ 在预测 y(i) 时导致了多少的误差。这也称为损失,惩罚或者目标函数。

函数最小化

我们现在希望找到一个 θ 使得给定的 J(θ) 最小化。有许多的优化算法来最小化这个函数。我们介绍一些非常有效而且容易自己实现的梯度下降算法。现在,让我理所当然的接受这个事实大多数使用的最小化函数算法都需要我们提供2部分的信息:我们需要用代码计算 J(θ) θJ(θ) .在这之后我们剩下的优化处理就是找到最好的 θ 来处理我们的优化算法(把梯度看作不同的目标函数,在梯度方向上增长最快,所以很容易明白优化算法怎样使用较小的 θ 来减少(或者增加) J(θ) )。

上的 J(θ) 在给定训练集后很容易在matlab上实现。需要计算的梯度是:

θJ(θ)=J(θ)θ1J(θ)θ2J(θ)θn

微分函数表示如下:

J(θ)θj=ix(i)j(hθ(x(i))y(i))

逻辑回归

http://ufldl.stanford.edu/tutorial/supervised/LogisticRegression/

前面我们学习了如何通过输入值的线性函数(比如,房子的大小)来预测连续的数值(比如,房子价格)。有些时候我们希望预测离散的变量例如预测一个灰度值表示的是数字0或者1.这是一个分类问题。逻辑回归是学习做这样决策的简单分类算法。

在线性回归中我们试图使用线性函数 y=hθ(x)=θT(x) 预测第i个样例 x(x) 输出值 y(i) 。这很明显对于一个二分类预测不是一个好的解决方案。在逻辑回归中,我们使用不同的假设类,我们试图预测一个样例属于属于1的概率与属于0的概率。特别的,我们试图学习下面的函数:

P(y=1|x)P(y=0|x)=hθ(x)=11+exp(θx)σ(θx),=1P(y=1|x)=1hθ(x).

函数 σ(z)11+exp(z) 经常被称为sigmoid或者logistic函数。它是一个S型的函数,压缩 θTx 的值到[0,1],所以我们把 hθ(x) 看作一个概率。我们的目标是搜索一个 θ 值使得x属于类别1的概率 P(y=1|x)=hθ(x) 大于x属于类别0的概率。对于二分类的训练集我们有下面的损失函数:

J(θ)=i(y(i)log(hθ(x(i)))+(1y(i))log(1hθ(x(i))))

需要注意的是上面求和的部分只有1个不为0(这取决于标签是否为0)。 当 yi=1 最小化损失函数等价于最大化 hθ(xi) ,当 yi=0 时我们使得 1hθ 最大 。全面的逻辑回归解释以及损失函数的推导,在CS229监督学习笔记里面。

我们现在有了一个损失函数来度量一个假设到底拟合训练数据到怎样程度。我们可以找到使得 J(θ) 最小的最好的一个 θ 来分类训练数据。一但找到了这样的函数,我们能够对一个新的数据进行分类(0、1):如果 P(y=1|x)>P(y=0|x) 分为类别1,否则类别0.这也等同于检查是否 hθ(x)>0.5

为了最小化 J(θ) 我们使用和线性回归相同的工具。我们需要计算 J(θ) θJ(θ)

J(θ)θj=ix(i)j(hθ(x(i))y(i)).

向量表示形式:

θJ(θ)=ix(i)(hθ(x(i))y(i))

这篇关于[UFLDL-1] 监督学习和优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/446297

相关文章

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

Deepseek使用指南与提问优化策略方式

《Deepseek使用指南与提问优化策略方式》本文介绍了DeepSeek语义搜索引擎的核心功能、集成方法及优化提问策略,通过自然语言处理和机器学习提供精准搜索结果,适用于智能客服、知识库检索等领域... 目录序言1. DeepSeek 概述2. DeepSeek 的集成与使用2.1 DeepSeek API

Tomcat高效部署与性能优化方式

《Tomcat高效部署与性能优化方式》本文介绍了如何高效部署Tomcat并进行性能优化,以确保Web应用的稳定运行和高效响应,高效部署包括环境准备、安装Tomcat、配置Tomcat、部署应用和启动T... 目录Tomcat高效部署与性能优化一、引言二、Tomcat高效部署三、Tomcat性能优化总结Tom

解读Redis秒杀优化方案(阻塞队列+基于Stream流的消息队列)

《解读Redis秒杀优化方案(阻塞队列+基于Stream流的消息队列)》该文章介绍了使用Redis的阻塞队列和Stream流的消息队列来优化秒杀系统的方案,通过将秒杀流程拆分为两条流水线,使用Redi... 目录Redis秒杀优化方案(阻塞队列+Stream流的消息队列)什么是消息队列?消费者组的工作方式每

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

MySQL不使用子查询的原因及优化案例

《MySQL不使用子查询的原因及优化案例》对于mysql,不推荐使用子查询,效率太差,执行子查询时,MYSQL需要创建临时表,查询完毕后再删除这些临时表,所以,子查询的速度会受到一定的影响,本文给大家... 目录不推荐使用子查询和JOIN的原因解决方案优化案例案例1:查询所有有库存的商品信息案例2:使用EX

MySQL中my.ini文件的基础配置和优化配置方式

《MySQL中my.ini文件的基础配置和优化配置方式》文章讨论了数据库异步同步的优化思路,包括三个主要方面:幂等性、时序和延迟,作者还分享了MySQL配置文件的优化经验,并鼓励读者提供支持... 目录mysql my.ini文件的配置和优化配置优化思路MySQL配置文件优化总结MySQL my.ini文件

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6