《数学基础》-4.凸优化-4.1.无约束优化

2023-10-20 19:32

文章标签 基础优化数学无约束 4.1

本文主要是介绍《数学基础》-4.凸优化-4.1.无约束优化，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

4.1.无约束优化

4.1.1.无约束优化问题

无约束优化问题是机器学习中最普遍、最简单的优化问题。

求最大值也可以在前面加上负号，变成上面求最小的形式。

求一个函数f(x)的最小值可以对函数f(x)求导并使其等于0(或者说使得梯度▽f(x)等于0)，但是很多复杂的函数求导后没法求出解，所以这种方法实际上很少用。

常用梯度下降法、牛顿法或者拟牛顿法求解。

4.1.2.梯度下降法

基于迭代的方法，从某个点开始找很多点，使得这些点满足：，且有，这里表示单位梯度，经常写作，λ表示步长，所以通项是：

实际上λ也不会取很大，一般是

其过程为：

梯度下降法的种类：

①批量梯度下降法（BGD）

更新系数时，所有样本都参与计算

优点：需要个很少的迭代次数就可以收敛

缺点：当样本量很大时，更新一次的时间很长

②随机梯度下降法（SGD）

更新系数时，从n个样本中随机选择一个样本参与计算，

优点：更新一次的时间很短，所以大样本时有优势

缺点：会受到每一个样本的影响会很大，不稳定，需要更多的迭代次数才能收敛

③小批量梯度下降法（MBGD）

结合了批量梯度下降法和随机梯度下降法，选择一小部分样本参与计算

例如：

所有的样本都算完，就是一个epoch

4.1.3.牛顿法

求一个函数的最小值可以对函数求导并使其等于0(或者说使得梯度等于0)：，把函数的导数看做一个函数，令

牛顿法求的过程也是迭代过程

假设的函数曲线是这个样子，要找到那个的点，先做某个的切线，然后找到切线与x轴相交的点然后再做的切线，以此类推，不断逼近的点。

先来求第一条切线的方程：

令y=0（就是上图中的点）得：

再把带入得：

这是二维的情况，如果是多维的情况：

其中H是海森矩阵，除以海森矩阵就是乘以它的逆矩阵。

为什么这里是海森矩阵？因为是的n维向量，是n维向量，二次求导就是海森矩阵。

在机器学习中，要算海森矩阵的逆矩阵很麻烦，于是就引申出了很多种拟牛顿法BFGS（用另外一个矩阵来逼近海森矩阵的逆矩阵）。

牛顿法收敛速度：

按这个迭代原理，就应该是函数的局部最优点，也就是有最小值，且有要弄明白这个收敛速度，就是要比较下到的距离和到的距离的区别，由上述结论得：

由于，所以分子加上得：

根据中值定理f(b)−f(a)=(b−a)f′(ξ),a<ξ<b，得：

再利用拉格朗日中值定理得：

ξ是在之间的，所以

由于M的分子分母都是导数，导数都是有界的，所以M是有界的，用表示其上界。

即：

当和的距离小于1：，则，这里是按照平方的速度进行收敛的，收敛速度更快，注意这里有条件：x和的距离小于1，如果距离大于1，上界会越来越大，没法收敛。

综上，牛顿法要拟合，不能离最小值太远的地方拟合，越接近极小值再拟合收敛的效果越好。因此可以先用梯度下降，到了局部极小值附近后再用牛顿法。

这篇关于《数学基础》-4.凸优化-4.1.无约束优化的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/249267。 23002807@qq.com

相关文章

MyBatisPlus如何优化千万级数据的CRUD

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

阅读更多...

从基础到进阶详解Pandas时间数据处理指南

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

阅读更多...

安装centos8设置基础软件仓库时出错的解决方案

安装centos8设置基础软件仓库时出错的解决方案

《安装centos8设置基础软件仓库时出错的解决方案》：本文主要介绍安装centos8设置基础软件仓库时出错的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录安装Centos8设置基础软件仓库时出错版本 8版本 8.2.200android4版本 javas

阅读更多...

Linux基础命令@grep、wc、管道符的使用详解

Linux基础命令@grep、wc、管道符的使用详解

《Linux基础命令@grep、wc、管道符的使用详解》：本文主要介绍Linux基础命令@grep、wc、管道符的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录grep概念语法作用演示一演示二演示三，带选项 -nwc概念语法作用wc，不带选项-c，统计字节数-

阅读更多...

python操作redis基础

python操作redis基础

《python操作redis基础》Redis(RemoteDictionaryServer)是一个开源的、基于内存的键值对（Key-Value）存储系统,它通常用作数据库、缓存和消息代理,这篇文章... 目录1. Redis 简介2. 前提条件3. 安装 python Redis 客户端库4. 连接到 Re

阅读更多...

SpringBoot基础框架详解

SpringBoot基础框架详解

《SpringBoot基础框架详解》SpringBoot开发目的是为了简化Spring应用的创建、运行、调试和部署等,使用SpringBoot可以不用或者只需要很少的Spring配置就可以让企业项目快... 目录SpringBoot基础 – 框架介绍1.SpringBoot介绍1.1 概述1.2 核心功能2

阅读更多...

SpringBoot中HTTP连接池的配置与优化

SpringBoot中HTTP连接池的配置与优化

《SpringBoot中HTTP连接池的配置与优化》这篇文章主要为大家详细介绍了SpringBoot中HTTP连接池的配置与优化的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录一、HTTP连接池的核心价值二、Spring Boot集成方案方案1：Apache HttpCl

阅读更多...

PyTorch高级特性与性能优化方式

PyTorch高级特性与性能优化方式

《PyTorch高级特性与性能优化方式》：本文主要介绍PyTorch高级特性与性能优化方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、自动化机制1.自动微分机制2.动态计算图二、性能优化1.内存管理2.GPU加速3.多GPU训练三、分布式训练1.分布式数据

阅读更多...

Spring Boot集成SLF4j从基础到高级实践(最新推荐)

Spring Boot集成SLF4j从基础到高级实践(最新推荐)

《SpringBoot集成SLF4j从基础到高级实践(最新推荐)》SLF4j(SimpleLoggingFacadeforJava)是一个日志门面（Facade）,不是具体的日志实现,这篇文章主要介... 目录一、日志框架概述与SLF4j简介1.1 为什么需要日志框架1.2 主流日志框架对比1.3 SLF4

阅读更多...

Spring Boot集成Logback终极指南之从基础到高级配置实战指南

Spring Boot集成Logback终极指南之从基础到高级配置实战指南

《SpringBoot集成Logback终极指南之从基础到高级配置实战指南》Logback是一个可靠、通用且快速的Java日志框架,作为Log4j的继承者,由Log4j创始人设计,：本文主要介绍... 目录一、Logback简介与Spring Boot集成基础1.1 Logback是什么？1.2 Sprin

阅读更多...