《数学基础》-4.凸优化-4.1.无约束优化

2023-10-20 19:32

本文主要是介绍《数学基础》-4.凸优化-4.1.无约束优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

4.1.无约束优化

4.1.1.无约束优化问题

无约束优化问题是机器学习中最普遍、最简单的优化问题。

求最大值也可以 在前面加上负号,变成上面求最小的形式。

求一个函数f(x)的最小值可以对函数f(x)求导并使其等于0(或者说使得梯度▽f(x)等于0),但是很多复杂的函数求导后没法求出解,所以这种方法实际上很少用。

常用梯度下降法、牛顿法或者拟牛顿法求解。

4.1.2.梯度下降法

基于迭代的方法,从某个点开始找很多点,使得这些点满足:,且有,这里表示单位梯度,经常写作,λ表示步长,所以通项是:

实际上λ也不会取很大,一般是

其过程为:

  

梯度下降法的种类:

①批量梯度下降法(BGD)

更新系数时,所有样本都参与计算

优点:需要个很少的迭代次数就可以收敛

缺点:当样本量很大时,更新一次的时间很长

②随机梯度下降法(SGD)

更新系数时,从n个样本中随机选择一个样本参与计算,

优点:更新一次的时间很短,所以大样本时有优势

缺点:会受到每一个样本的影响会很大,不稳定,需要更多的迭代次数才能收敛

③小批量梯度下降法(MBGD)

结合了批量梯度下降法和随机梯度下降法,选择一小部分样本参与计算

例如:

所有的样本都算完,就是一个epoch

4.1.3.牛顿法

求一个函数的最小值可以对函数求导并使其等于0(或者说使得梯度等于0):,把函数的导数看做一个函数,令

牛顿法求的过程也是迭代过程

假设的函数曲线是这个样子,要找到那个的点,先做某个的切线,然后找到切线与x轴相交的点然后再做的切线,以此类推,不断逼近的点。

先来求第一条切线的方程:

令y=0(就是上图中的点)得:

再把带入得:

这是二维的情况,如果是多维的情况:

其中H是海森矩阵,除以海森矩阵就是乘以它的逆矩阵。

为什么这里是海森矩阵?因为的n维向量,是n维向量,二次求导就是海森矩阵。

在机器学习中,要算海森矩阵的逆矩阵很麻烦,于是就引申出了很多种拟牛顿法BFGS(用另外一个矩阵来逼近海森矩阵的逆矩阵)。

 

牛顿法收敛速度

按这个迭代原理,就应该是函数的局部最优点,也就是有最小值,且有要弄明白这个收敛速度,就是要比较下的距离和的距离的区别,由上述结论得:

由于,所以分子加上得:

根据中值定理f(b)−f(a)=(b−a)f′(ξ),a<ξ<b,得:

再利用拉格朗日中值定理得:

ξ是在之间的,所以

由于M的分子分母都是导数,导数都是有界的,所以M是有界的,用表示其上界。

即:

的距离小于1:,则,这里是按照平方的速度进行收敛的,收敛速度更快,注意这里有条件:x的距离小于1,如果距离大于1,上界会越来越大,没法收敛。

 

综上,牛顿法要拟合,不能离最小值太远的地方拟合,越接近极小值再拟合收敛的效果越好。因此可以先用梯度下降,到了局部极小值附近后再用牛顿法。

这篇关于《数学基础》-4.凸优化-4.1.无约束优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/249267

相关文章

MySQL索引的优化之LIKE模糊查询功能实现

《MySQL索引的优化之LIKE模糊查询功能实现》:本文主要介绍MySQL索引的优化之LIKE模糊查询功能实现,本文通过示例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录一、前缀匹配优化二、后缀匹配优化三、中间匹配优化四、覆盖索引优化五、减少查询范围六、避免通配符开头七、使用外部搜索引擎八、分

Android Mainline基础简介

《AndroidMainline基础简介》AndroidMainline是通过模块化更新Android核心组件的框架,可能提高安全性,本文给大家介绍AndroidMainline基础简介,感兴趣的朋... 目录关键要点什么是 android Mainline?Android Mainline 的工作原理关键

mysql的基础语句和外键查询及其语句详解(推荐)

《mysql的基础语句和外键查询及其语句详解(推荐)》:本文主要介绍mysql的基础语句和外键查询及其语句详解(推荐),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋... 目录一、mysql 基础语句1. 数据库操作 创建数据库2. 表操作 创建表3. CRUD 操作二、外键

Python基础语法中defaultdict的使用小结

《Python基础语法中defaultdict的使用小结》Python的defaultdict是collections模块中提供的一种特殊的字典类型,它与普通的字典(dict)有着相似的功能,本文主要... 目录示例1示例2python的defaultdict是collections模块中提供的一种特殊的字

Python通过模块化开发优化代码的技巧分享

《Python通过模块化开发优化代码的技巧分享》模块化开发就是把代码拆成一个个“零件”,该封装封装,该拆分拆分,下面小编就来和大家简单聊聊python如何用模块化开发进行代码优化吧... 目录什么是模块化开发如何拆分代码改进版:拆分成模块让模块更强大:使用 __init__.py你一定会遇到的问题模www.

SpringBoot首笔交易慢问题排查与优化方案

《SpringBoot首笔交易慢问题排查与优化方案》在我们的微服务项目中,遇到这样的问题:应用启动后,第一笔交易响应耗时高达4、5秒,而后续请求均能在毫秒级完成,这不仅触发监控告警,也极大影响了用户体... 目录问题背景排查步骤1. 日志分析2. 性能工具定位优化方案:提前预热各种资源1. Flowable

Python基础文件操作方法超详细讲解(详解版)

《Python基础文件操作方法超详细讲解(详解版)》文件就是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位,文件的核心操作就是读和写,:本文主要介绍Python基础文件操作方法超详细讲解的相... 目录一、文件操作1. 文件打开与关闭1.1 打开文件1.2 关闭文件2. 访问模式及说明二、文件读写1.

SpringBoot3实现Gzip压缩优化的技术指南

《SpringBoot3实现Gzip压缩优化的技术指南》随着Web应用的用户量和数据量增加,网络带宽和页面加载速度逐渐成为瓶颈,为了减少数据传输量,提高用户体验,我们可以使用Gzip压缩HTTP响应,... 目录1、简述2、配置2.1 添加依赖2.2 配置 Gzip 压缩3、服务端应用4、前端应用4.1 N

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战:从入门到进阶优化1. MyBatis

MyBatis 动态 SQL 优化之标签的实战与技巧(常见用法)

《MyBatis动态SQL优化之标签的实战与技巧(常见用法)》本文通过详细的示例和实际应用场景,介绍了如何有效利用这些标签来优化MyBatis配置,提升开发效率,确保SQL的高效执行和安全性,感... 目录动态SQL详解一、动态SQL的核心概念1.1 什么是动态SQL?1.2 动态SQL的优点1.3 动态S