【最优化方法】无约束非线性函数

2023-11-02 11:58

本文主要是介绍【最优化方法】无约束非线性函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

向量投影证明

b 1 = d ∗ a 1 ∣ a 1 ∣ d = ∣ a 2 ∣ ∗ c o s θ c o s = ( a 2 , a 1 ) ∣ a 2 ∣ ∣ a 1 ∣ b_1 = d * \frac{a_1}{|a_1|} \\ d = |a_2| * cos\theta \\ cos = \frac{(a_2,a_1)}{|a_2||a_1|} b1=da1a1d=a2cosθcos=a2a1(a2,a1)
由上面3个式子最终得到
b 1 = ( a 2 , a 1 ) ( a 1 , a 1 ) a 1 b1 = \frac{(a_2,a_1)}{(a_1,a_1) } a_1 b1=(a1,a1)(a2,a1)a1

施密特正交化


我们想要构造正交的基坐标系,我们希望各个坐标最好是能够互相正交的,我们让
b 1 = a 1 b_1 = a_1 b1=a1
另一个坐标应该是 b 2 b_2 b2,这个坐标可以根据向量的运算得到
b 2 = a 2 − b 1 b 1 = a 2 , b 1 ( b 1 , b 1 ) b 1 b_2 = a_2 - b_1 \\ b_1 = \frac{a_2,b_1}{(b_1,b_1)} b1 b2=a2b1b1=(b1,b1)a2,b1b1
拓展到高维度也是同样道理,具体可以参考施密特正交化高维度的方法。

最速下降法

二次型

二次型是一个从向量到标量的函数:
f ( x ) = 1 2 x T A x − b x + c f(x) = \frac{1}{2} x^{T} A x - bx + c f(x)=21xTAxbx+c
它的导数是:
A x − b = 0 A x = b Ax-b = 0 \\ Ax = b Axb=0Ax=b
我们可以将计算 A x = b Ax= b Ax=b转为计算二次型的最值问题。
在这里插入图片描述
上图为不同的 A 对 f(x) 的图像的影响。(a)正定矩阵的二次型;(b)负定矩阵的二次型;©奇异矩 阵和非正定矩阵的二次型;(d)不定矩阵的二次型:此时解是一个鞍点,梯度法和 CG 均无法处理该问题。

下降方向

最速下降法也就是梯度法,其中梯度是函数值变化最大的方向。最终通过求导的方式来确定步长。
d = − ∇ f ( x ) x i + 1 = x i + α d d = - \nabla f(\bold x) \\ x_{i+1} = x_i + \alpha d \\ d=f(x)xi+1=xi+αd

证明垂直和最佳步长

现在我们已经确定了下降方向,接下来我们要确定下降的步长 α \alpha α, 步长我们我们使用精准的公式法进行计算。我们令函数为关于
ψ ( α ) = f ( x i + 1 ) ∇ ψ ( α ) = ∂ f ( x i + 1 ) ∂ α = ∂ f ( x i + 1 ) ∂ x i + 1 ∂ x i + 1 ∂ α = ( A x i + 1 − b ) d i = d i + 1 d i = 0 \psi(\alpha) = f(x_{i+1}) \\ \\ \nabla \psi(\alpha)=\frac{\partial f(x_{i+1})}{\partial \alpha} = \frac{\partial f(x_{i+1})}{\partial x_{i+1}} \frac{\partial x_{i+1}}{\partial \alpha} = (A\bold x_{i+1} -b) \bold d_i = d_{i+1} d_i = 0 ψ(α)=f(xi+1)ψ(α)=αf(xi+1)=xi+1f(xi+1)αxi+1=(Axi+1b)di=di+1di=0
所以证明了两次的搜索方向是互相垂直的。下面将计算出 α \alpha α的具体数值:
d i + 1 d i = ( A x i + 1 − b ) T d = ( A ( x i + α d ) − b ) T d i = ( A x i + α A d i − b ) T d i = ( A x i − b + α A d i ) T d i = ( − d i + α A d i ) T d i = − d i T d i + α d i T A d i = 0 \bold d_{i+1} \bold d_i \\ = (A\bold x_{i+1} - b)^T \bold d \\ = (A(x_i + \alpha d) - b)^T d_i \\ = (Ax_i + \alpha A d_i -b)^T d_i \\ = (Ax_i -b + \alpha A d_i)^Td_i \\ = ( -d_i + \alpha A d_i)^T d_i \\= -d_i ^T d_i + \alpha d^T_i A d_{i} =0 di+1di=(Axi+1b)Td=(A(xi+αd)b)Tdi=(Axi+αAdib)Tdi=(Axib+αAdi)Tdi=(di+αAdi)Tdi=diTdi+αdiTAdi=0
化简得到

α = d i T d i d i T A d i \alpha = \frac{d_i^Td_i}{d_i^TAd_i} α=diTAdidiTdi

共轭梯度下降

###

这篇关于【最优化方法】无约束非线性函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/330431

相关文章

Window Server2016加入AD域的方法步骤

《WindowServer2016加入AD域的方法步骤》:本文主要介绍WindowServer2016加入AD域的方法步骤,包括配置DNS、检测ping通、更改计算机域、输入账号密码、重启服务... 目录一、 准备条件二、配置ServerB加入ServerA的AD域(test.ly)三、查看加入AD域后的变

Window Server2016 AD域的创建的方法步骤

《WindowServer2016AD域的创建的方法步骤》本文主要介绍了WindowServer2016AD域的创建的方法步骤,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、准备条件二、在ServerA服务器中常见AD域管理器:三、创建AD域,域地址为“test.ly”

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

Python中使用defaultdict和Counter的方法

《Python中使用defaultdict和Counter的方法》本文深入探讨了Python中的两个强大工具——defaultdict和Counter,并详细介绍了它们的工作原理、应用场景以及在实际编... 目录引言defaultdict的深入应用什么是defaultdictdefaultdict的工作原理

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Java后端接口中提取请求头中的Cookie和Token的方法

《Java后端接口中提取请求头中的Cookie和Token的方法》在现代Web开发中,HTTP请求头(Header)是客户端与服务器之间传递信息的重要方式之一,本文将详细介绍如何在Java后端(以Sp... 目录引言1. 背景1.1 什么是 HTTP 请求头?1.2 为什么需要提取请求头?2. 使用 Spr

Java如何通过反射机制获取数据类对象的属性及方法

《Java如何通过反射机制获取数据类对象的属性及方法》文章介绍了如何使用Java反射机制获取类对象的所有属性及其对应的get、set方法,以及如何通过反射机制实现类对象的实例化,感兴趣的朋友跟随小编一... 目录一、通过反射机制获取类对象的所有属性以及相应的get、set方法1.遍历类对象的所有属性2.获取

Java中的Opencv简介与开发环境部署方法

《Java中的Opencv简介与开发环境部署方法》OpenCV是一个开源的计算机视觉和图像处理库,提供了丰富的图像处理算法和工具,它支持多种图像处理和计算机视觉算法,可以用于物体识别与跟踪、图像分割与... 目录1.Opencv简介Opencv的应用2.Java使用OpenCV进行图像操作opencv安装j