漫步最优化十一——局部极小与极大的充分必要条件(上)

2024-05-08 15:48

本文主要是介绍漫步最优化十一——局部极小与极大的充分必要条件(上),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


便






——

梯度 g(x) 与海森矩阵 H(x) 在局部极小值点 x 上必须满足某些条件,两个条件集如下:

  1. 在局部极小值点 x 处必须满足的条件,他们是必要条件。
  2. 保证 x 是局部极小值点点条件,他们是充分条件。

充分必要条件可以用许多定理的形式进行描述,这些定理中使用比较广泛的概念就是可行方向的概念。

1 δ=αd x 上的变化量,其中 α 是正常数, d 是方向向量,如果 R 是可行域且存在常数α̂ >0使得对所有 α,x+αdR ,其中 0αα̂  ,那么称 d 为点 x 的可行方向。

效果上,如果点 x 沿方向 d 移动有限的距离后依然在 R 中,那么d就是 x 的可行方向向量。

1 优化问题的可行域为

R={x:x12,x20}

如图1所示,对于点 x1=[4 1]T,x2=[2 3]T,x3=[1 4]T ,向量 d1=[2 2]T,d2=[0 2]T,d3=[2 0] 那个是可行方向?

α̂ =1 ,在 0αα̂  范围内的所有 α

x1+αd1R

d1 是点 x1 处的可行方向;对任意 0αα̂ 

x1+αd2Rx1+αd3R

因此 d2,d3 x1 的可行方向。

因为不存在常数 α̂ >0 使得

x2+αd1Rfor 0αα̂ 

,所以 d1 不是 x2 处的可行方向。另一方面,存在正数 α̂  使得对 0αα̂  而言

x2+αd2Rx2+αd3R

,所以 d2,d3 x2 的可行方向。


这里写图片描述
图1

因为 x3 不在 R 中,所以不存在α̂ 是的对任意的 d

x3+αdRfor 0αα̂ 

,因此 d1,d2,d3 不是 x3 的可行方向。


目标函数要想有极小值,必须满足里两个条件,也就是一阶与二阶条件,一阶条件是一阶导数的形式,如梯度。

1 极小值的一阶必要条件。

  • 如果 f(x)C1,x 是局部最小值点,那么对于 x 处的所有可行方向
    g(x)Td0
  • 如果 x R 的内点,那么
    g(x)=0

(a) 如果 d x 的可行方向,那么

x=x+αdRfor 0αα̂ 

利用泰勒级数

f(x)=f(x)+αg(x)Td+o(αd)

如果

g(x)Td<0

那么当 α0

αg(x)Td+o(αd)<0

那么

f(x)<f(x)

这与假设 x 是极小值相矛盾,因此 x 为极小值的必要条件是

g(x)Td0

(b) 如果 x R 的内点,所有可行方向的向量均存在,那么由(a)可知,向量 d=d1 产生

g(x)Td10

同样的,对于方向 d=d1

g(x)Td10

因此在这种情况下, x 是极小值的必要条件是

g(x)=0


二阶必要条件涉及到一阶与二阶导,或者等价的梯度与海森矩阵。

1

  • d 是点 x 处的任意方向向量,如果对任意的 d0,dTHd>0,0,0,<0 ,那么称二次项 dTH(x)d 为正定,半正定,半负定,负定。如果 dTH(x)d 既可以为正也可以为负,那么称其为不定的。
  • 如果 dTH(x)d 是正定,半正定等,那么称矩阵 H(x) 为正定,半正定等矩阵。

这篇关于漫步最优化十一——局部极小与极大的充分必要条件(上)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/970751

相关文章

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

STM32(十一):ADC数模转换器实验

AD单通道: 1.RCC开启GPIO和ADC时钟。配置ADCCLK分频器。 2.配置GPIO,把GPIO配置成模拟输入的模式。 3.配置多路开关,把左面通道接入到右面规则组列表里。 4.配置ADC转换器, 包括AD转换器和AD数据寄存器。单次转换,连续转换;扫描、非扫描;有几个通道,触发源是什么,数据对齐是左对齐还是右对齐。 5.ADC_CMD 开启ADC。 void RCC_AD

十一、C语言:字符串函数

目录 一、strlen 二、strcpy 三、strcat  四、strcmp 五、strstr 六、strtok 七、strerror 一、strlen 注意:strlen()函数的返回值是size_t,两个size_t相减仍为无符号数 int main(){char arr[10] = "abc";char brr[10] = "abc123";if (strl

python基础语法十一-赋值、浅拷贝、深拷贝

书接上回: python基础语法一-基本数据类型 python基础语法二-多维数据类型 python基础语法三-类 python基础语法四-数据可视化 python基础语法五-函数 python基础语法六-正则匹配 python基础语法七-openpyxl操作Excel python基础语法八-异常 python基础语法九-多进程和多线程 python基础语法十-文件和目录操作

Matlab中BaseZoom()函数实现曲线和图片的局部放大

BaseZoom工具下载链接: 链接:https://pan.baidu.com/s/1yItVSinh6vU4ImlbZW6Deg?pwd=9dyl 提取码:9dyl 下载完之后将工具包放置合适的路径下,并在matlab中“设置路径”中添加相应的路径; 注:可以先运行如下图片中的语句,看看是否报错;如果报如下错误,说明matlab未安装“Image Processing Toolbox”工

HDU 1428 漫步校园 (搜索 + dp)

OJ题目:click here ~~ 题意分析:题目中有句话“他考虑从A区域到B区域仅当存在一条从B到机房的路线比任何一条从A到机房的路线更近(否则可能永远都到不了机房了…)。”,关键是对这句话的理解。此刻在A区域,选择下面要走的B区域的条件是,存在一条B区域到机房的路线比A区域到机房的所有路线都近,也就是说,存在一条B区域到机房的路线比A区域到机房的最短路线更近(比最短的近

深度学习(十一)-PaddlePaddle

PaddlePaddle PaddlePaddle(Parallel Distributed Deep Learning,中文名飞桨) 是百度公司推出的开源、易学习、易使用的分布式深度学习平台 源于产业实践,在实际中有着优异表现 支持多种机器学习经典模型 优点 易用性。语法简洁,API的设计干净清晰 丰富的模型库。借助于其丰富的模型库,可以非常容易的复现一些经典方法 全中文说明文档

【硬刚Java并发】JUC基础(十一):线程调度

本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的Java并发部分补充。 1 ScheduledExecutorService 一个 ExecutorService,可安排在给定的延迟后运行或定期执行的命令。 package com.atguigu.juc;import java.util.Random;import java.util.concurrent.

Kafka【十一】数据一致性与高水位(HW :High Watermark)机制

【1】数据一致性 Kafka的设计目标是:高吞吐、高并发、高性能。为了做到以上三点,它必须设计成分布式的,多台机器可以同时提供读写,并且需要为数据的存储做冗余备份。 图中的主题有3个分区,每个分区有3个副本,这样数据可以冗余存储,提高了数据的可用性。并且3个副本有两种角色,Leader和Follower,Follower副本会同步Leader副本的数据。 一旦Leader副本挂了,Follo

[最优化方法] 《最优化方法》个人问答式学习笔记 with LLM

《最优化方法》问答式学习笔记 with LLM 文章目录 《最优化方法》问答式学习笔记 with LLM写在前面每周提问的链接表格绪论 | 第一周 | [answer by 文心一言]Q1 请为我解释一下最优化方法研究的核心重点主要是哪些?一、问题定义与建模二、求解方法三、算法性能与优化四、应用领域与交叉学科 Q2 请为我分别解释一下L0,L1和L2范数。L0范数L1范数L2范数总结 Q3