拉格朗日松弛法、KKT条件与线性规划的对偶

本文主要是介绍拉格朗日松弛法、KKT条件与线性规划的对偶，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

拉格朗日松弛

深度解析拉格朗日乘子法，让你成为高手

对于等式约束，实际上是存在一条等值线，最优解必须存在在这条解上。

在这里插入图片描述

其目的是判断约束 $g (x)$ 的梯度方向是否和等值线的梯度方向共线。

即：

$[x_1,x_2,x_3]^T=\lambda[y_1,y_2,y_3]$

此时 $\lambda$ 取正负都可以。

KKT条件

KKT条件，原来如此简单 | 理论+算例实践

配合下式可以说：假设最优解出现在其中n个 $g (x)$ 上，那么他们可以被放到拉格朗日松弛目标函数中，其余的如果不满足约束说明假设错了，如果满足约束证明是一种可行解。

$\begin{array}{ll}\min & f(X) \\\text { s.t. } & g_i(X) \leq 0, \quad i=1, \ldots, m \\& h_j(X)=0, \quad j=1, \ldots, n\end{array}$

可以被转化为：

$L=f\left(X\right)+\sum_{i=1}^m \lambda_i g_i\left(X\right)+\sum_{j=1}^n \mu_j h_j(X)$

对于任意的X，要想使L满足要求( $\lambda_i g_i\left(X\right)=0$ )。考虑到 $g_i\left(X\right)\le0$ 。问题就转化为求L关于 $\lambda$ 的最大值。

$f\left(x^*\right)=\min _x f(x)=\min _x\left\{\max _{\lambda, \mu} L(\lambda, \mu, x)\right\}$

这样，自然的可以写出KKT条件。

$\begin{aligned}& \nabla f\left(X^*\right)+\sum_{i=1}^m \lambda_i \nabla g_i\left(X^*\right)+\sum_{j=1}^n \mu_j \nabla h_j(X)=0 \\& \lambda_i g_i\left(X^*\right)=0, \quad i=1, \ldots, m \\& h_j\left(X^*\right)=0, j=1, \ldots, n \\& \lambda_i \geq 0, \quad i=1, \ldots, m \\& g_i\left(X^*\right) \leq 0, \quad i=1, \ldots, m\end{aligned}$

若 $g_i(X^*)$ 等于0，说明约束张紧， $\lambda\not=0$ 。若 $g_i(X^*)$ 不等于0，说明约束不起作用（满足时）， $\lambda\not=0$ 。

为什么 $\lambda\ge0$ 呢？

$g_i(X) \leq 0$

$g_i(x)$ 的梯度方向仍然是可行的。

求目标函数的最小值时，若目标函数的梯度方向与 $g_i(x)$ 的梯度同向，说明目标函数仍然可以继续下降，并没有取到最优值。

因此，

$\nabla f\left(X^*\right)=-\lambda\nabla g_i(X^*)$

$\begin{array}{ll}\min & x_1^2+2 x_2^2-4 x_1-4 x_2 \\\text { s.t. } & x_1+x_2 \leq 3 \\& x_1+2 x_2 \geq 5\end{array}$

最小值需要整理为小于等与0的形式

$\begin{array}{ll}\min & x_1^2+2 x_2^2-4 x_1-4 x_2 \\\text { s.t. } & x_1+x_2-3 \leq 0 \\& -x_1-2 x_2+5 \leq 0\end{array}$

$x_1^2+2 x_2^2-4 x_1-4 x_2+\lambda_1(x_1+x_2+x_3)+\lambda_2(-x_1-x_2+5)$

（1）若 $\lambda_1=\lambda_2=0$ ,求无约束极值问题：

需要检查 $g_i(X^*)$ 是否小于0，若满足上式成立，一种可行解。

（2）若 $\lambda_1=0，\lambda_2 \not=0$

检查 $\lambda_2$ 是否大于0， $g_1(X^*)$ 是否小于0，都满足是一种可行解

略

线性规划的对偶

$\begin{gathered}\min c^T x \\\text { s.t. } A x \geq b \quad x \geq 0\end{gathered}$

利用KKT条件进行转化：

$\begin{align*} L(x, \lambda) &= c^T x - \lambda^T(Ax - b) \\ &= \lambda^T b + (c^T - \lambda^T A) x \end{align*}(\lambda\ge0)$

这时的 $\lambda)$ 已经没有约束，若想使其有最小值，需要 $(c^T-\lambda^TA)$ 每一个分量都大于等于0。( $x\ge0$ )

这时问题转化为如下形式：

$\min_x L(x,\lambda)=\lambda^T b \quad if \quad c^T-\lambda^TA\ge 0$

由于 $f\left(x^*\right)=\min _x f(x)=\min _x\left\{\max _{\lambda, \mu} L(\lambda, \mu, x)\right\}$

交换顺序：

$f\left(x^*\right) = \min_x f(x) = \max_{\lambda} b^T \lambda \\ \begin{align*} \text{s.t.} \quad A^T\lambda &\leq c \\ \lambda &\geq 0 \end{align*}$

对偶问题的标准形式

针对上述的推导，我们进行一定的拓展：

（1）若原问题存在等式约束

KKT条件退化为拉格朗日松弛，不需要对 $\lambda$ 进行限制

（2）若原问题存在自由变量。

若想使L有界，需要对系数项 $(c^T-\lambda^TA)$ 置0，不等式约束转化为等式约束。

综上，对偶问题的转化关系如下：

原问题：

$\begin{array}{ll}\min & c^Tx \\\text { s.t. } & g_i(X) \leq b_i, \quad i=1, \ldots, p \\& h_j(X)=b_j, \quad j=p+1, \ldots, m\\ &x_l \geq 0, \quad l=1, \ldots, q\\& x_k \gtrless 0, \quad k=q+1, \ldots, n\end{array}$

对偶问题:

$\begin{array}{ll}\max & b^T\lambda \\\text { s.t. } & \lambda_i \geq 0, \quad i=1, \ldots, \lambda_i \\& \lambda_j \gtrless0, \quad j=p+1, \ldots, m\\ &c_l-A_l^T\lambda\ge0, \quad l=1, \ldots, q\\& c_l-A_l^T\lambda=0, \quad k=q+1, \ldots, n\end{array}$