奇异值分解SVD（singular value decomposition）

本文主要是介绍奇异值分解SVD（singular value decomposition），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

奇异值分解

SVD是一个很有用的矩阵因子化方法。
SVD提出的目的：任何一个 $m\times n$ 的矩阵都可以当作一个超椭圆（高维空间的椭圆），可以把它们当作单位球体S的像。
一个超椭圆可以通过将单位球型在正交方向 $\mathbf{u_1},\mathbf{u_2},...,\mathbf{u_m}$ 通过缩放因子 $\sigma_1,..., \sigma_m$ ，其中m是维度，如果在平面上m=2
在这里插入图片描述
通过上面这张图，可以做出下面的定义：

singular value: $\sigma_1,..., \sigma_n\geq 0$ 一般假设 $\sigma_1 \geq \sigma_2 \geq ...$
Light singular vectors: $\mathbf{u_1},\mathbf{u_2},...,\mathbf{u_n}$ ,单位向量
right singular vectors: $\mathbf{v_1},\mathbf{v_2},...,\mathbf{v_n}$ 是ui的逆向满足 $Av_i = \sigma_i u_i$
这个名字中左和右来自svd的公式。
把上面的公式矩阵化，可以得到：
$\hat U \hat \Sigma$
在这里面
$\hat{\Sigma}\in\mathbb{R}^{n\times n}$ 是一个非负数对角矩阵
$\hat{U}\in\mathbb{R}^{m\times n}$ 是一个列正交矩阵
$V\in\mathbb{R}^{n\times n}$ 是一个列正交矩阵
因此V是个正交矩阵，因为它是基向量，因此我们就可以得到reduced SVD：
$\hat U \hat \Sigma V^T$
正如QR分解一样，可以把扩充 $\hat U$ 的列使得 $U\in\mathbb{R}^{m\times m}$
然后需要给 $\hat{\Sigma}$ 添加一些为为0的行，使得可以沉默掉新添加到U中的随机列，这样就得到了完全SVD
$\Sigma V^T$
对比reduced和full

现在重新考虑当时把球型变为超椭圆型的目的。
1 $V^T$ 是球型S
2 $\Sigma$ 拉伸球型得到椭球形
3 $U$ 旋转投射而不改变形状

通过SVD可以知道一些矩阵性质

A的秩为r，也就是非零奇异值的个数
proof:U和V是满秩的，所以rank（A） = rank( $\Sigma$ )
image(A) = span{ $\mathbf{u_1},\mathbf{u_2},...,\mathbf{u_r}$ }
null(A) = span{ $\mathbf{v_{r+1}},...,\mathbf{v_n}$ }
$||A||_2=\sigma_1$
proof: $||A||_2 \equiv max_{||V||_2=1}$ ||Av||_2
A的奇异值是AAT的特征值的平方根。
根据上面的性质：可以知道SVD的两种应用

长方形矩阵的条件数

$K(A)=||A||||A^+||$
其中 $A^+$ 是伪逆

$||A||_2 = \sigma_{max}$
$||A^+||_2 = \frac{1}{\sigma_{min}}$
所以 $K(A)=\frac{\sigma_{max}}{\sigma_{min}}$

低秩近似

把SVD变为
$\sum^r_{j=1}\sigma_j u_j v_j^T$
每个 $u_j v_j^T$ 都是一个秩为1的矩阵
Theorem:
对于 $0\leq v \leq r$ ,让 $\sum^v_{j=1}\sigma_ju_jv_j^T$
所以
$||A-Av||_2 = \inf_{B\in \mathbb{R}^{m\times n}, rank(B)\leq v}{||A-B||_2}$
同样的也可以在Frobenius norm中证明，这个理论说明SVD是压缩矩阵的一个好的方法。