【矩阵论】特征值的估计(上下界和盖尔圆)

2024-01-10 03:32

本文主要是介绍【矩阵论】特征值的估计(上下界和盖尔圆),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:为什么不直接求特征值而是去估计特征值?

当我们遇到的不是书本上的3阶或4阶矩阵,而是高阶矩阵时(如图像中的256×256),我们再使用特征方程 det ⁡ ( λ I − A ) = 0 \det(\lambda I -A)=0 det(λIA)=0来求特征值就非常困难。我们难以求解没有必要逐一计算每一个精确的特征值。因此,在实际工程计算上,面对高阶矩阵,我们常常通过计算特征值的范围来估计特征值,这个范围越小,所估计的特征值就越精确。以下,本文就特征值估计常用方法做以梳理,完整定理证明请参考西工大的《矩阵论》[1]。

思路:如何估计特征值?

我们知道,对于 n n n阶非奇异方阵,有 n n n个特征值。

  • 从粗粒度的思路出发,我们可以先确定整体特征值( λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn)的上下界,对于复数域的矩阵,我们还需要分别考虑其特征值的实部虚部,这就像我们找犯罪嫌疑人需要先知道TA的性别、身高以及一些宽泛的特征从而对TA有个大致的定位。
  • 从细粒度的思路出发,我们可以更深入的确定每个特征值 λ i \lambda_i λi的范围,如果这些范围有重叠,比如两个嫌疑人有一些共同特征,那对我们来说也是件麻烦事,但我们可以通过相似矩阵具有相同特征值的特点设计对角阵按比例缩放每个特征值的范围

梳理以上的两个朴素的idea,我们可以得到如下解决方案

文章目录

一、特征值的界

我们主要的目的是仅通过计算原矩阵中的每个元素即可得到特征值的上下界。

方法1计算特征值虚部的上界( M M M越小,虚部 Im ( λ ) \text{Im}(\lambda) Im(λ)越小)

A = ( a i j ) ∈ R n × n A=(a_{ij})\in \mathbb{R}^{n\times n} A=(aij)Rn×n,若 λ \lambda λ表示 A A A的任一特征值,则 λ \lambda λ的虚部 Im ( λ ) \text{Im}(\lambda) Im(λ)满足如下不等式
{ M = max ⁡ 1 ≤ i , s ≤ n 1 2 ∣ a i j − a j i ∣ ∣ Im ( λ ) ∣ ≤ M n ( n − 1 ) 2 (1.1) \begin{cases} M=\max_{1\le i,s\le n} \frac12 |a_{ij}-a_{ji}| \\ |\text{Im}(\lambda)|\le M \sqrt{\frac{n(n-1)}2} \end{cases} \tag{1.1} {M=max1i,sn21aijajiIm(λ)M2n(n1) (1.1)

方法2计算特征值、实部和虚部的上界(该法虚部估计误差比法1大)

A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n,若 λ \lambda λ表示 A A A的任一特征值,则有

{ ∣ λ ∣ ≤ ∥ A ∥ m ∞ = n ⋅ max ⁡ i , j ∣ a i j ∣ ∣ Re ( λ ) ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ ∣ Im ( λ ) ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ (1.2) \begin{cases} |\lambda| \le \|A\|_{m_\infty}=n\cdot\max_{i,j}|a_{ij}| \\ |\text{Re}(\lambda)| \le \frac12 \|A+A^H\|_{m_\infty} \\ |\text{Im}(\lambda)| \le \frac12 \|A-A^H\|_{m_\infty} \\ \end{cases} \tag{1.2} λAm=nmaxi,jaijRe(λ)21A+AHmIm(λ)21AAHm(1.2)

方法3计算矩阵行列式( n n n个特征值乘积)的上下界(需满足严格对角占优)

【预备知识】:设 A = ( a i j ) ∈ C n × n , R r ( A ) = ∑ s = 1 , s ≠ r n ∣ a r s ∣ A=(a_{ij})\in \mathbb{C}^{n\times n},R_r(A)=\sum_{s=1,s\not=r}^n|a_{rs}| A=(aij)Cn×n,Rr(A)=s=1,s=rnars,若所有 ∣ a r r ∣ > R r |a_{rr}|>R_r arr>Rr,则称矩阵 A A A按行严格对角占优。若存在某 ∣ a r r ∣ ≥ R r |a_{rr}|\ge R_r arrRr且至少有一个 ∣ a r r ∣ > R r |a_{rr}|> R_r arr>Rr则成为按行(弱)对角占优。例如

A = [ 9 2 3 5 9 1 1 1 − 9 ] B = [ 9 2 3 4 9 5 1 8 − 9 ] \begin{gathered} A=\begin{bmatrix} 9 & 2 & 3\\ 5 & 9 & 1\\ 1 & 1 & -9\\ \end{bmatrix} \end{gathered} \begin{gathered} \;\;\;\;\; B=\begin{bmatrix} 9 & 2 & 3\\ 4 & 9 & 5\\ 1 & 8 & -9\\ \end{bmatrix} \end{gathered} A=951291319B=941298359
则由于
{ 9 = ∣ a 11 ∣ > R 1 ( A ) = ∣ a 12 ∣ + ∣ a 13 ∣ = 5 9 = ∣ a 22 ∣ > R 2 ( A ) = ∣ a 21 ∣ + ∣ a 23 ∣ = 6 9 = ∣ a 33 ∣ > R 3 ( A ) = ∣ a 31 ∣ + ∣ a 32 ∣ = 2 { 9 = ∣ b 11 ∣ > R 1 ( B ) = 5 9 = ∣ b 22 ∣ ≥ R 2 ( B ) = 9 9 = ∣ b 33 ∣ ≥ R 3 ( B ) = 9 \begin{cases} 9=|a_{11}|> R_1(A)=|a_{12}|+|a_{13}|=5\\ 9=|a_{22}|> R_2(A)=|a_{21}|+|a_{23}|=6\\ 9=|a_{33}|> R_3(A)=|a_{31}|+|a_{32}|=2\\ \end{cases} \;\;\;\;\; \begin{cases} 9=|b_{11}|> R_1(B)=5\\ 9=|b_{22}|\ge R_2(B)=9\\ 9=|b_{33}|\ge R_3(B)=9\\ \end{cases} 9=a11>R1(A)=a12+a13=59=a22>R2(A)=a21+a23=69=a33>R3(A)=a31+a32=29=b11>R1(B)=59=b22R2(B)=99=b33R3(B)=9
可知矩阵 A A A按行严格对角占优,而矩阵 B B B按行(弱)对角占优
【定理】:设 A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n,若 A A A按行严格对角占优,则有如下不等式

{ M r = ∣ a r r ∣ + ∑ s = r + 1 n ∣ a r s ∣ m r = ∣ a r r ∣ − ∑ s = r + 1 n ∣ a r s ∣ \begin{cases} M_r=|a_{rr}|+ \sum_{s=r+1}^n |a_{rs}|\\ m_r=|a_{rr}|- \sum_{s=r+1}^n |a_{rs}|\\ \end{cases} {Mr=arr+s=r+1narsmr=arrs=r+1nars

0 < ∏ r = 1 n m r ≤ ∣ det ⁡ A ∣ = ∏ r = 1 n λ r ( A ) ≤ ∏ r = 1 n M r (1.3) 0< \prod_{r=1}^n m_r \le |\det A| = \prod_{r=1}^n \lambda_r(A) \le \prod_{r=1}^n M_r \tag{1.3} 0<r=1nmrdetA=r=1nλr(A)r=1nMr(1.3)

方法4计算矩阵特征值模的平方和的上界( Schur \text{Schur} Schur不等式)

A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n的特征值为 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn,则有如下不等式
∥ λ ∥ 2 2 = ∑ i = 1 n ∣ λ i ∣ 2 ≤ ∑ i = 1 n ∑ j = 1 n ∣ a i j ∣ 2 = ∥ A ∥ F 2 (1.4) \|\lambda\|_2^2 = \sum_{i=1}^n |\lambda_i|^2 \le \sum_{i=1}^n \sum_{j=1}^n |a_{ij}|^2=\|A\|_F^2 \tag{1.4} \\ λ22=i=1nλi2i=1nj=1naij2=AF2(1.4)

二、特征值的包含区域

此处主要通过 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)理论来划分特征值区域,盖尔圆的应用主要在于隔离特征值,该理论力求将每个特征值隔离到一个较小的范围内。

2.1 什么是 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)?

【定义】设 A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n,则称矩阵 A A A的第 i i i Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)是由如下不等式在复平面上确定的区域。
G i : ∣ z − a i i ∣ ≤ R i (2.1) G_i:|z-a_{ii}| \le R_i \tag{2.1} Gi:zaiiRi(2.1)
其中,如下称为盖尔圆 G i G_i Gi的半径
R i = R i ( A ) = ∑ j = 1 , j ≠ i n ∣ a i j ∣ R_i = R_i(A) = \sum_{j=1,j\not=i}^n |a_{ij}| Ri=Ri(A)=j=1,j=inaij

2.2 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)的主要性质有哪些?
  • 【性质1】矩阵 A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n一切特征值都在它的 n n n个盖尔圆的并集之内。
  • 【性质2】在矩阵 A A A的所有盖尔圆组成的任一连通部分中,含有 A A A特征值的个数等于该连通部分的盖尔圆的个数。(连通区域:区域中的任一两点都可以用位于该区域内的一条折线连接起来)
  • 【性质3】设 A = ( a i j ) ∈ C n × n , B = ( a i j ) ∈ R n × n A=(a_{ij})\in \mathbb{C}^{n\times n},B=(a_{ij})\in \mathbb{R}^{n\times n} A=(aij)Cn×n,B=(aij)Rn×n,若 b i j ≥ ∣ a i j ∣ ( i , j = 1 , . . , n ) b_{ij}\ge |a_{ij}|\;(i,j=1,..,n) bijaij(i,j=1,..,n),则对 A A A的任一特征值 λ \lambda λ必有 i i i,使得 [ ρ ( B ) \rho(B) ρ(B)表示 B B B的谱半径]
    b i j ≥ ∣ a i j ∣ ⇒ ∣ λ − a i i ∣ ≤ ρ ( B ) − b i i b_{ij}\ge |a_{ij}| \Rightarrow |\lambda-a_{ii}| \le \rho(B)-b_{ii} bijaijλaiiρ(B)bii
  • 【性质4】设 A = ( a i j ) ∈ C n × n ( n ≥ 2 ) A=(a_{ij})\in \mathbb{C}^{n\times n}(n\ge2) A=(aij)Cn×n(n2),如果对于所有 i ≠ j i\not=j i=j,恒有
    ∣ a i i ∣ ∣ a j j ∣ > R i ( A ) R j ( A ) ⇔ det ⁡ A ≠ 0 |a_{ii}| |a_{jj}| > R_i(A)R_j(A) \Leftrightarrow \det A \not= 0 aiiajj>Ri(A)Rj(A)detA=0
2.3 放缩 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)的对角阵如何取?

由相似矩阵具有相同特征值的性质,常用如下关系放缩矩阵 A A A的特征值盖尔圆
B = D A D − 1 B=DAD^{-1} B=DAD1

对于对角阵 D D D的选取,我们常用如下准则

  • 放大 i i i个盖尔圆,则取 d i > 1 d_i>1 di>1,其余 d j = 1 ( j ≠ i ) d_j=1 \;(j\not= i) dj=1(j=i).
  • 缩小 i i i个盖尔圆,则取 d i < 1 d_i<1 di<1,其余 d j = 1 ( j ≠ i ) d_j=1 \;(j\not= i) dj=1(j=i).
  • 用来放缩的 d i ≠ 1 d_i\not=1 di=1,直接作用于 A A A的第 i i i的非主对角元素, 1 / d i 1/d_i 1/di作用于 A A A的第 i i i的非主对角元素.

当放缩第 i i i个盖尔圆的同时也会一定程度放缩其他盖尔圆,例如有如下矩阵 A A A
A = [ 20 3 1 2 10 2 8 1 0 ] \begin{gathered} A=\begin{bmatrix} 20 & 3 & 1\\ 2 & 10 & 2\\ 8 & 1 & 0\\ \end{bmatrix} \end{gathered} A=20283101120
分别取 D 1 D_1 D1 D 2 D_2 D2如下
D 1 = [ 2 1 1 ] D 2 = [ 1 1 1 2 ] \begin{gathered} D_1=\begin{bmatrix} 2 & & \\ & 1 & \\ & & 1\\ \end{bmatrix} \quad D_2=\begin{bmatrix} 1 & & \\ & 1 & \\ & & \frac12\\ \end{bmatrix} \end{gathered} D1=211D2=1121
B = D A D − 1 B=DAD^{-1} B=DAD1
B 1 = [ 20 6 2 1 10 2 4 1 0 ] B 2 = [ 20 6 2 2 10 4 4 0.5 0 ] \begin{gathered} B_1=\begin{bmatrix} 20 & \mathbf{6} &\mathbf{2} \\ \mathbf{1}& 10 & 2\\ \mathbf{4}& 1 & 0\\ \end{bmatrix} \quad B_2=\begin{bmatrix} 20 & 6 &\mathbf{2} \\ 2& 10 & \mathbf{4}\\ \mathbf{4}& \mathbf{0.5} & 0\\ \end{bmatrix} \end{gathered} B1=20146101220B2=20246100.5240
可见
行 : b i k = d i × a i k ( i ≠ k ) 列 : b k i = 1 d i × a k i ( i ≠ k ) 行:b_{ik} = d_i \times a_{ik} \quad (i\not = k) \\ 列:b_{ki} = \frac{1}{d_i} \times a_{ki} \quad (i\not = k) bik=di×aik(i=k)bki=di1×aki(i=k)

2.4 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)的应用(习题)
2.4.1 利用盖尔圆求每个特征值的范围
2.4.2 利用盖尔圆隔离范围重叠的特征值
2.4.3 利用盖尔圆性质3计算特征值范围

【问题】估计如下矩阵的特征值范围
A = [ 1 − 0.8 0.5 0 ] \begin{gathered} A=\begin{bmatrix} 1 & -0.8 \\ 0.5 & 0 \end{bmatrix} \end{gathered} A=[10.50.80]
【解】由性质3得
b i j ≥ ∣ a i j ∣ ⇒ ∣ λ − a i i ∣ ≤ ρ ( B ) − b i i b_{ij}\ge |a_{ij}| \Rightarrow |\lambda-a_{ii}| \le \rho(B)-b_{ii} bijaijλaiiρ(B)bii
因此构造一个满足比矩阵 A A A每个元素都大于等于的矩阵 B B B
B = [ 1 1 1 1 ] , 则 ∣ λ − 1 − 1 − 1 λ − 1 ∣ = ( λ − 1 ) 2 − 1 = λ ( λ − 2 ) \begin{gathered} B=\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} ,\quad则 \begin{vmatrix} \lambda-1 & -1 \\ -1 & \lambda-1 \end{vmatrix}=(\lambda-1)^2-1=\lambda(\lambda-2) \end{gathered} B=[1111],λ111λ1=(λ1)21=λ(λ2)
λ 1 = 0 , λ 2 = 2 \lambda_1=0,\lambda_2=2 λ1=0,λ2=2,所以 ρ ( B ) = max ⁡ ( λ 1 , λ 2 ) = 2 \rho(B)=\max(\lambda_1,\lambda_2)=2 ρ(B)=max(λ1,λ2)=2,因此 A A A的特征值至少满足一下不等式之一
{ ∣ λ − 1 ∣ ≤ 2 − 1 = 1 ∣ λ − 0 ∣ ≤ 2 − 1 = 1 \begin{cases} |\lambda-1| \le 2-1=1\\ |\lambda-0| \le 2-1=1\\ \end{cases} {λ121=1λ021=1

2.4.4 利用盖尔圆性质4判别矩阵奇异性

∣ a i i ∣ ∣ a j j ∣ > R i ( A ) R j ( A ) ⇔ det ⁡ A ≠ 0 |a_{ii}| |a_{jj}| > R_i(A)R_j(A) \Leftrightarrow \det A \not= 0 aiiajj>Ri(A)Rj(A)detA=0

附录1:特征值的界—习题

例1-求特征值上界估计如下矩阵特征值的上界
A = ( 1 − 0.8 0.5 0 ) \begin{gathered} A= \begin{pmatrix} 1 & -0.8 \\ 0.5 & 0 \end{pmatrix} \end{gathered} A=(10.50.80)
解:①应用方法1
{ M = max ⁡ 1 2 ∣ 1.3 ∣ = 0.65 ∣ Im ( λ ) ∣ ≤ M n ( n − 1 ) 2 = 0.65 ⋅ 2 ( 2 − 1 ) 2 = 0.65 (1.1) \begin{cases} M=\max \frac12 |1.3|=0.65 \\ |\text{Im}(\lambda)|\le M \sqrt{\frac{n(n-1)}2} =0.65\cdot \sqrt{\frac{2(2-1)}2} =0.65 \end{cases} \tag{1.1} {M=max211.3=0.65Im(λ)M2n(n1) =0.6522(21) =0.65(1.1)
②应用方法2
{ ∣ λ ∣ ≤ ∥ A ∥ m ∞ = n ⋅ max ⁡ i , j ∣ a i j ∣ = 2 ⋅ 1 = 2 ∣ Re ( λ ) ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ = 1 2 ( 2 ⋅ 2 ) = 2 ∣ Im ( λ ) ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ = 1 2 ( 2 ⋅ 1.3 ) = 1.3 (1.2) \begin{cases} |\lambda| \le \|A\|_{m_\infty}=n\cdot\max_{i,j}|a_{ij}|=2\cdot1=2 \\ |\text{Re}(\lambda)| \le \frac12 \|A+A^H\|_{m_\infty}=\frac12 (2\cdot2)=2 \\ |\text{Im}(\lambda)| \le \frac12 \|A-A^H\|_{m_\infty} =\frac12 (2\cdot1.3)=1.3 \\ \end{cases} \tag{1.2} λAm=nmaxi,jaij=21=2Re(λ)21A+AHm=21(22)=2Im(λ)21AAHm=21(21.3)=1.3(1.2)
可见方法1在计算特征值虚部上界中比方法2更精准。

例2-求模最小特征值上界估计如下矩阵按模最小特征值的上界
A = ( 1 − 0.8 0.5 1 ) \begin{gathered} A= \begin{pmatrix} 1 & -0.8 \\ 0.5 & 1 \end{pmatrix} \end{gathered} A=(10.50.81)
解:分析该问题的矩阵,我们不难发现矩阵 A A A按行严格对角占优,因此可应用方法3快速求解
首先计算 M 1 = 1.8 , M 2 = 1 M_1=1.8,M_2=1 M1=1.8,M2=1,因此有
∏ r = 1 n λ r ( A ) ≤ ∏ r = 1 n M r = 1.8 ⇒ ( λ min ⁡ ) 2 ≤ λ 1 ⋅ λ 2 = 1.8 ⇒ λ min ⁡ ≤ 1.8 \begin{aligned} & \prod_{r=1}^n \lambda_r(A) \le \prod_{r=1}^n M_r =1.8\\ \Rightarrow & (\lambda_{\min})^2 \le \lambda_1\cdot \lambda_2=1.8\\ \Rightarrow & \lambda_{\min} \le \sqrt{1.8}\\ \end{aligned} r=1nλr(A)r=1nMr=1.8(λmin)2λ1λ2=1.8λmin1.8
而实际情况, ∣ λ 1 , 2 ∣ = 1.4 |\lambda_{1,2}|=\sqrt{1.4} λ1,2=1.4

例3-部分特征值上界已知如下矩阵的一个特征值 λ 1 = 2 \lambda_1=2 λ1=2,估计另外两个特征值的上界
A = ( 3 + i − 2 − 3 i 2 i 1 0 0 0 1 0 ) \begin{gathered} A= \begin{pmatrix} 3+i & -2-3i & 2i \\ 1 & 0 &0 \\ 0 & 1 & 0 \\ \end{pmatrix} \end{gathered} A=3+i1023i012i00
解:分析该问题的矩阵,我们发现矩阵 A A A并不是按行严格对角占优,因此无法方法3求解
,可用方法4求解,因此有
∑ i = 1 n ∣ λ i ∣ 2 = 4 + ∣ λ 2 ∣ 2 + ∣ λ 3 ∣ 2 ≤ ∑ i = 1 n ∑ j = 1 n ∣ a i j ∣ 2 = ∥ A ∥ F 2 = 9 + ∣ i 2 ∣ + 4 + ∣ 9 i 2 ∣ + ∣ 4 i 2 ∣ + 1 + 1 = 29 ⇒ ∣ λ 2 ∣ 2 + ∣ λ 3 ∣ 2 ≤ 25 ⇒ ∣ λ 1 , 2 ∣ ≤ 5 \begin{aligned} \sum_{i=1}^n |\lambda_i|^2 =4+ |\lambda_2|^2 + |\lambda_3|^2 & \le \sum_{i=1}^n \sum_{j=1}^n |a_{ij}|^2 =\|A\|_F^2 \\ & = 9 + |i^2| +4+|9i^2|+|4i^2|+1+1\\ & = 29\\ \Rightarrow |\lambda_2|^2 + |\lambda_3|^2 & \le 25\\ \Rightarrow |\lambda_{1,2}| & \le 5\\ \end{aligned}\\ i=1nλi2=4+λ22+λ32λ22+λ32λ1,2i=1nj=1naij2=AF2=9+i2+4+9i2+4i2+1+1=29255

附录2:特征值的界—相关定理证明

方法2引理证明 B ∈ C n × n B\in \mathbb{C}^{n\times n} BCn×n,列向量 y ∈ C n y\in \mathbb{C}^{n} yCn满足 ∥ y ∥ 2 = 1 \|y\|_2=1 y2=1,则
∣ y H B y ∣ ≤ ∥ B ∥ m ∞ |y^HBy| \le \|B\|_{m_\infty} yHByBm
【证明】:设 B = ( b i j ) ∈ C n × n , y = ( η 1 , . . . , η n ) T B=(b_{ij})\in \mathbb{C}^{n\times n},y=(\eta_1,...,\eta_n)^T B=(bij)Cn×n,y=(η1,...,ηn)T,于是有
∣ y H B y ∣ = ∣ ∑ i , j = 1 n η ˉ i b i j η j ∣ ≤ max ⁡ i , j ∣ b i j ∣ ⋅ ∑ i , j = 1 n ∣ η i ∣ ∣ η j ∣ ≤ max ⁡ i , j ∣ b i j ∣ ⋅ 1 2 ∑ i , j = 1 n ( ∣ η i ∣ 2 + ∣ η j ∣ 2 ) ( a 2 + b 2 ≥ 2 ∣ a b ∣ ) = max ⁡ i , j ∣ b i j ∣ ⋅ 1 2 ( ∑ j = 1 n ∥ y ∥ 2 2 + ∑ i = 1 n ∥ y ∥ 2 2 ) = max ⁡ i , j ∣ b i j ∣ ⋅ 1 2 ( n + n ) = ∥ B ∥ m ∞ \begin{aligned} |y^HBy| &=|\sum_{i,j=1}^n \bar{\eta}_i b_{ij} \eta_j| \le \max_{i,j} |b_{ij}| \cdot \sum_{i,j=1}^n |\eta_i ||\eta_j| \\ & \le \max_{i,j} |b_{ij}| \cdot \frac12 \sum_{i,j=1}^n (|\eta_i |^2 +|\eta_j|^2) \quad \;\; (a^2+b^2 \ge 2|ab|)\\ & = \max_{i,j} |b_{ij}| \cdot \frac12( \sum_{j=1}^n \|y\|_2^2 + \sum_{i=1}^n \|y\|_2^2) \\ & = \max_{i,j} |b_{ij}| \cdot \frac12( n+n) = \|B\|_{m_\infty}\\ \end{aligned} yHBy=i,j=1nηˉibijηji,jmaxbiji,j=1nηiηji,jmaxbij21i,j=1n(ηi2+ηj2)(a2+b22ab)=i,jmaxbij21(j=1ny22+i=1ny22)=i,jmaxbij21(n+n)=Bm

方法2证明
{ ∣ λ ∣ ≤ ∥ A ∥ m ∞ ∣ Re ( λ ) ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ ∣ Im ( λ ) ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ \begin{cases} |\lambda| \le \|A\|_{m_\infty} \\ |\text{Re}(\lambda)| \le \frac12 \|A+A^H\|_{m_\infty} \\ |\text{Im}(\lambda)| \le \frac12 \|A-A^H\|_{m_\infty} \\ \end{cases} λAmRe(λ)21A+AHmIm(λ)21AAHm
【证明】:令 x ∈ C n × 1 x\in \mathbb{C}^{n\times 1} xCn×1 A A A的属于特征值 λ \lambda λ的单位特征向量,即 A x = λ x Ax=\lambda x Ax=λx x H x = I x^Hx=I xHx=I,由瑞利商理论得 λ = x H A x \lambda=x^HAx λ=xHAx λ ˉ = x H A H x \bar{\lambda}=x^HA^Hx λˉ=xHAHx.由方法2引理得
∣ λ ∣ = ∣ x H A x ∣ ≤ ∥ A ∥ m ∞ ∣ Re ( λ ) ∣ = 1 2 ∣ λ + λ ˉ ∣ = 1 2 ∣ x H ( A + A H ) x ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ ∣ Im ( λ ) ∣ = 1 2 ∣ λ − λ ˉ ∣ = 1 2 ∣ x H ( A − A H ) x ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ |\lambda| = |x^HAx| \le \|A\|_{m_\infty} \\ |\text{Re}(\lambda)| =\frac12|\lambda+\bar{\lambda}| = \frac12|x^H(A+A^H)x| \le \frac12 \|A+A^H\|_{m_\infty} \\ |\text{Im}(\lambda)| =\frac12|\lambda-\bar{\lambda}| = \frac12|x^H(A-A^H)x| \le \frac12 \|A-A^H\|_{m_\infty} \\ λ=xHAxAmRe(λ)=21λ+λˉ=21xH(A+AH)x21A+AHmIm(λ)=21λλˉ=21xH(AAH)x21AAHm

参考文献

程云鹏, 凯院, 仲. 矩阵论[M]. 西北工业大学出版社, 2006.

这篇关于【矩阵论】特征值的估计(上下界和盖尔圆)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/589393

相关文章

hdu 4565 推倒公式+矩阵快速幂

题意 求下式的值: Sn=⌈ (a+b√)n⌉%m S_n = \lceil\ (a + \sqrt{b}) ^ n \rceil\% m 其中: 0<a,m<215 0< a, m < 2^{15} 0<b,n<231 0 < b, n < 2^{31} (a−1)2<b<a2 (a-1)^2< b < a^2 解析 令: An=(a+b√)n A_n = (a +

hdu 6198 dfs枚举找规律+矩阵乘法

number number number Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Problem Description We define a sequence  F : ⋅   F0=0,F1=1 ; ⋅   Fn=Fn

线性代数|机器学习-P35距离矩阵和普鲁克问题

文章目录 1. 距离矩阵2. 正交普鲁克问题3. 实例说明 1. 距离矩阵 假设有三个点 x 1 , x 2 , x 3 x_1,x_2,x_3 x1​,x2​,x3​,三个点距离如下: ∣ ∣ x 1 − x 2 ∣ ∣ 2 = 1 , ∣ ∣ x 2 − x 3 ∣ ∣ 2 = 1 , ∣ ∣ x 1 − x 3 ∣ ∣ 2 = 6 \begin{equation} ||x

数据集 3DPW-开源户外三维人体建模-姿态估计-人体关键点-人体mesh建模 >> DataBall

3DPW 3DPW-开源户外三维人体建模数据集-姿态估计-人体关键点-人体mesh建模 开源户外三维人体数据集 @inproceedings{vonMarcard2018, title = {Recovering Accurate 3D Human Pose in The Wild Using IMUs and a Moving Camera}, author = {von Marc

【线性代数】正定矩阵,二次型函数

本文主要介绍正定矩阵,二次型函数,及其相关的解析证明过程和各个过程的可视化几何解释(深蓝色字体)。 非常喜欢清华大学张颢老师说过的一段话:如果你不能用可视化的方式看到事情的结果,那么你就很难对这个事情有认知,认知就是直觉,解析的东西可以让你理解,但未必能让你形成直觉,因为他太反直觉了。 正定矩阵 定义 给定一个大小为 n×n 的实对称矩阵 A ,若对于任意长度为 n 的非零向量 ,有 恒成

数据集 Ubody人体smplx三维建模mesh-姿态估计 >> DataBall

Ubody开源人体三维源数据集-smplx-三维建模-姿态估计 UBody:一个连接全身网格恢复和真实生活场景的上半身数据集,旨在拟合全身网格恢复任务与现实场景之间的差距。 UBody包含来自多人的现实场景的1051k张高质量图像,这些图像拥有2D全身关键点、3D SMPLX模型。 UBody由国际数字经济学院(IDEA)提供。 (UBody was used for mesh r

python科学计算:NumPy 线性代数与矩阵操作

1 NumPy 中的矩阵与数组 在 NumPy 中,矩阵实际上是一种特殊的二维数组,因此几乎所有数组的操作都可以应用到矩阵上。不过,矩阵运算与一般的数组运算存在一定的区别,尤其是在点积、乘法等操作中。 1.1 创建矩阵 矩阵可以通过 NumPy 的 array() 函数创建。矩阵的形状可以通过 shape 属性来访问。 import numpy as np# 创建一个 2x3 矩阵mat

特征值分解(EVD)和奇异值分解(SVD)—应用于图片压缩

特征值分解(EVD)和奇异值分解(SVD)—应用于图片压缩 目录 前言 一、特征值分解 二、应用特征值分解对图片进行压缩 三、矩阵的奇异值分解 四、应用奇异值分解对图片进行压缩 五、MATLAB仿真代码 前言         学习了特征值分解和奇异值分解相关知识,发现其可以用于图片压缩,但网上没有找到相应代码,本文在学习了之后编写出了图片压缩的代码,发现奇异值分

【UVA】10003-Cutting Sticks(动态规划、矩阵链乘)

一道动态规划题,不过似乎可以用回溯水过去,回溯的话效率很烂的。 13988658 10003 Cutting Sticks Accepted C++ 1.882 2014-08-04 09:26:49 AC代码: #include<cstdio>#include<cstring>#include<iostream>#include<algorithm>#include

算法练习题17——leetcode54螺旋矩阵

题目描述 给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。  代码 import java.util.*;class Solution {public List<Integer> spiralOrder(int[][] matrix) {// 用于存储螺旋顺序遍历的结果List<Integer> result = new ArrayList