本文主要是介绍【矩阵论】Chapter 7—Hermite矩阵与正定矩阵知识点总结复习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 1 Hermite矩阵
- 2 Hermite二次型
- 3 Hermite正定(非负定矩阵)
- 4 矩阵不等式
1 Hermite矩阵
-
定义
设 A A A为 n n n阶方阵,如果称 A A A为Hermite矩阵,则需满足 A H = A A^H=A AH=A,其中 A H A^H AH表示 A A A的共轭转置,也称Hermite转置,具体操作如下:
- 将矩阵的每个元素取共轭。对于复数 a + b i a+bi a+bi,它的共轭是 a − b i a-bi a−bi,其中 a a a和 b b b 是实部和虚部
- 将矩阵的行和列互换
Hermite矩阵与实对称矩阵的性质和证明方法都十分相似
-
Hermite矩阵性质
若 A , B A,B A,B为 n n n阶Hermite矩阵,则
- A A A的所有特征值全是实数
- A A A的不同特征值所对应的特征向量是相互正交的
- 对正整数 k k k, A k A^k Ak也是Hermite矩阵
- 若 A A A可逆,则 A − 1 A^{-1} A−1也是Hermite矩阵
- 对实数 k , p , k A + p B k,p,kA+pB k,p,kA+pB也是Hermite矩阵
-
Hermite矩阵充分必要条件
设 A ∈ C n × n , B ∈ C n × n A\in C^{n\times n},B\in C^{n\times n} A∈Cn×n,B∈Cn×n
-
A A A是Hermite矩阵的充要条件是存在酉矩阵 U U U使得
U H A U = Λ = d i a g ( λ 1 , . . . , λ n ) U^HAU=\Lambda =diag(\lambda_1,...,\lambda_n) UHAU=Λ=diag(λ1,...,λn)
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn均为实数。实对称矩阵则是存在正交矩阵 U . . . U... U... -
A是Hermite矩阵的充要条件是对任意方阵 S S S, S H A S S^HAS SHAS是Hermite矩阵
-
如果 A , B A,B A,B是Hermite阵,则 A B AB AB是Hermite矩阵的充要条件是 A B = B A AB=BA AB=BA
-
-
相合标准形
设 A A A为 n n n阶Hermite矩阵,则 A A A相合矩阵
D 0 = ( I s 0 0 0 − I r − s 0 0 0 O n − r ) D_0=\begin{pmatrix} I_s & 0 & 0 \\ 0 & -I_{r-s} & 0 \\ 0 & 0 & O_{n-r} \end{pmatrix} D0= Is000−Ir−s000On−r
其中 r = r a n k ( A ) r=rank(A) r=rank(A), s s s是 A A A的正特征值(重特征值按重数计算)的个数。矩阵 D 0 D_0 D0则称为 n n n阶Hermite矩阵 A A A的相合标准形。 -
Sylvester惯性定律
设 A , B A,B A,B为 n n n阶Hermite矩阵,则 A A A与 B B B相合的充要条件是
I n ( A ) = I n ( B ) In(A)=In(B) In(A)=In(B)
其中 I n ( A ) In(A) In(A)称为 A A A的惯性, I n ( A ) = { π ( A ) , v ( A ) , δ ( A ) } In(A)=\{\pi(A),v(A),\delta(A)\} In(A)={π(A),v(A),δ(A)}。其中 π ( A ) \pi(A) π(A), v ( A ) v(A) v(A), δ ( A ) \delta(A) δ(A)分别表示 A A A的正、负和零特征值的个数(重特征值按重数计算)。则 A A A非奇异的充要条件为 δ ( A ) = 0 \delta(A)=0 δ(A)=0且 π ( A ) + v ( A ) = r a n k ( A ) \pi(A)+v(A)=rank(A) π(A)+v(A)=rank(A)。
2 Hermite二次型
-
Hermite二次型定义
由 n n n个复变量 x 1 , . . . , x n x_1,...,x_n x1,...,xn,系数为负数的二次齐式
f ( x 1 , . . . , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i ˉ x j ˉ f(x_1,...,x_n)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}\bar{x_i}\bar{x_j} f(x1,...,xn)=i=1∑nj=1∑naijxiˉxjˉ
其中 a i j = a j i a_{ij}=a_{ji} aij=aji,称为Hermite二次型。Hermite二次型可写为 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,我们称 A A A的秩就为Hermite二次型的秩。 -
Hermite二次型的标准形定理
对Hermite二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在酉线性变换 x = U y x=Uy x=Uy(其中 U U U是酉矩阵)使得Hermite二次型 f ( x ) f(x) f(x)变成标准形(只包含平方项的二次型)
f ( x ) = λ 1 y 1 ˉ y 1 + . . . + λ n y n ˉ y n f(x)=\lambda_1\bar{y_1}y_1+...+\lambda_n\bar{y_n}y_n f(x)=λ1y1ˉy1+...+λnynˉyn
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn为 A A A的特征值。 -
Hermite二次型化标准形(酉线性变换)
设 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A为 n n n阶Hermite矩阵
-
求出二次型矩阵 A A A的特征值 λ 1 , . . . λ n \lambda_1,...\lambda_n λ1,...λn和特征向量 v 1 , . . . , v n v_1,...,v_n v1,...,vn,并将特征向量 v 1 , . . . , v n v_1,...,v_n v1,...,vn规范正交
-
令 U = ( v 1 , . . . , v n ) , x = U y U=(v_1,...,v_n),x=Uy U=(v1,...,vn),x=Uy,则
f ( x ) = ( U y ) H A ( U y ) = y H U H A U y = y H ( U H A U ) y = y H Λ y = λ 1 ∣ y 1 ∣ 2 + . . . + λ n ∣ y n ∣ 2 f(x)=(Uy)^HA(Uy)=y^HU^HAUy=y^H(U^HAU)y\\=y^H\Lambda y=\lambda_1|y_1|^2+...+\lambda_n|y_n|^2 f(x)=(Uy)HA(Uy)=yHUHAUy=yH(UHAU)y=yHΛy=λ1∣y1∣2+...+λn∣yn∣2
-
-
Hermite二次型规范形定理
对二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在可逆线性变换 x = P y x=Py x=Py使得Hermite二次型 f ( x ) f(x) f(x)化为
f ( x ) = y 1 ˉ y 1 + . . . + y s ˉ y s − y s + 1 ˉ y s + 1 − . . . − y r ˉ y r f(x)=\bar{y_1}y_1+...+\bar{y_s}y_s-\bar{y_{s+1}}y_{s+1}-...-\bar{y_r}y_r f(x)=y1ˉy1+...+ysˉys−ys+1ˉys+1−...−yrˉyr
其中 r = r a n k ( A ) , s = π ( A ) r=rank(A),s=\pi(A) r=rank(A),s=π(A)。上式则为Hermite二次型 f ( x ) f(x) f(x)的规范形,其中 s s s和 ( r − s ) (r-s) (r−s)分别称为Hermite二次型的正惯性指数和负惯性指数。 -
二次型化规范形
设 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A为 n n n阶Hermite矩阵
-
将二次型化为标准形,得到标准形 f ( x ) = y H Λ y f(x)=y^H\Lambda y f(x)=yHΛy和酉矩阵 U U U
-
将对角线元素提取出来,即只保留 λ i \lambda_i λi的正负性,则
f ( x ) = y H Λ y = y H ( Λ 1 D 0 Λ 1 ) y = y H ( Λ 1 H D 0 Λ 1 ) y = ( Λ 1 y ) H D 0 ( Λ 1 y ) f(x)=y^H\Lambda y=y^H(\Lambda_1 D_0 \Lambda_1)y=y^H(\Lambda_1^HD_0\Lambda_1)y\\ =(\Lambda_1y)^HD_0(\Lambda_1y) f(x)=yHΛy=yH(Λ1D0Λ1)y=yH(Λ1HD0Λ1)y=(Λ1y)HD0(Λ1y)
其中 Λ 1 \Lambda_1 Λ1为对角矩阵,对角线元素为 ∣ λ i ∣ ( 1 ≤ i ≤ n ) \sqrt {|\lambda_i}|(1\leq i \leq n) ∣λi∣(1≤i≤n)。 -
令 y = Λ 1 − 1 z y=\Lambda_1^{-1} z y=Λ1−1z,则
f ( x ) = ( Λ 1 Λ 1 − 1 z ) H D 0 ( Λ 1 Λ 1 − 1 z ) = z H D 0 z = z 1 ˉ z 1 + . . . + z s ˉ y s − z s + 1 ˉ z s + 1 − . . . − z r ˉ z r f(x)=(\Lambda_1\Lambda_1^{-1}z)^HD_0(\Lambda_1\Lambda_1^{-1}z)=z^HD_0z\\=\bar{z_1}z_1+...+\bar{z_s}y_s-\bar{z_{s+1}}z_{s+1}-...-\bar{z_r}z_r f(x)=(Λ1Λ1−1z)HD0(Λ1Λ1−1z)=zHD0z=z1ˉz1+...+zsˉys−zs+1ˉzs+1−...−zrˉzr -
故 x = U Λ − 1 z x=U\Lambda^{-1}z x=UΛ−1z,可逆矩阵 P = U Λ − 1 P=U\Lambda^{-1} P=UΛ−1
-
-
正定相关概念
设 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx为Hermite二次型
- 如果 f ( x ) > 0 f(x)>0 f(x)>0(等价 s = r = n s=r=n s=r=n),则称 f ( x ) f(x) f(x)为正定的;
- 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)≥0(等价 s = r < n s=r<n s=r<n),则称 f ( x ) f(x) f(x)为半正定(非负定的)的;
- 如果 f ( x ) < 0 f(x)<0 f(x)<0(等价 s = 0 , r = n s=0,r=n s=0,r=n),则称 f ( x ) f(x) f(x)为负定的;
- 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)≤0(等价 s = 0 , r < n s=0,r<n s=0,r<n),则称 f ( x ) f(x) f(x)为半负定的;
- 如果 f ( x ) f(x) f(x)有时为正有时为负(等价 0 < s < r ≤ n 0<s<r\leq n 0<s<r≤n),则称 f ( x ) f(x) f(x)为不定的;
3 Hermite正定(非负定矩阵)
-
定义
根据Hermite二次型的正定(非负定)可以定义Hermite矩阵的正定(非负定)。
设 A A A为 n n n阶Hermite矩阵, f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx
- 如果 f ( x ) > 0 f(x)>0 f(x)>0,则称 A A A为正定的,记作 A > 0 A>0 A>0;
- 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)≥0,则称 A A A为半正定(非负定的)的,记作 A ≥ 0 A\geq 0 A≥0;
- 如果 f ( x ) < 0 f(x)<0 f(x)<0,则称 A A A为负定的,记作 A < 0 A<0 A<0;
- 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)≤0,则称 A A A为半负定的,记作 A ≤ 0 A\leq 0 A≤0;
- 如果 f ( x ) f(x) f(x)有时为正有时为负,则称 A A A为不定的;
-
判断 n n n阶Hermite矩阵 A A A正定
- 通过正定矩阵的定义
- A A A的 n n n个特征值均为正数
- A A A的顺序主子式 Δ k = A ( 1 … k 1 … k ) > 0 , ( k = 1 , . . . , n ) \Delta_k=A\begin{pmatrix}1&\dots&k\\1&\dots&k\end{pmatrix}>0,(k=1,...,n) Δk=A(11……kk)>0,(k=1,...,n)均为正数
- A A A的所有主子式全大于 0 0 0
- 存在 n n n阶非奇异下三角矩阵 L L L,使得 A = L L H A=LL^H A=LLH(该分解称为Cholesky分解)
- 存在 n n n阶非奇异矩阵,使得 A = B H B A=B^HB A=BHB
- 存在 n n n阶非奇异Hermite矩阵 A = S 2 A=S^2 A=S2
-
判断 n n n阶Hermite矩阵 A A A半正定
- 通过半正定矩阵的定义
- A A A的 n n n个特征值均为非负数
- A A A的所有主子式均非负
-
定理证明
设 A , B A,B A,B均为 n n n阶Hermite矩阵,且 B > 0 B>0 B>0,则存在非奇异矩阵 P P P使得
P H A P = d i a g ( λ 1 , . . . , λ n ) , P H B P = I P^HAP=diag(\lambda_1,...,\lambda_n),P^HBP=I PHAP=diag(λ1,...,λn),PHBP=I
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn是广义特征值问题的特征值证明:
∵ B > 0 \because B >0 ∵B>0
$\therefore 存在非奇异矩阵 存在非奇异矩阵 存在非奇异矩阵P_1 使得 使得 使得P_1^HBP_1=I$
又 ∵ P 1 H A P 1 \because P_1^HAP_1 ∵P1HAP1仍为
Hermite
矩阵∴ \therefore ∴酉矩阵 U U U使得
U H ( P 1 H A P 1 ) U = d i a g ( λ 1 , . . . , λ n ) U^H(P_1^HAP_1)U=diag(\lambda_1,...,\lambda_n) UH(P1HAP1)U=diag(λ1,...,λn)
令 P = P 1 U P=P_1U P=P1U∵ P \because P ∵P非奇异,根据定理 P H B P = I P^HBP=I PHBP=I
∴ P H B P = ( P 1 U ) H B ( P 1 U ) = U H P 1 H B P 1 U = I \therefore P^HBP=(P_1U)^HB(P_1U)\\=U^HP_1^HBP_1U=I ∴PHBP=(P1U)HB(P1U)=UHP1HBP1U=I
又 ∵ P 1 \because P_1 ∵P1非奇异,使得 P 1 H B P 1 = I P_1^HBP_1=I P1HBP1=I
∴ \therefore ∴
P H B P = U H P 1 H B P 1 U = U H ( P 1 H B P 1 ) U = U H I U = U H U = I P^HBP= U^HP_1^HBP_1U=U^H(P_1^HBP_1)U\\=U^HIU=U^HU=I PHBP=UHP1HBP1U=UH(P1HBP1)U=UHIU=UHU=I
∴ \therefore ∴
P H A P = U H P 1 H A P 1 U = d i a g ( λ 1 , . . . , λ n ) P^HAP=U^HP_1^HAP_1U=diag(\lambda_1,...,\lambda_n) PHAP=UHP1HAP1U=diag(λ1,...,λn)
∴ \therefore ∴我们可以对上式右乘 P − 1 P^{-1} P−1和 B − 1 B^{-1} B−1,得到
P H B P = I P H = P − 1 B − 1 P^HBP=I \\ P^H=P^{-1}B^{-1} PHBP=IPH=P−1B−1
∴ \therefore ∴ 得到
P − 1 B − 1 A P = d i a g ( λ 1 , . . . , λ n ) P^{-1}B^{-1}AP=diag(\lambda_1,...,\lambda_n) P−1B−1AP=diag(λ1,...,λn)
即 B − 1 A B^{-1}A B−1A相似于对角矩阵,故 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn是矩阵 B − 1 A B^{-1}A B−1A的特征值,即 λ 1 , . . . , λ n ) \lambda_1,...,\lambda_n) λ1,...,λn)是广义特征值问题的特征值。广义特征值问题 A x = λ B x Ax=\lambda Bx Ax=λBx,左乘 B − 1 B^{-1} B−1,即为 B − 1 A x = λ x B^{-1}Ax=\lambda x B−1Ax=λx
4 矩阵不等式
-
定义
设 A , B A,B A,B都是 n n n阶Hermite矩阵,如果 A − B ≥ 0 A-B\geq 0 A−B≥0则称 A A A大于或等于 B B B(或称 B B B小于等于 A A A),记作 A ≥ B A\geq B A≥B(或 B ≤ A B\leq A B≤A),即 A − B A-B A−B半正定;如果 A − B > 0 A-B>0 A−B>0,则称 A A A大于 B B B(或称 B B B小于 A A A),记作 A > B A>B A>B(或 B < A B<A B<A),即== A − B A-B A−B正定==。
-
性质
设 A , B , C A,B,C A,B,C均为 n n n阶Hermite矩阵,则
- A ≥ B ( A > B ) ⟺ − A ≤ − B ( − A < − B ) ⟺ A\geq B(A>B) \Longleftrightarrow-A\leq -B(-A<-B)\Longleftrightarrow A≥B(A>B)⟺−A≤−B(−A<−B)⟺对任意 n n n阶可逆矩阵 P P P都有 P H A P ≥ P H B P ( P H A P > P H B P ) P^HAP\geq P^HBP(P^HAP>P^HBP) PHAP≥PHBP(PHAP>PHBP)
- 若 A > 0 ( A ≥ 0 ) , C > 0 ( C ≥ 0 ) A>0(A\geq 0),C>0(C\geq 0) A>0(A≥0),C>0(C≥0),且 A C = C A AC=CA AC=CA,则 A C > 0 ( A C ≥ 0 ) AC>0(AC\geq 0) AC>0(AC≥0)
- 若 A > B A>B A>B, P P P为 n × m n\times m n×m列满秩矩阵,则 P H A P > P H B P P^HAP>P^HBP PHAP>PHBP
- 若 A ≥ B A\geq B A≥B, P P P为 n × m n\times m n×m矩阵,则 P H A P ≥ P H B P P^HAP\geq P^HBP PHAP≥PHBP
-
定理
设 A , B A,B A,B都是 n n n阶Hermite矩阵,且 A ≥ 0 , B > 0 A\geq 0,B>0 A≥0,B>0,则
- B ≥ A B\geq A B≥A的充要条件是 ρ ( A B − 1 ) ≤ 1 \rho(AB^{-1})\leq 1 ρ(AB−1)≤1
- B > A B>A B>A的充要条件是 ρ ( A B − 1 ) < 1 \rho(AB^{-1})<1 ρ(AB−1)<1
设 A A A是 n n n阶Hermite矩阵,则 λ m i n ( A ) I ≤ A ≤ λ m a x I \lambda_{min}(A)I\leq A\leq\lambda_{max}I λmin(A)I≤A≤λmaxI,这时 λ m i n \lambda_{min} λmin和 λ m a x \lambda_{max} λmax分别表示 A A A的最大和最小特征值。
设 A , B A,B A,B均为 n n n阶Hermite正定矩阵,则
- 若 A ≥ B > 0 A\geq B>0 A≥B>0,则 B − 1 ≥ A − 1 > 0 B^{-1}\geq A^{-1}>0 B−1≥A−1>0
- 若 A > B > 0 A>B>0 A>B>0,则 B − 1 > A − 1 > 0 B^{-1}>A^{-1}>0 B−1>A−1>0
设 A , B A,B A,B均为 n n n阶Hermite正定矩阵,且 A B = B A AB=BA AB=BA,则
-
若 A ≥ B A\geq B A≥B,则 A 2 ≥ B 2 A^2\geq B^2 A2≥B2
证明: A 2 − B 2 = ( A − B ) ( A + B ) = ( A + B ) ( A − B ) A^2-B^2=(A-B)(A+B)=(A+B)(A-B) A2−B2=(A−B)(A+B)=(A+B)(A−B),易知 ( A − B ) ≥ 0 , A + B > 0 (A-B)\geq0,A+B>0 (A−B)≥0,A+B>0,则克制
-
若 A ≥ B A\geq B A≥B,则 A 2 > B 2 A^2> B^2 A2>B2
同理得证
设 A A A是 m × n m\times n m×n行满秩矩阵, B B B是 n × k n\times k n×k矩阵,则
B H B ≥ ( A B ) H ( A A H ) − 1 ( A B ) B^HB\geq (AB)^H(AA^H)^{-1}(AB) BHB≥(AB)H(AAH)−1(AB)
等号成立当且仅当存在一个 m × k m\times k m×k矩阵 C C C使得 B = A H C B=A^HC B=AHC
这篇关于【矩阵论】Chapter 7—Hermite矩阵与正定矩阵知识点总结复习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!