Convex Optimization: 2 Convex sets 作业

2023-11-01 23:40

本文主要是介绍Convex Optimization: 2 Convex sets 作业,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2.8, 2.13, 2.22, A1.5, A1.9.

文章目录

    • 2.8
      • a
      • b
      • c
      • d
    • 2.13
    • 2.22
    • A1.5
    • A1.9

2.8

在这里插入图片描述
问以下哪些集合是多面体,如果可能的话,用 S = { x ∣ A x ⪯ b , F x = g } S=\{x|Ax\preceq b,Fx=g\} S={xAxb,Fx=g} 的形式来表示 S S S

a

S S S 是一个多面体,它是由 a 1 + a 2 , a 1 − a 2 , − a 1 + a 2 , − a 1 − a 2 a_1+a_2,a_1-a_2,-a_1+a_2,-a_1-a_2 a1+a2,a1a2,a1+a2,a1a2 这四个顶点构成的,比如在 R 2 \mathbf{R}^2 R2 中:

在这里插入图片描述
集合 S S S 可以描述为以下几个点集的交集:

  • S 1 S_1 S1 a 1 , a 2 a_1,a_2 a1,a2 所定义的平面上的点
  • S 2 S_2 S2 { z + y 1 a 1 + y 2 a 2 ∣ a 1 T z = a 2 T z = 0 , − 1 ≤ y 1 ≤ 1 } \{z+y_1a_1+y_2a_2|a_1^Tz=a_2^Tz=0,-1\le y_1\le 1\} {z+y1a1+y2a2a1Tz=a2Tz=0,1y11},其中 z z z 是垂直于 a 1 , a 2 a_1,a_2 a1,a2 平面的向量,对于每一个固定的 y 1 y_1 y1 S 2 S_2 S2 为一个平行于 a 2 a_2 a2 且垂直于 a 1 , a 2 a_1,a_2 a1,a2 所形成的平面的平面,变化 y 1 y_1 y1 S 2 S_2 S2 实际上是一组这样的平面。
  • S 3 S_3 S3 { z + y 1 a 1 + y 2 a 2 ∣ a 1 z = a 2 T z = 0 , − 1 ≤ y 2 ≤ 1 } \{z+y_1a_1+y_2a_2|a_1z=a_2^Tz=0,-1\le y_2\le 1\} {z+y1a1+y2a2a1z=a2Tz=0,1y21} ,这个和 S 2 S_2 S2 同理, S 3 S_3 S3 平行于 a 1 a_1 a1 ,垂直于 a 1 , a 2 a_1,a_2 a1,a2 所形成的平面,是一组平面。

以上三个集合取交集刚好是图中所示的平行四边形(阴影部分)

  • S 1 S_1 S1 可以描述为:

v k T x = 0 , k = 1 , . . . , n − 2 v_k^Tx=0,\ k=1,...,n-2 vkTx=0, k=1,...,n2

其中 v k v_k vk 是垂直于 a 1 , a 2 a_1,a_2 a1,a2 的不相关的向量(矩阵 [ a 1 , a 2 ] T [a_1,a_2]^T [a1,a2]T 的零空间(null space)),对于 R 2 \mathbf{R}^2 R2 来说这个面就不存在了,对于 R 3 \mathbf{R}^3 R3 及以上,这个就可以想象成 a 1 , a 2 a_1,a_2 a1,a2 形成的超平面。

  • S 2 S_2 S2 可以描述为:

− ∣ c 1 T a 1 ∣ ≤ c 1 T x ≤ ∣ c 1 T a 1 ∣ -|c_1^Ta_1|\le c_1^Tx\le |c_1^Ta_1| c1Ta1c1Txc1Ta1

其中 c 1 = a 1 − a 1 T a 2 ∥ a 2 ∥ 2 2 a 2 c_1=a_1-\dfrac{a_1^Ta_2}{\|a_2\|_2^2}a_2 c1=a1a222a1Ta2a2,这个可以理解为平行四边形的中心到右边的那个边做了一个垂线,中心到垂足形成的向量即为 c 1 c_1 c1(不理解的话就画一画), x x x 就是空间内任意一个向量,要满足的约束其实就是该向量和 c 1 c_1 c1 做内积的绝对值要小于等于 ∥ c 1 ∥ 2 2 \|c_1\|_2^2 c122 ∣ c 1 T a 1 ∣ = ∥ c 1 ∥ 2 2 |c_1^Ta_1|=\|c_1\|_2^2 c1Ta1=c122,额不理解的话就画图),这整个的意思就是限制向量 x x x 在平行四边形的左右两边之内。

S 3 S_3 S3 可以描述为:

− ∣ c 2 T a 2 ∣ ≤ c 2 T x ≤ ∣ c 2 T a 2 ∣ -|c_2^Ta_2|\le c_2^Tx\le |c_2^Ta_2| c2Ta2c2Txc2Ta2

其中 c 2 = a 2 − a 2 T a 1 ∥ a 1 ∥ 2 2 a 1 c_2=a_2-\dfrac{a_2^Ta_1}{\|a_1\|_2^2}a_1 c2=a2a122a2Ta1a1,这个和 S 2 S_2 S2 的道理是一样的,意思是限制 x x x 在平行四边形的上下两边内。

总和起来就可以得到 2 n 2n 2n 个线性不等式的约束:

在这里插入图片描述

b

是一个多面体, x x x 的每一个分量大于等于零,然后整体由三个等式约束。

c

不是一个多面体,它是单位球( { x ∣ ∥ x ∥ 2 ≤ 1 } \{x|\|x\|_2\le 1\} {xx21})和非负象限 R + n \mathbf{R}_+^n R+n 的相交部分。根据柯西-施瓦茨不等式:

x T y ≤ 1 for all  y with  ∥ y ∥ 2 = 1 ⟺ ∥ x ∥ 2 ≤ 1 x^Ty\le 1\text{ for all }y\text{ with }\|y\|_2=1\iff\|x\|_2\le 1 xTy1 for all y with y2=1x21

多面体的定义是多个半空间的相交部分,这里是无穷多个半平面的相交。

d

是一个多面体, S S S 是集合 { x ∣ ∣ x k ∣ ≤ 1 , k = 1 , . . . , n } \{x||x_k|\le1,k=1,...,n\} {xxk1,k=1,...,n} 与非负象限 R + n \mathbf{R}_+^n R+n 的交集,即证明:

x T y ≤ 1 for all  y with  ∑ i = 1 n ∣ y i ∣ = 1 ⟺ ∣ x i ∣ ≤ 1 , i = 1 , . . . , n x^Ty\le 1\text{ for all }y\text{ with }\sum_{i=1}^n|y_i|=1\iff|x_i|\le 1,i=1,...,n xTy1 for all y with i=1nyi=1xi1,i=1,...,n

首先假设 ∣ x i ∣ ≤ 1 |x_i|\le1 xi1 ,则有:

x T y = ∑ i x i y i ≤ ∑ i ∣ x i ∣ ∣ y i ∣ ≤ ∑ i ∣ y i ∣ = 1 x^Ty=\sum_{i}x_iy_i\le\sum_i|x_i||y_i|\le\sum_{i}|y_i|=1 xTy=ixiyiixiyiiyi=1

然后再假设 x x x 是一个满足 x T y ≤ 1 , ∑ i ∣ y i ∣ = 1 x^Ty\le 1,\sum_i|y_i|=1 xTy1,iyi=1 的一个非零向量,令 ∣ x k ∣ = max ⁡ i ∣ x i ∣ |x_k|=\max_i|x_i| xk=maxixi ,并令 y k x k = ∣ x k ∣ , y i = 0 ( i ≠ k ) y_kx_k=|x_k|,y_i=0(i\not=k) ykxk=xk,yi=0(i=k),则有:

x T y = ∑ i x i y i = y k x k = ∣ x k ∣ = max ⁡ i ∣ x i ∣ x^Ty=\sum_ix_iy_i=y_kx_k=|x_k|=\max_i|x_i| xTy=ixiyi=ykxk=xk=imaxxi

max ⁡ i ∣ x i ∣ ≤ 1 \max_i|x_i|\le1 maxixi1,因此可以用有限的线性不等式来表示 S S S,即为非负象限与 { x ∣ − 1 ⪯ x ⪯ 1 } \{x|-\mathbf{1}\preceq x\preceq\mathbf{1}\} {x1x1} 之间的交集,即 2 n 2n 2n 个线性不等式的解:

在这里插入图片描述

2.13

在这里插入图片描述
外积的圆锥壳:考虑秩为 k k k 的外积的集合,定义为 { X X T ∣ X ∈ R n × k , r a n k X = k } \{XX^T|X\in\mathbf{R}^{n\times k},\mathbf{rank}\ X=k\} {XXTXRn×k,rank X=k}。描述其圆锥壳。

首先可以知道 X X T ⪰ 0 XX^T\succeq0 XXT0,并且 r a n k ( X X T ) = k \mathbf{rank}(XX^T)=k rank(XXT)=k,也就是说题目中这个集合就是秩为 k k k 的半正定矩阵的集合,先说答案:这个集合的圆锥壳是秩 ≥ k \ge k k 的半正定矩阵集合再并上零矩阵。

一个集合的圆锥壳记为该集合元素的正组合,假设组合的秩 < k <k <k,即令 A , B A,B A,B 为秩为 k k k 的半正定矩阵, r a n k ( A + B ) = r < k \mathbf{rank}(A+B)=r<k rank(A+B)=r<k,令 V ∈ R n × ( n − r ) V\in\mathbf{R}^{n\times(n-r)} VRn×(nr) A + B A+B A+B 零空间中的向量组成的矩阵,即 R ( V ) = N ( A + B ) \mathcal{R}(V)=\mathcal{N}(A+B) R(V)=N(A+B),即:

V T ( A + B ) V = V T A V + V T B V = 0 V^T(A+B)V=V^TAV+V^TBV=0 VT(A+B)V=VTAV+VTBV=0

又因为 A , B ⪰ 0 A,B\succeq0 A,B0,因此 V T A V = V T B V = 0 V^TAV=V^TBV=0 VTAV=VTBV=0,所以 r a n k A ≤ r , r a n k B ≤ r \mathbf{rank}\ A\le r,\mathbf{rank}\ B\le r rank Ar,rank Br ,与之前 A , B A,B A,B 的秩为 k k k 的假设矛盾!

因此该集合的的圆锥壳是秩 ≥ k \ge k k 的半正定矩阵集合再并上零矩阵。

2.22

在这里插入图片描述
分离超平面定理(sepqrating hyperplane theorem)说的是:假设 C , D C,D C,D 是非空的不相交的凸集,即 C ∩ S = ∅ C\cap S=\varnothing CS=,则存在 a ≠ 0 , b a\not=0,b a=0,b 使得 a T x ≤ b , x ∈ C a^Tx\le b,x\in C aTxb,xC 以及 a T x ≥ b , x ∈ D a^Tx\ge b,x\in D aTxb,xD 成立。也就是说仿射函数 a T x − b a^Tx-b aTxb C C C 上非正,在 D D D 上非负。超平面 { x ∣ a T x = b } \{x|a^Tx=b\} {xaTx=b} 被称作 C , D C,D C,D 的分离超平面,如下图所示:

在这里插入图片描述
在原始的证明中证明的是假如两个集合中存在某两个点的距离刚好等于两个集合的距离,那么这两个集合之间存在分离超平面,关键在于两个集合间距离的定义为:

d i s t ( C , D ) = i n f { ∥ u − v ∥ 2 ∣ u ∈ C , v ∈ D } \mathbf{dist}(C,D)=\mathrm{inf}\{\|u-v\|_2|u\in C,v\in D\} dist(C,D)=inf{uv2uC,vD}

其中 i n f \mathrm{inf} inf 表示下确界,意思是小于等于集合中所有元素的最大值,对于明确存在最小值的集合来说,这个下确界就等于集合中的最小值,而对于开集来说,比如 { x ∣ 1 < x < 3 } \{x|1<x<3\} {x1<x<3} ,该集合的下确界就为 1 1 1 ,但是 1 1 1 并不在这个集合中。所以书本中的证明只在 C , D C,D C,D 是闭集,并且其中一个集合是有界的情况下才成立,这道题目要求证明的就是更加一般的情况,也就是考虑 C , D C,D C,D 集合为开,在这两个集合中不能找出两个元素之间的距离刚好等于两个集合之间的距离。

要分成两种情况进行讨论:

  1. 假设 0 ∉ c l S 0\not\in\mathbf{cl}\ S 0cl S ,即 0 0 0 不在集合 S S S 的闭包上, S S S 的闭包指的是 S S S 的内部点连通其边界上的点形成的集合,假如 S S S 本身就是闭集,那么闭包就等于它自己,假如是开的,那么闭包就等于它自己并上它的边界。此时对集合 { 0 } \{0\} {0} c l S \mathbf{cl}\ S cl S 应用已经证明过的部分,即在集合 { 0 } \{0\} {0} 和集合 c l S \mathbf{cl}\ S cl S 之间是存在分离超平面的(因为这两个集合都是闭集且其中有一个集合有界!),因此存在 a ≠ 0 a\not=0 a=0 使得
    a T ( x − y ) > 0 a^T(x-y)>0 aT(xy)>0
    对于所有 x − y ∈ c l S x-y\in\mathbf{cl}\ S xycl S 成立,因此对于所有 x − y ∈ S x-y\in S xyS a T x > a T y a^Tx>a^Ty aTx>aTy 对于所有 x ∈ C , y ∈ D x\in C,y\in D xC,yD 成立。

  2. 假设 0 ∈ c l S 0\in\mathbf{cl}\ S 0cl S ,由于 0 ∉ S 0\not\in S 0S (两集合不相交),因此 0 0 0 肯定在 S S S 的边界上,因此这样一来我们就不能用第一种情况里的方法了,因为 c l S \mathbf{cl}\ S cl S { 0 } \{0\} {0} 这两个集合是重叠的,无法应用书中已经证明的部分。再分情况进行讨论:假如 S S S 的内部是空的,也就是说,他在一个超平面 { z ∣ a T z = b } \{z|a^Tz=b\} {zaTz=b} 中,又因为这个超平面通过原点,因此 b = 0 b=0 b=0,因此对于所有 x ∈ C , y ∈ D x\in C,y\in D xC,yD,我们都有 a T x = a T y a^Tx=a^Ty aTx=aTy,这就是一个很 trivial 的分离超平面(这个例子可以脑补一下,就是两个集合 C , D C,D C,D 是紧紧贴在这个超平面两侧的,他们中的元素无限接近这个超平面,但是永远到不了);然后再假如 S S S 的内部不空(也就是说这两个集合只有一小部分是相互无限贴近的,其他部分中间可以离得比较远。。脑补脑补),然后考虑集合 S − ϵ = { z ∣ B ( z , ϵ ) ⊆ S } S_{-\epsilon}=\{z|B(z,\epsilon)\sube S\} Sϵ={zB(z,ϵ)S} ,其中 B ( z , ϵ ) B(z,\epsilon) B(z,ϵ) 是中心为 z z z ,半径为 ϵ > 0 \epsilon>0 ϵ>0 的欧几里得球,直观来讲,这个集合就是把原集合 S S S 向里面收缩了 ϵ \epsilon ϵ ,这样得到的效果就是 c l S − ϵ \mathbf{cl}\ S_{-\epsilon} cl Sϵ 是闭集且凸,并且该集合不包含 0 0 0,因此我们就可以再愉快地用课本上已经证明过的部分啦,该集合可以用一个法线向量为 a ( ϵ ) a(\epsilon) a(ϵ) 的超平面与 { 0 } \{0\} {0} 分隔开: a ( ϵ ) T z > 0 for all  z ∈ S − ϵ a(\epsilon)^Tz>0\text{ for all }z\in S_{-\epsilon} a(ϵ)Tz>0 for all zSϵ ,不失一般性,我们可以假设 ∥ a ( ϵ ) ∥ 2 = 1 \|a(\epsilon)\|_2=1 a(ϵ)2=1。现在令 ϵ k , k = 1 , 2 , . . . \epsilon_k,k=1,2,... ϵk,k=1,2,... 为一个正序列,并有 lim ⁡ k → ∞ ϵ k = 0 \lim_{k\to\infty}\epsilon_k=0 limkϵk=0,由于 ∥ a ( ϵ k ) ∥ 2 = 1 \|a(\epsilon_k)\|_2=1 a(ϵk)2=1 ,因此序列 a ( ϵ k ) a(\epsilon_k) a(ϵk) 是收敛的,定义这个序列最终可以收敛到 a ˉ \bar{a} aˉ ,于是对于所有的 k k k a ( ϵ k ) T z > 0 for all  z ∈ S − ϵ k a(\epsilon_k)^Tz>0\text{ for all }z\in S_{-\epsilon_k} a(ϵk)Tz>0 for all zSϵk ,因此对于所有 z ∈ i n t S z\in\mathbf{int}\ S zint S a ˉ T z > 0 \bar{a}^Tz>0 aˉTz>0,也就是对于所有的 z ∈ S z\in S zS a ˉ T z ≥ 0 \bar{a}^Tz\ge 0 aˉTz0 ,即对于所有的 x ∈ C , y ∈ D x\in C,y\in D xC,yD a ˉ T x ≥ a ˉ T y \bar{a}^Tx\ge\bar{a}^Ty aˉTxaˉTy

A1.5

在这里插入图片描述
在这里插入图片描述
本题要证明两个闭凸锥交集的对偶等于各自对偶的和。即令 C , D C,D C,D R n \mathbf{R}^n Rn 上的闭凸锥,证明:

( C ∩ D ) ∗ = C ∗ + D ∗ (C\cap D)^*=C^*+D^* (CD)=C+D

其中 + + + 表示集合加法: C ∗ + D ∗ C^*+D^* C+D { u + v ∣ u ∈ C ∗ , v ∈ D ∗ } \{u+v|u\in C^*,v\in D^*\} {u+vuC,vD} ,证明步骤如下:

  1. 证明 C ∩ D C\cap D CD C ∗ + D ∗ C^*+D^* C+D 为凸锥(实际上,这两个是闭的,但是不要求证明)
  2. 证明 ( C ∩ D ) ∗ ⊇ C ∗ + D ∗ (C\cap D)^*\supseteq C^*+D^* (CD)C+D
  3. 然后证明 ( C ∩ D ) ∗ ⊆ C ∗ + D ∗ (C\cap D)^*\subseteq C^*+D^* (CD)C+D ,证明思路是:首先证明
    ( C ∩ D ) ∗ ⊆ C ∗ + D ∗ ⟺ C ∩ D ⊇ ( C ∗ + D ∗ ) ∗ (C\cap D)^*\subseteq C^*+D^*\iff C\cap D\supseteq(C^*+D^*)^* (CD)C+DCD(C+D)
    其中可以使用以下结论:如果 K K K 是一个闭凸锥,那么 K ∗ ∗ = K K^{**}=K K=K ,之后再证明: C ∩ D ⊇ ( C ∗ + D ∗ ) ∗ C\cap D\supseteq(C^*+D^*)^* CD(C+D) ,最后得到结论 ( C ∩ D ) ∗ = C ∗ + D ∗ (C\cap D)^*=C^*+D^* (CD)=C+D
  4. 证明多面体锥 V = { x ∣ A x ⪰ 0 } V=\{x|Ax\succeq0\} V={xAx0} 得对偶可以表示为:
    V ∗ = { A T v ∣ v ⪰ 0 } V^*=\{A^Tv|v\succeq0\} V={ATvv0}

解答:

  1. 证明 C ∩ D C\cap D CD C ∗ + D ∗ C^*+D^* C+D 为凸锥:假设 x ∈ C ∩ D x\in C\cap D xCD ,这意味着 x ∈ C x\in C xC x ∈ D x\in D xD ,还意味着对于任意 θ ≥ 0 \theta\ge0 θ0 来说, θ x ∈ C \theta x\in C θxC 以及 θ x ∈ D \theta x\in D θxD ,因此对于任意的 θ ≥ 0 \theta\ge0 θ0,有 θ x ∈ C ∩ D \theta x\in C\cap D θxCD ,故 C ∩ D C\cap D CD 是一个锥,并且它是凸的,因为两个凸集的交集仍是凸集。为了证明 C ∗ + D ∗ C^*+D^* C+D 是一个闭凸锥,注意到 C ∗ C^* C D ∗ D^* D 都是凸锥,因此 C ∗ + D ∗ C^*+D^* C+D C ∗ ∩ D ∗ C^*\cap D^* CD 的锥包,因此是一个凸锥。
  2. 证明 ( C ∩ D ) ∗ ⊇ C ∗ + D ∗ (C\cap D)^*\supseteq C^*+D^* (CD)C+D:假设 x ∈ C ∗ + D ∗ x\in C^*+D^* xC+D ,我们可以把 x x x 写成 x = u + v x=u+v x=u+v ,其中 u ∈ C ∗ , v ∈ D ∗ u\in C^*,v\in D^* uC,vD ,根据对偶锥的定义,对于所有 y ∈ C y\in C yC u T y ≥ 0 u^Ty\ge0 uTy0,对于所有 y ∈ D y\in D yD v T y ≥ 0 v^Ty\ge0 vTy0 ,可以推出对于所有 y ∈ C ∩ D y\in C\cap D yCD x T y = u T y + v T y ≥ 0 x^Ty=u^Ty+v^Ty\ge0 xTy=uTy+vTy0 ,这意味着 x ∈ ( C ∩ D ) ∗ x\in(C\cap D)^* x(CD) ,因此 ( C ∩ D ) ∗ ⊇ C ∗ + D ∗ (C\cap D)^*\supseteq C^*+D^* (CD)C+D
  3. 证明 ( C ∩ D ) ∗ ⊆ C ∗ + D ∗ (C\cap D)^*\subseteq C^*+D^* (CD)C+D:已经证过 C ∩ D C\cap D CD C ∗ + D ∗ C^*+D^* C+D 是闭凸锥,这意味着 ( C ∩ D ) ∗ ∗ = C ∩ D (C\cap D)^{**}=C\cap D (CD)=CD ,因此有:
    ( C ∩ D ) ∗ ⊆ C ∗ + D ∗ ⟺ C ∩ D ⊇ ( C ∗ + D ∗ ) ∗ (C\cap D)^*\subseteq C^*+D^*\iff C\cap D\supseteq(C^*+D^*)^* (CD)C+DCD(C+D)
    假设 x ∈ ( C ∗ + D ∗ ) ∗ x\in(C^*+D^*)^* x(C+D),则对于所有 y = u + v y=u+v y=u+v x T y ≥ 0 x^Ty\ge0 xTy0,其中 u ∈ C ∗ , v ∈ D ∗ u\in C^*,v\in D^* uC,vD ,可以写为对于所有的 u ∈ C ∗ , v ∈ D ∗ u\in C^*,v\in D^* uC,vD x T u + x T v ≥ 0 x^Tu+x^Tv\ge0 xTu+xTv0 。因为 0 ∈ C ∗ 0\in C^* 0C 并且 0 ∈ D ∗ 0\in D^* 0D ,令 v = 0 v=0 v=0,则对于所有的 u ∈ C ∗ u\in C^* uC x T u ≥ 0 x^Tu\ge0 xTu0,令 u = 0 u=0 u=0,则对于所有的 v ∈ D ∗ v\in D^* vD x T v ≥ 0 x^Tv\ge0 xTv0。这样可以推出 x ∈ C ∗ ∗ = C x\in C^{**}=C xC=C 并且 x ∈ D ∗ ∗ = D x\in D^{**}=D xD=D ,即 x ∈ C ∩ D x\in C\cap D xCD 。因此原式证毕。
  4. 证明多面体锥 V = { x ∣ A x ⪰ 0 } V=\{x|Ax\succeq0\} V={xAx0} 的对偶可以表示为: V ∗ = { A T v ∣ v ⪰ 0 } V^*=\{A^Tv|v\succeq0\} V={ATvv0}:使用本题证明的式子,可以得到:
    V ∗ = { x ∣ a 1 T x ≥ 0 } ∗ + ⋯ + { x ∣ a m T x ≥ 0 } ∗ V^*=\{x|a_1^Tx\ge0\}^*+\cdots+\{x|a_m^Tx\ge0\}^* V={xa1Tx0}++{xamTx0}
    其中 { x ∣ a i T x ≥ 0 } \{x|a_i^Tx\ge0\} {xaiTx0} 的对偶是集合 { θ a i ∣ θ ≥ 0 } \{\theta a_i|\theta\ge0\} {θaiθ0} (注:其中 θ \theta θ 为常数,半平面的对偶是法线所在的射线,脑补一下~),因此我们得到:
    V ∗ = { θ a 1 ∣ θ ≥ 0 } + ⋯ + { θ a m ∣ θ ≥ 0 } = { θ 1 a 1 + ⋯ + θ m a m ∣ θ i ≥ 0 , i = 1 , . . . , m } = { A T θ ∣ θ ⪰ 0 } \begin{aligned} V^*&=\{\theta a_1|\theta\ge0\}+\cdots+\{\theta a_m|\theta\ge0\}\\ &=\{\theta_1a_1+\cdots+\theta_ma_m|\theta_i\ge0,i=1,...,m\}\\ &=\{A^T\mathbf{\theta}|\theta\succeq0\} \end{aligned} V={θa1θ0}++{θamθ0}={θ1a1++θmamθi0,i=1,...,m}={ATθθ0}
    即: V ∗ = { A T v ∣ v ⪰ 0 } V^*=\{A^Tv|v\succeq0\} V={ATvv0} (妙啊!)

A1.9

在这里插入图片描述
确定以下 S n \mathbf{S}^n Sn 的子集是否为凸集:

(a) 相关矩阵的集合: C n = { C ∈ S + n ∣ C i i = 1 , i = 1 , . . . , n } \mathcal{C}^n=\{C\in\mathbf{S}_+^n|C_{ii}=1,i=1,...,n\} Cn={CS+nCii=1,i=1,...,n}

(b) 非负相关矩阵的集合: { C ∈ C n ∣ C i j ≥ 0 , i , j = 1 , . . . , n } \{C\in\mathcal{C}^n|C_{ij}\ge0,i,j=1,...,n\} {CCnCij0,i,j=1,...,n}

(c) 高相关性的相关矩阵的集合: { C ∈ C n ∣ C i j ≥ 0.8 , i , j = 1 , . . . , n } \{C\in\mathcal{C}^n|C_{ij}\ge0.8,i,j=1,...,n\} {CCnCij0.8,i,j=1,...,n}

(a) 令 X ∈ C n , Y ∈ C n X\in\mathcal{C}^n,Y\in\mathcal{C}^n XCn,YCn, 因此有 X ∈ S + n X\in\mathbf{S}_+^n XS+n (也就是说 X X X 是一个半正定矩阵),并且 X i i = 1 , i = 1 , . . . , n X_{ii}=1,i=1,...,n Xii=1,i=1,...,n,而且 Y ∈ S + n , Y i i = 1 , i = 1 , . . . , n Y\in \mathcal{S}_+^n,Y_{ii}=1,i=1,...,n YS+n,Yii=1,i=1,...,n ,考虑 Z = θ X + ( 1 − θ ) Y , θ ∈ [ 0 , 1 ] Z=\theta X+(1-\theta)Y,\theta\in[0,1] Z=θX+(1θ)Y,θ[0,1],显然 Z ∈ S + n Z\in \mathbf{S}_{+}^n ZS+n (因为 S + n \mathcal{S}_+^n S+n 是凸的),并且也显然有 Z i i = 1 , i = 1 , . . . , n Z_{ii}=1,i=1,...,n Zii=1,i=1,...,n ,因此有 Z ∈ C n Z\in\mathcal{C}^n ZCn ,故 C n \mathcal{C}^n Cn 是凸集。

(b) 同理,令 X , Y X,Y X,Y 都在这个集合内,考虑 Z = θ X + ( 1 − θ ) Y , θ ∈ [ 0 , 1 ] Z=\theta X+(1-\theta)Y,\theta\in[0,1] Z=θX+(1θ)Y,θ[0,1],由于已经证过 C n \mathcal{C}^n Cn 为凸集,因此 Z ∈ C n Z\in\mathcal{C}^n ZCn ,只需再验证 Z i j ≥ 0 , i , j = 1 , . . . , n Z_{ij}\ge0,i,j=1,...,n Zij0,i,j=1,...,n 是否成立,显然成立(因为 X i j ≥ 0 , Y i j ≥ 0 , i = 1 , . . . , n X_{ij}\ge0,Y_{ij}\ge0,i=1,...,n Xij0,Yij0,i=1,...,n) ,因此该集合也是凸集。

(c) 这个集合也是凸集,证明方法类似于 (b),不再赘述(手动狗头)

这篇关于Convex Optimization: 2 Convex sets 作业的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/326569

相关文章

作业提交过程之HDFSMapReduce

作业提交全过程详解 (1)作业提交 第1步:Client调用job.waitForCompletion方法,向整个集群提交MapReduce作业。 第2步:Client向RM申请一个作业id。 第3步:RM给Client返回该job资源的提交路径和作业id。 第4步:Client提交jar包、切片信息和配置文件到指定的资源提交路径。 第5步:Client提交完资源后,向RM申请运行MrAp

Java高级Day38-网络编程作业

112.网络编程作业 //1.使用字符流的方式,编写一个客户端程序和服务器端程序//2.客户端发送"name",服务器端接收到后,返回"我是nova"//3.客户端发送"hobby",服务器端接收到后,返回"编写java程序"//4.不是这两个问题,回复"你说啥呢"​​===============//客户端//===============public class SocketT

0906作业+思维导图梳理

一、作业: 1、创捷一个类似于qq登录的界面 1)源代码 #include "widget.h"#include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget){ui->setupUi(this);//QPushbutton:登录、退出this->join = new QP

2024.9.6 作业

1> 手写unique_ptr指针指针 #include <iostream>using namespace std;template <typename T>class my_unique_ptr{public:explicit my_unique_ptr(T *p = nullptr) noexcept // 构造函数{ptr = p;}~my_unique_ptr() noexcep

9月6号作业

1:.h文件 #ifndef MAINWINDOW_H #define MAINWINDOW_H #include <QMainWindow> #include <QWidget> #include<QIcon> //图标类 #include<QLabel> //标签类 #include<QMovie> //动图类 #include<QLineEdit> //行编辑器类

Flink实例(六十九): flink 作业提交(四)总结

独立集群提交 # 启动集群bin/start-cluster.sh# 提交job./bin/flink run ./examples/batch/WordCount.jar --input hdfs:/user/yuan/input/wc.count --output hdfs:/user/yuan/swwwttt yarn session # 启动集群./bin/

【#第三期实战营闯关作业 ## 茴香豆:企业级知识库问答工具】

今天学习了《 茴香豆:企业级知识库问答工具》这一课,对大模型的应用有了更深得认识。以下是记录本课实操过程及截图: 搭建茴香豆虚拟环境: 输入以下命令 ``studio-conda -o internlm-base -t huixiangdou 成功安装虚拟环境截图 安装茴香豆 cd /root 克隆代码仓库 git clone https://github.com/internlm/h

Quartz 作业调度器

1、Quartz  java实现  注:这里使用的是Quartz1.6.5版本(包:quartz-1.6.5.jar)   [java]  view plain copy //测试main函数   //QuartzTest.java   package quartzPackage;         import java.text.SimpleDateFormat

清华MEM作业-利用管理运筹学的分析工具slover求解最优解的实现 及 通过使用文件或者套节字来识别进程的fuser命令

一、清华MEM作业-利用管理运筹学的分析工具slover求解最优解的实现         最近又接触了一些线性求解的问题,以前主要都是在高中数学里接触到,都是使用笔算,最后通过一些函数式得出最小或者最大值,最近的研究生学业上接触到了一个Excel solver分析工具,对这种线性求最优解的问题感觉使用起来真是得心应手。在使用这个工具前,EXCEL里需要先装上solver工具,装起来很也简单,网上

opencv作业

作业下载地址: 链接:http://pan.baidu.com/s/1qYQnbkw 密码:v7y9