凸集
线性与非线性并不是区分问题难度的根本:凸与非凸调试
本章的内容相对枯燥,主要是基本定义,为后续的凸函数打下基础
基本集合定义
-
仿射集
若通过集合C⊆Rn 中的任意两个同点的直线仍在集合C中,则称集合C是仿射的
∀x1,x2∈C,θ∈R s.t.θx1+(1−θx2)∈C
可对应定义多个点的情况
比如线性方程组Ax=b的解集X就是仿射集,
反之,任何的仿射集都可以表示成为某个线性方程组的解集
仿射包
集合C⊆Rn中的点的所有仿射组合组合成的集合成为C的仿射包
记作aff C
aff C={θ1x1+...+θkxk∣x1,..xk∈C, θ1+...+θk=1}
-
凸集
连接集合C中的任意两点的线段都在C内,则称C为凸集
∀x1,x2∈C,θ∈[0,1] s.t.θx1+(1−θx2)∈C
显然:仿射集都是凸集
-
锥
凸锥的定义如下
∀x1,...,xk∈C,θi≥0 s.t.θ1x1+...+θkxk∈C
-
超平面与半空间
超平面的表示如下所示,也可看做法线方向为a的超平面,常数决定与与原点的偏移
{x∣aTx=b}
而一个超平面则将Rn划分为两个闭的半空间,表示如下
{x∣aTx≤b}
易证半空间是凸的,(按照定义即可),但却不仿射
-
多面体
多面体可被有限个线性等式与不等式定义
P={ajT≤bj,j=1...m,cjTx=dj.1...p}
即多面体是由有限个半空间与超平面的交际。显然多面体是凸集
单纯形
Rn空间的k维单纯型
-
特殊矩阵集合与半正定锥
对称矩阵集合
Sn={X∈Rn×n∣XT=X}
半正定矩阵的集合
S+n={X∈Sn∣X≥0}
正定矩阵的集合
S++n={X∈Sn∣X>0}
显然有Sn,S+n是凸锥,而S++n不是凸锥:不包含特殊超平面
半正定椎:S+n
保凸运算
首先凸集的数乘、加以及任意的交所得到的集合都是凸集
-
交集
易证交集运算是保凸的
-
仿射变换(缩放、平移、投影)
设f:Rn→Rm 是仿射变换, 即f(x)=Ax+b,A∈Rm×n,b∈Rm
则有:
- 凸集在f下的像是凸集:S⊆Rn 是凸集 ⇒f(S)={f(x)∣x∈S}) 是凸集
- 凸集在f的原像是凸集:C⊆Rn 是凸集 ⇒f−1(C)={f(x)∣x∈C}) 是凸集
-
线性分式与透视函数的保凸性
透视变换保凸性定理:集合{(x,t)∣x∈Rn,t>0}是凸的,则透视变换得到的集合{tx∣x∈Rn,t>0}也是凸集
分式线性变换的保凸性定理:集合{x∣x∈Rn}是凸集,则下面的集合也是凸集
f(x)={cTx+dAx+b∣x∈Rn,A∈Rm×n,c∈Rn,d∈R.b∈Rm,cTx+d>0}
分离超平面定理
下面阐述一些凸集的应用:使用超平面或者仿射函数将两个不相交的凸集分离开,其结果便是超平面分离定理。基本解释如下:
有C,D两个不相交的凸集,则必然存在a=0,bs.t.∀x∈C有aTx≤b,∀x∈D,aTx≥b或者说仿射函数aTx−b在C中非正,在D中非负。则可称该超平面为C.D的分离超平面
其逆定理:存在右侧条件,则两凸集不相交同样适用较广
然而涉及到非凸集的划分问题则存在挑战,如下图所示
涉及非凸集无法被超平面划分的示例
支撑超平面定理
若C是凸集,则C的任意边界处都存在支撑超平面
PS 对偶锥等此处不做介绍了
课后习题
证明矩阵的2范数等于其最大奇异值
个人证明如下:
设矩阵A∈Rm×n, 且矩阵A的二范数的定义如下
∣∣A∣∣2=maxx∈Rn,∣∣x∣∣2=1∣∣Ax∣∣2=maxx∈Rn,∣∣x∣∣2=1(Ax)TAx
对于半正定矩阵(ATA),其对应特征向量组合可以构成R^n的一组标准正交基,则必有x=∑i=1naiαi ,其中a_i为和常量,αi为矩阵(ATA)的一个特征向量,并假设对应的特征值为λi
则有
ATAx=ATA∑i=1naiαi=∑i=1naiATAαi=∑i=1naiATAαi=∑i=1nλiaiαi
于是
(Ax)TAx=∑i=1nλiai2≤λmax
而矩阵二范数的数值为(Ax)TAx的最大值,正是其最大奇异值
其余也可查看Github项目
参考资料
- 最优化:建模、算法与理论 刘浩洋,户将,李勇锋,文再文著
- 凸优化 Stephen Boyd 著
- BUAA数学系崔老师的课堂课件