『最优化理论、建模与算法』凸函数准备部分
本文最后更新于:2021年10月16日 晚上
凸函数-pre
本章主要介绍凸函数相关的知识,由于课时的原因将会分为上下两节,本博客为上,主要介绍凸函数相关的基本概念,凸函数的基本性质与判定定理。
再次意识到自己写的有一点过于麻烦。,开始尝试简化一下,。
基本定义
由于本人好多东西也都忘了。。以及当时学的时候很多的形式与当前的形式也不尽相同。所以下面会列举不少相对比较基础的概念
数学分析相关定义
-
梯度
给定函数,且在点的邻域内有意义,若存在向量满足
其中是任意方向的向量范数,则称在处可微可微,为在处的梯度若对于区域的每个点都存在, 则在区域上可微
基本表示如下
-
矩阵
若函数,在点处的二阶偏导数都存在
则 下图被称在处的矩阵
若在区域上的每一点都存在,则称在区域上二阶可微,若在区域上连续,称在区域上二阶连续可微,也可证明此时矩阵是对称矩阵
-
多元函数的展开
当函数是连续可微的,对向量,有
其中,, 若在区域上二阶连续可微,则
其中,
-
连续
对可微函数,若存在,对任意有如下条件
则称是梯度 连续的,也称光滑,
个人觉得此条件相对而言是一个比较强的条件了,往往可以一系列好的性质。一阶常微分方程的解的存在唯一定义便用到了此结论
引理 二次上界 若可微函数的定义域 而且是梯度 连续的 ,则 有二次上界
证明如下,比较好懂就不写了QAQ~~(懒得写)~~
推论 可微函数且仅有一个全局极小点, 若是梯度 连续的, 则对任意有
使用引理可直接证明。
PS在凸集中提到矩阵的二范数为最大奇异值。因此也可直接联系到此
矩阵与自动求导
-
矩阵变量函数的导数,,为梯度
则矩阵变量函数的梯度如下所示
然而矩阵范数相对较繁琐,实际中往往使用另一种可微可微
满足上式子的成为梯度
-
矩阵变量函数的导数
有线性函数
则对任意方向的 有
也因此,
类似可证 其中
有,
具体证明不懂可评论或联系作者
凸函数相关
一波基础定义来袭。。
-
广义实值函数
为广义实数空间,称映射为广义实值函数
-
适当函数
至少一处取值不是正无穷,且处处取值不是负无穷的函数
-
下水平集与上方图
下水平集:对于广义实值函数, 有
上境图:对于广义实值函数, 有
一维函数与其上境图的基本关系如下:(上方图的名字大概也由此而来
可以证明对于某函数的上方图是凸集的充要条件为该函数为凸函数
个人证明如下,不太严谨。。
必要性:
显然,对上方图的两点,其中
则对于两点间的任意一点 ,显然
并且也在上方图中,于是 ,
从而 得证
充分性
如果,有 则由于是凸集,则
$$(\theta x_1+(1-\theta )x_2, \ \theta y_1+(1-\theta) y_2)\in epi\ f\
f(\theta x_1+(1-\theta )x_2)\le \theta y_1+(1-\theta)y_2$$ 且是任意选取的,则充分性得证
-
闭函数
设广义实值函数, 若为闭集,则为闭函数
-
下半连续函数
设广义实值函数, 若对任意的有 则成为下半连续函数
不过可以证明的是闭函数与下半连续函数是等价的,有如下等价命题
- 函数的任意下水平集是闭集
- 函数是下半连续的
- 函数是闭函数
下面简单 证明一下吧,其余不介绍了
假设,并且 的极限是
得证
参考资料
- 最优化:建模、算法与理论 刘浩洋,户将,李勇锋,文再文著
- 凸优化 Stephen Boyd 著
- BUAA数学系崔老师的课堂课件