說完了凸集,下一個(gè)要將的肯定就是凸函數(shù)啦~
凸函數(shù)的相關(guān)性質(zhì)在優(yōu)化中的地位不言而喻~!
凸函數(shù)
是凸函數(shù),如果
的定義域是凸集逗嫡,并且
成立:
如果時(shí)上面的不等號嚴(yán)格成立,那么就說這個(gè)函數(shù)是嚴(yán)格凸的株依。
幾何上看驱证,凸函數(shù)要求和
這條線段位于函數(shù)圖形的上方。
對應(yīng)的恋腕,我們還有定義“凹函數(shù)”抹锄,當(dāng)是凸函數(shù)時(shí),
被稱為凹函數(shù)吗坚。
對于仿射函數(shù)祈远,它是既凸又凹的。同時(shí)商源,既凸又凹的函數(shù)只有仿射函數(shù)车份。
如果是凸函數(shù),那么
也是凸函數(shù)牡彻,反過來的結(jié)論也成立扫沼。這說明,凸函數(shù)限制在任何一條直線上都是凸庄吼!凸函數(shù)的概念完全可以從歐式空間推廣到一般的線性空間缎除,在一般的線性空間上,這條性質(zhì)成為我們判斷凸函數(shù)的重要依據(jù)总寻。
凸函數(shù)還具有良好的分析性質(zhì)器罐,比如,凸函數(shù)在它定義域的相對內(nèi)點(diǎn)集上是連續(xù)的渐行;凸函數(shù)的不連續(xù)點(diǎn)只可能出現(xiàn)在它的相對邊界上轰坊。
凸函數(shù)定義域延拓
有時(shí)候我們會把一個(gè)凸函數(shù)的定義域延拓到整個(gè)空間中:
可以證明铸董,這樣延拓的凸函數(shù)也滿足凸函數(shù)的定義。(在定義好關(guān)于的運(yùn)算后)肴沫。這樣的定義在函數(shù)表示上有一定的意義粟害。
一階條件(first order condition)
可微的凸函數(shù)滿足一階條件:
這個(gè)不等式揭示了凸函數(shù)的局部特性,那就是在一點(diǎn)的切平面是整個(gè)函數(shù)的 global underestimate 颤芬。
如果上面的不等號嚴(yán)格成立悲幅,那么這個(gè)函數(shù)是嚴(yán)格凸的。這里的條件是充分必要的站蝠。
二階條件(second order condition)
如果定義在開凸集上的二階可微函數(shù)滿足
汰具,那么
是凸函數(shù)。
如果沉衣,那么
是嚴(yán)格凸的冲簿。
當(dāng)
嚴(yán)格凸時(shí)议纯,不一定能推出
正定。比如
银萍,二階導(dǎo)數(shù)在
處為
拔疚。
關(guān)于一階條件和二階條件的證明肥隆,要用到泰勒展開。在此從略稚失。
凸函數(shù)的例子
- 指數(shù)函數(shù)栋艳、多項(xiàng)式函數(shù),絕對值函數(shù)都是凸的句各;對數(shù)函數(shù)是凹的吸占。
- 最大值函數(shù)是凸的。
對
is convex on
凿宾。有估計(jì)式:
這個(gè)函數(shù)是最大值函數(shù)的一個(gè)光滑近似矾屯。
是凹函數(shù),容易證明
是半負(fù)定的初厚。
是
上的凹函數(shù)件蚕。它是一個(gè)定義在矩陣空間上的函數(shù)。(關(guān)于它的證明产禾,參見我的另一篇文章)
下水平集(sublevel sets)
定義的
為:
易證
是凸函數(shù)的時(shí)候
是個(gè)凸集排作。
從而這里給出了判斷凸集的另一個(gè)方法:能被寫成某個(gè)凸函數(shù)的 -sublevel set 的集合是凸集。反之亚情,一個(gè)函數(shù)的 sublevel set 是凸的妄痪,并不能反推出它是凸函數(shù)(事實(shí)上這個(gè)函數(shù)是擬凸的)。
例:
是凸集楞件。
對于是凹函數(shù)有相應(yīng)的結(jié)論:
是凸集障簿。
Epigraph
一個(gè)函數(shù)的的 epigraph 是指:
是
的子集,是函數(shù)圖形的上方吮成。
是凸集當(dāng)且僅當(dāng)
是凸函數(shù)危纫。所以epigraph 也是一種主要的判斷凸函數(shù)的方法。
對應(yīng)于凹函數(shù)我們定義 hypograph:
是凸集當(dāng)且僅當(dāng)
是凹函數(shù)淌山。
例:
的 epigraph
是凸集,從而
是凸函數(shù)翻翩。類似可得
是凹函數(shù)睛低。
琴生不等式(Jesen inequality)
琴生不等式是凸函數(shù)的重要性質(zhì)瘪校。
對和
成立:
這是有限個(gè)點(diǎn)的情況信夫。該不等式還能擴(kuò)展到無限和押搪、積分等情況。
If
on
, then:
?對某些凸函數(shù)應(yīng)用琴生不等式可以得到許多著名的不等式:
比如Holder 不等式:
保持函數(shù)凸性的操作
若干凸函數(shù)非負(fù)的加權(quán)和
在 infinite 的情況下娃豹,對
是凸的焚虱,并且
,那么
是凸的懂版。
與仿射函數(shù)的復(fù)合
- 凸函數(shù)的最大值(上確界)函數(shù)
?在 infinite 的情況下鹃栽,對
是凸的,那么
也是凸的躯畴。
民鼓,凸集的交仍然是凸的,因此
也是凸的蓬抄。
事實(shí)上丰嘉,絕大多數(shù)的凸函數(shù),都能夠表示成一族仿射函數(shù)的上確界函數(shù)嚷缭,這種方法也是判斷凸函數(shù)最常用的方法饮亏。
- 一般的函數(shù)復(fù)合的情況
- 函數(shù)的透視
透視操作是保持凸(凹)性的。
- 特殊情況下的下確界函數(shù)
如果對
是凸的阅爽,
是一個(gè)非空凸集路幸,那么
是凸的。
另外付翁,也可以通過來證明凸性简肴。
共軛函數(shù)(Conjugate Function)
定義函數(shù)的共軛函數(shù)為:
共軛函數(shù)是多個(gè)仿射函數(shù)的上確界,因此是一定是凸函數(shù)百侧。共軛函數(shù)的定義域是上確界值有限的
的值砰识。
一些例子:
-
,注意到
只在
時(shí)有界佣渴,因此共軛函數(shù)只在
處有定義辫狼,并且
-
,
-
的共軛函數(shù)是
-
的共軛函數(shù)是
共軛函數(shù)具有鮮明的幾何意義:
當(dāng)是一元函數(shù)的時(shí)候观话,如上圖所示予借,
表示以
為斜率且過原點(diǎn)的直線,與
的圖像的最大距離(或者其負(fù)數(shù))。
當(dāng)是
元函數(shù)的時(shí)候灵迫,
表示以
為法向量(n+1維)且過原點(diǎn)的平面秦叛,與
的圖像的最大距離(或者其負(fù)數(shù))。
非空集合的示性函數(shù)(indicator function )
定義為:
的共軛函數(shù)是支撐函數(shù)
:
設(shè)代表
中的一種范數(shù)瀑粥,其對偶范數(shù)為
挣跋,我們能得到共軛函數(shù):
Fenchel’s inequality
根據(jù)共軛函數(shù)的定義,下式是顯然的:
應(yīng)用到上面的例子狞换,還能得到:
共軛函數(shù)的共軛
如果是凸函數(shù)避咆,并且
是閉集,那么
修噪。
可微分函數(shù)的共軛
如果是凸函數(shù)并且一階可微查库,那么根據(jù)凸函數(shù)的極值理論,容易得到黄琼,使得
最大的
滿足:
從而我們有:
欲求樊销,只需要解
得到向量
可微函數(shù)
的共軛,也叫做
的 Legendre變換脏款。
其他性質(zhì)
如果围苫,且
都是凸函數(shù),那么:
擬凸函數(shù)(Quasiconvex functions)
?擬凸函數(shù)就是所有下水平集是凸集的函數(shù)撤师。比如就不是凸函數(shù)剂府,但是是擬凸的。
上的擬凸函數(shù)剃盾,要么是單調(diào)的腺占,要么在一個(gè)點(diǎn)左邊單調(diào)遞減,右邊單調(diào)遞增痒谴。
?很多凸函數(shù)具有的良好性質(zhì)湾笛,可以推廣到擬凸函數(shù)上。
?一個(gè)定義在凸集上的函數(shù)是擬凸函數(shù)闰歪,當(dāng)且僅當(dāng),
,成立:
?這意味著蓖墅,線段上的函數(shù)值库倘,一定小于等于兩個(gè)端點(diǎn)函數(shù)值最大的那一個(gè)。這個(gè)既可以當(dāng)做擬凸函數(shù)的性質(zhì)论矾,也能當(dāng)做擬凸函數(shù)的定義教翩。(關(guān)于兩種定義等價(jià)性的證明,看這里)
針對這個(gè)性質(zhì)還有另一個(gè)版本:
一些資料上把這個(gè)當(dāng)做擬凸函數(shù)的定義贪壳,并且當(dāng)不等號嚴(yán)格成立時(shí)饱亿,稱
是嚴(yán)格擬凸的。
來看一些例子。
-
彪笼,容易看到
是不定的钻注,因此既不是凸函數(shù)也不是凹函數(shù)。但是
是凸集配猫,所以
是擬凹函數(shù)幅恋。
- 線性分式函數(shù)是擬線性的。
- 因?yàn)?img class="math-block" src="https://math.jianshu.com/math?formula=%5Coperatorname%7Brank%7D(X%2BY)%20%5Cgeq%20%5Cmin%20%5C%7B%5Coperatorname%7Brank%7D%20X%2C%20%5Coperatorname%7Brank%7D%20Y%5C%7D" alt="\operatorname{rank}(X+Y) \geq \min \{\operatorname{rank} X, \operatorname{rank} Y\}" mathimg="1">所以
是
上的擬凹函數(shù)
可微分的擬凸函數(shù)
?類似于凸函數(shù)泵肄,當(dāng)函數(shù)可微時(shí)捆交,可以推導(dǎo)出擬凸函數(shù)需要滿足的一階條件和二階條件。
一階條件
該條件也有鮮明的幾何意義腐巢。導(dǎo)出了過點(diǎn)
的對下水平集
的支撐超平面品追。(高維情況很難想象,不妨考慮一維情況冯丙,這時(shí)候支撐超平面就退化為一個(gè)點(diǎn)肉瓦,下水平集是一個(gè)區(qū)間)
注意到
對于給定的
,表示的是一個(gè)平面银还。
?雖然擬凸函數(shù)和凸函數(shù)在一階條件上具有相似性风宁,但是擬凸函數(shù)并不能用一階條件來判斷全局的最小值。當(dāng)時(shí)蛹疯,
不一定是 global minimizer.
二階條件
?這個(gè)條件戒财,意味著在
是半正定的,同時(shí)
至多有一個(gè)負(fù)特征值捺弦。(
是一維的饮寞,從而
是
維的)
如果
在
是正定的,那么才能說明
是擬凸的列吼。
保持?jǐn)M凸性的操作
- 擬凸函數(shù)非負(fù)加權(quán)和的最大值
這里就用之前提到過的第二種定義方式進(jìn)行證明即可幽崩。同樣可以推廣到逐點(diǎn)上確界的情況。
寞钥,其中
慌申,
是擬凸的,叫做
的廣義特征值理郑。
- 函數(shù)復(fù)合
對數(shù)凹/對數(shù)凸函數(shù)
?簡單講蹄溉,,并且
是凹函數(shù)您炉,那么
就稱為對數(shù)凹的柒爵。
?對數(shù)凹還可以用來定義。從這里看赚爵,凸函數(shù)可以視作一種“算術(shù)平均”棉胀,對數(shù)凸則是“幾何平均”法瑟。
?為什么要研究對數(shù)凸/凹函數(shù)呢?
?統(tǒng)計(jì)學(xué)中的似然函數(shù)唁奢,是一個(gè)經(jīng)常要取對數(shù)的函數(shù)霎挟,欲求參數(shù)的極大似然估計(jì)值,其實(shí)就是一個(gè)關(guān)于似然函數(shù)的優(yōu)化問題驮瞧,如果似然函數(shù)是對數(shù)凹的氓扛,那么求對數(shù)似然函數(shù)負(fù)值的最小值,就是一個(gè)凸優(yōu)化問題论笔!這是研究對數(shù)凹函數(shù)的目的所在采郎。
- 標(biāo)準(zhǔn)正態(tài)分布的累計(jì)分布函數(shù)
是對數(shù)凹的。
-
在
上是對數(shù)凹的狂魔。
- 多元正態(tài)概率密度函數(shù)是
是對數(shù)凹的蒜埋。
事實(shí)上,很多常見的概率分布函數(shù)最楷,都是對數(shù)凹的整份。
如果具有良好的光滑性,通過
的凹凸性籽孙,我們可以得到一些關(guān)于
的性質(zhì):
因?yàn)椋?img class="math-block" src="https://math.jianshu.com/math?formula=%5Cnabla%5E%7B2%7D%20%5Clog%20f(x)%3D%5Cfrac%7B1%7D%7Bf(x)%7D%20%5Cnabla%5E%7B2%7D%20f(x)-%5Cfrac%7B1%7D%7Bf(x)%5E%7B2%7D%7D%20%5Cnabla%20f(x)%20%5Cnabla%20f(x)%5E%7BT%7D" alt="\nabla^{2} \log f(x)=\frac{1}{f(x)} \nabla^{2} f(x)-\frac{1}{f(x)^{2}} \nabla f(x) \nabla f(x)^{T}" mathimg="1">
于是可以得到對數(shù)凹的一個(gè)充要條件:
在一元函數(shù)的情況烈评,就是:。
?此外犯建,對數(shù)凸/凹性是對乘法保持封閉的讲冠。從容易看出。如果概率密度函數(shù)是對數(shù)凹的适瓦,那么多個(gè)密度函數(shù)相乘的結(jié)果也是對數(shù)凹的竿开。
廣義不等式下的凸性
通過前面提到的廣義不等式,可以定義函數(shù)的“單調(diào)遞增”和“嚴(yán)格單調(diào)遞增”玻熙。
想想為什么
的定義不使用
例子:
-
是
上的 increasing 函數(shù)否彩。
如果
是半正定矩陣,那么
嗦随。(借助特征值證明)
-
是
上的 decreasing 函數(shù)列荔。
單調(diào)性的梯度條件
對于這種新的單調(diào)性,我們可以用廣義不等式下的梯度條件去判斷枚尼。
-
is K-nondecreasing
-
is K-increasing
?函數(shù)的梯度在對偶不等式的情況下是非負(fù)的肌毅。其實(shí)這里暗指的,就是
在
中的每一個(gè)方向都是單調(diào)遞增的姑原。
廣義不等式下的凸性
進(jìn)一步,通過廣義不等式還能把函數(shù)的凸性定義在一個(gè) proper cone 上:
值得注意的是呜舒,通常我們說的凸函數(shù)锭汛,值域是,而K-convex 的定義上,凸函數(shù)的值域被推廣到了
唤殴。
凸函數(shù)的大多數(shù)性質(zhì)般婆,可以推廣到K-convex 函數(shù)上。
因?yàn)橹涤蚴?img class="math-inline" src="https://math.jianshu.com/math?formula=R%5Em" alt="R^m" mathimg="1">朵逝,一階條件的梯度變成了 Jacobi 矩陣蔚袍。