Strong convexity and implications
在討論無(wú)約束凸優(yōu)化問(wèn)題(1)的時(shí)候,我們會(huì)假設(shè)是一個(gè)凸二次可微的函數(shù)祭犯⊙筘ぃ考慮一個(gè)起始點(diǎn)薄疚,記顯然是一個(gè)閉集。此外麻蹋,我們?cè)O(shè)為最優(yōu)值跛溉。
有時(shí)候焊切,我們還會(huì)給目標(biāo)函數(shù)加上兩個(gè)更強(qiáng)的條件扮授。
簡(jiǎn)而言之,在閉集上专肪,的Heisen矩陣的特征值有下確界刹勃。如果這個(gè)條件被滿足,由Taylor展開(kāi):
其中是線段上的一點(diǎn)嚎尤。
繼而荔仁,我們有:
這給出了函數(shù)的一個(gè)更好的下界。
另一個(gè)條件芽死,在閉集上乏梁,的Heisen矩陣的特征值有上確界(因?yàn)殚]集,保證了上確界存在)关贵。通過(guò)式(1)遇骑,我們可以得到類(lèi)似式(2)的結(jié)論:
這其實(shí)就給出了函數(shù)的一個(gè)上界。
綜合這兩個(gè)條件:
接下來(lái)我們來(lái)推導(dǎo)揖曾,加上這兩個(gè)條件落萎,有什么用。
注意到(2)式的右邊是一個(gè)關(guān)于的凸函數(shù)炭剪,在時(shí)最小练链,從而:
上式說(shuō)明,當(dāng)模長(zhǎng)很小很小的時(shí)候奴拦,跟最優(yōu)值的距離也很小很小媒鼓。雖然這個(gè)結(jié)論看起來(lái)很顯然,但是我們從數(shù)學(xué)的角度證明了它错妖!利用(5)式隶糕,我們可以通過(guò)梯度的模長(zhǎng),來(lái)控制與最優(yōu)解之間的距離站玄。
類(lèi)似的推導(dǎo)能得到更強(qiáng)的結(jié)論:
對(duì)于第二種情況:
總結(jié)一下枚驻,在一個(gè)閉集上,理想情況下株旷,凸函數(shù)的Heisen矩陣的特征值是“可控的”再登,我們從數(shù)學(xué)上推導(dǎo)出當(dāng)某處的梯度模長(zhǎng)很接近0的時(shí)候尔邓,其實(shí)離最優(yōu)解和最優(yōu)值不遠(yuǎn)了,這個(gè)“接近”的程度可以由估計(jì)式給出锉矢。盡管大部分時(shí)候我們沒(méi)有辦法確定和梯嗽,但是只要梯度足夠小,還是可以保證非常接近最優(yōu)解的沽损。