機(jī)器學(xué)習(xí)——常見的損失函數(shù)

通常機(jī)器學(xué)習(xí)每一個算法中都會有一個目標(biāo)函數(shù),算法的求解過程是通過對這個目標(biāo)函數(shù)優(yōu)化的過程究珊。在分類或者回歸問題中婴氮,常使用損失函數(shù)(代價函數(shù))作為其目標(biāo)函數(shù)。損失函數(shù)用來評價模型的預(yù)測值和真實值不一樣的程度许帐,損失函數(shù)越小劳坑,通常模型的性能越好。不同的算法使用的損失函數(shù)不一樣成畦。

損失函數(shù)分為經(jīng)驗風(fēng)險損失函數(shù)和結(jié)構(gòu)風(fēng)險損失函數(shù)泡垃。經(jīng)驗風(fēng)險損失函數(shù)指預(yù)測結(jié)果和實際結(jié)果的差別,結(jié)構(gòu)風(fēng)險損失函數(shù)是指經(jīng)驗風(fēng)險損失函數(shù)加上正則項羡鸥。通常表示為如下:



上式中的第二項就是正則項蔑穴,它可以是L1,也可以是L2惧浴,或者其他的正則函數(shù)存和。

參數(shù)越多,模型越復(fù)雜衷旅,而越復(fù)雜的模型越容易過擬合捐腿。過擬合就是說模型在訓(xùn)練數(shù)據(jù)上的效果遠(yuǎn)遠(yuǎn)好于在測試集上的性能。此時可以考慮正則化柿顶,通過設(shè)置正則項前面的hyper parameter茄袖,來權(quán)衡損失函數(shù)和正則項,減小參數(shù)規(guī)模嘁锯,達(dá)到模型簡化的目的宪祥,從而使模型具有更好的泛化能力。

0-1損失函數(shù)

0-1損失是指家乘,預(yù)測值和目標(biāo)值不相等為1蝗羊,否則為0:



感知機(jī)就是用的這種損失函數(shù)。但是由于相等這個條件太過嚴(yán)格仁锯,因此我們可以放寬條件耀找,即滿足 |Y?f(X)|<T 時認(rèn)為相等。



該損失函數(shù)不考慮預(yù)測值和真實值的誤差程度业崖,也就是只要預(yù)測錯誤野芒,預(yù)測錯誤差一點(diǎn)和差很多是一樣的蓄愁。

絕對值損失函數(shù)

log對數(shù)損失函數(shù)(邏輯回歸)

邏輯斯蒂回歸的損失函數(shù)就是對數(shù)損失函數(shù),在邏輯斯特回歸的推導(dǎo)中狞悲,它假設(shè)樣本服從伯努利分布(0-1)分布涝登,然后求得滿足該分布的似然函數(shù),接著用對數(shù)求極值效诅。邏輯斯蒂回歸并沒有求對數(shù)似然函數(shù)的最大值胀滚,而是把極大化當(dāng)做一個思想,進(jìn)而推導(dǎo)它的風(fēng)險函數(shù)為最小化的負(fù)的似然函數(shù)乱投。從損失函數(shù)的角度上咽笼,它就成為了log損失函數(shù)。


P(Y|X)通俗的解釋就是:在當(dāng)前模型的基礎(chǔ)上戚炫,對于樣本X剑刑,其預(yù)測值為Y,也就是預(yù)測正確的概率双肤。由于概率之間的同時滿足需要使用乘法施掏,為了將其轉(zhuǎn)化為加法,我們將其取對數(shù)茅糜。最后由于是損失函數(shù)七芭,所以預(yù)測正確的概率越高,其損失值應(yīng)該是越小蔑赘,因此再加個負(fù)號取個反狸驳。

在極大似然估計中,通常都是先取對數(shù)再求導(dǎo)缩赛,再找極值點(diǎn)耙箍,這樣做是方便計算極大似然估計。損失函數(shù)L(Y,P(Y|X))是指樣本X在分類Y的情況下酥馍,使概率P(Y|X)達(dá)到最大值(利用已知的樣本分布辩昆,找到最大概率導(dǎo)致這種分布的參數(shù)值)

由于邏輯回歸是服從伯努利分布(0-1分布)的,并且邏輯回歸返回的sigmoid值是處于(0,1)區(qū)間旨袒,不會取到0,1兩個端點(diǎn)汁针。因此我們能夠?qū)⑵鋼p失函數(shù)寫成以下形式:



邏輯回歸最后得到的目標(biāo)式子(所有樣本的損失函數(shù))如下:



如果是二分類的話,則m值等于2峦失,如果是多分類扇丛,m就是相應(yīng)的類別總個數(shù)术吗。這里需要解釋一下:之所以有人認(rèn)為邏輯回歸是平方損失尉辑,是因為在使用梯度下降來求最優(yōu)解的時候,它的迭代式子與平方損失求導(dǎo)后的式子非常相似较屿,從而給人一種直觀上的錯覺隧魄。

平方損失函數(shù)(最小二乘法)

最小二乘法是線性回歸的一種方法卓练,它將回歸的問題轉(zhuǎn)化為了凸優(yōu)化的問題。在線性回歸中购啄,它假設(shè)樣本和噪聲都服從高斯分布(為什么假設(shè)成高斯分布呢襟企?其實這里隱藏了一個小知識點(diǎn),就是中心極限定理)狮含,最后通過極大似然估計(MLE)可以推導(dǎo)出最小二乘式子顽悼。

最小二乘法的基本原則是:最優(yōu)擬合曲線應(yīng)該使得所有點(diǎn)到回歸直線的距離和最小。通常用歐幾里得距離進(jìn)行距離的度量几迄。平方損失的損失函數(shù)為:



為什么它會選擇使用歐式距離作為誤差度量呢(即Mean squared error蔚龙, MSE),主要有以下幾個原因:

簡單映胁,計算方便木羹;
歐氏距離是一種很好的相似性度量標(biāo)準(zhǔn);
在不同的表示域變換后特征性質(zhì)不變解孙。

指數(shù)損失函數(shù)(Adaboost)

Hinge損失函數(shù)(SVM)

Hinge損失函數(shù)和SVM是息息相關(guān)的坑填。在線性支持向量機(jī)中,最優(yōu)化問題可以等價于 :


這個式子和如下的式子非常像:


其中l(wèi)(wxi+byi)就是hinge損失函數(shù)弛姜,后面相當(dāng)于L2正則項脐瑰。
Hinge函數(shù)的標(biāo)準(zhǔn)形式:

全局損失函數(shù)

上面的損失函數(shù)僅僅是對于一個樣本來說的。而我們的優(yōu)化目標(biāo)函數(shù)應(yīng)當(dāng)是使全局損失函數(shù)最小廷臼。因此蚪黑,全局損失函數(shù)往往是每個樣本的損失函數(shù)之和,即:



對于平方損失函數(shù)中剩,為了求導(dǎo)方便忌穿,我們可以在前面乘上一個1/2,和平方項求導(dǎo)后的2抵消结啼,即:


參考資料
https://blog.csdn.net/weixin_37933986/article/details/68488339
https://www.cnblogs.com/luxiao/p/5783017.html
https://blog.csdn.net/qq547276542/article/details/77980042

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末掠剑,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子郊愧,更是在濱河造成了極大的恐慌朴译,老刑警劉巖束莫,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件旱捧,死亡現(xiàn)場離奇詭異行剂,居然都是意外死亡油湖,警方通過查閱死者的電腦和手機(jī)倔韭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進(jìn)店門链蕊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來祥得,“玉大人郁竟,你說我怎么就攤上這事〗品辏” “怎么了宁舰?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長奢浑。 經(jīng)常有香客問我蛮艰,道長,這世上最難降的妖魔是什么雀彼? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任壤蚜,我火速辦了婚禮,結(jié)果婚禮上徊哑,老公的妹妹穿的比我還像新娘仍律。我一直安慰自己,他們只是感情好实柠,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布水泉。 她就那樣靜靜地躺著,像睡著了一般窒盐。 火紅的嫁衣襯著肌膚如雪草则。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天蟹漓,我揣著相機(jī)與錄音炕横,去河邊找鬼。 笑死葡粒,一個胖子當(dāng)著我的面吹牛份殿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播嗽交,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼卿嘲,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了夫壁?” 一聲冷哼從身側(cè)響起拾枣,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎盒让,沒想到半個月后梅肤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡邑茄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年姨蝴,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片肺缕。...
    茶點(diǎn)故事閱讀 40,498評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡左医,死狀恐怖授帕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情炒辉,我是刑警寧澤豪墅,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布泉手,位于F島的核電站黔寇,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏斩萌。R本人自食惡果不足惜缝裤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望颊郎。 院中可真熱鬧憋飞,春花似錦、人聲如沸姆吭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽内狸。三九已至检眯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間昆淡,已是汗流浹背锰瘸。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留昂灵,地道東北人避凝。 一個月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像眨补,于是被迫代替她去往敵國和親管削。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評論 2 359

推薦閱讀更多精彩內(nèi)容