損失函數(shù) one-hot + softmax + cross-entropy 組合

分類問題和回歸問題是監(jiān)督學(xué)習(xí)的兩大種類:

  • 分類問題的目標(biāo)變量是離散的侈沪;
  • 回歸問題的目標(biāo)變量是連續(xù)的數(shù)值揭璃。

神經(jīng)網(wǎng)絡(luò)模型的效果及優(yōu)化的目標(biāo)是通過損失函數(shù)來定義的⊥ぷ铮回歸問題解決的是對具體數(shù)值的預(yù)測瘦馍。比如房價(jià)預(yù)測、銷量預(yù)測等都是回歸問題应役。這些問題需要預(yù)測的不是一個(gè)事先定義好的類別情组,而是一個(gè)任意實(shí)數(shù)燥筷。解決回顧問題的神經(jīng)網(wǎng)絡(luò)一般只有一個(gè)輸出節(jié)點(diǎn),這個(gè)節(jié)點(diǎn)的輸出值就是預(yù)測值院崇。

  • 對于回歸問題肆氓,常用的損失函數(shù)是均方誤差(MSE,Mean Squared Error)底瓣。
  • 對于分類問題谢揪,常用的損失函數(shù)為交叉熵(CE,Cross Entropy)捐凭。

交叉熵一般與one-hot和softmax在一起使用拨扶。


one-hot 編碼

在分類問題中,one-hot編碼是目標(biāo)類別的表達(dá)方式茁肠。目標(biāo)類別需要由文字標(biāo)簽患民,轉(zhuǎn)換為one-hot編碼的標(biāo)簽。one-hot向量垦梆,在目標(biāo)類別的索引位置是1匹颤,在其他位置是0。類別的數(shù)量就是one-hot向量的維度托猩。在one-hot編碼中印蓖,假設(shè)類別變量之間相互獨(dú)立。同時(shí)站刑,在多分類問題中另伍,one-hot與softmax組合使用。

import numpy as np

def prp_2_oh_array(arr):
    """
    概率矩陣轉(zhuǎn)換為OH矩陣
    arr = np.array([[0.1, 0.5, 0.4], [0.2, 0.1, 0.6]])
    :param arr: 概率矩陣
    :return: OH矩陣
    """
    arr_size = arr.shape[1]  # 類別數(shù)
    arr_max = np.argmax(arr, axis=1)  # 最大值位置
    oh_arr = np.eye(arr_size)[arr_max]  # OH矩陣
    return oh_arr

softmax

softmax使得神經(jīng)網(wǎng)絡(luò)的多個(gè)輸出值的總和為1绞旅,softmax的輸出值就是概率分布摆尝,應(yīng)用于多分類問題。softmax也屬于激活函數(shù)因悲。softmax堕汞、one-hot和cross-entropy,一般組合使用晃琳。

softmax probabilities + one-hot encoding + cross entropy
公式

cross-entropy

交叉熵(cross entropy)比較softmax輸出和one-hot編碼之間的距離讯检,即模型的輸出和真值。交叉熵是一個(gè)損失函數(shù)卫旱,錯(cuò)誤值需要被優(yōu)化至最小人灼。神經(jīng)網(wǎng)絡(luò)估計(jì)輸入數(shù)據(jù)在各個(gè)類別中的概率。最大的概率需要是正確的標(biāo)簽顾翼。

常見的損失函數(shù):

  • MSE:Mean Squared Error投放,均方誤差;
  • CE:Cross Entropy适贸,交叉熵灸芳;
公式

其中涝桅,y是真值,h是預(yù)測值烙样。

softmax和交叉熵的推導(dǎo)冯遂,參考

推導(dǎo)

C是交叉熵,z是wx+b谒获,再對w求導(dǎo)蛤肌,根據(jù)鏈?zhǔn)椒▌t,w的導(dǎo)數(shù)值究反,就是C的導(dǎo)數(shù)乘以w的導(dǎo)數(shù)寻定。

關(guān)于為什么分類不使用MSE作為損失函數(shù)儒洛?

(1) MSE+softmax所輸出的曲線是波動(dòng)的精耐,有很多局部的極值點(diǎn),即非凸優(yōu)化問題(non-convex)琅锻,參考

優(yōu)化曲線

(2) 對于正確分類的數(shù)據(jù)點(diǎn)卦停,CE梯度有一項(xiàng)趨近0,MSE中有兩項(xiàng)趨近于0恼蓬,也就是MSE的梯度消失速度是CE的平方惊完;參考

正確分類

(3) 代理損失函數(shù)(surrogate loss function),參考处硬,準(zhǔn)確率(accuray)是不連續(xù)的小槐,所以需要用連續(xù)的函數(shù)來代理,而優(yōu)化MSE荷辕,并不能優(yōu)化模型的準(zhǔn)確度凿跳。

代理損失函數(shù)

為什么回歸問題使用MSE?

最小二乘是在歐氏距離為誤差度量的情況下疮方,由系數(shù)矩陣所張成的向量空間內(nèi)對于觀測向量的最佳逼近點(diǎn)控嗜。

用歐式距離作為誤差度量的原因:

  1. 簡單。
  2. 提供了具有很好性質(zhì)的相似度的度量骡显。
  3. 非負(fù)的;
  4. 唯一確定性疆栏。只有 x=y 的時(shí)候,d(x,y)=0惫谤;
  5. 對稱的壁顶,即 d(x,y)=d(y,x);
  6. 符合三角性質(zhì)溜歪。即 d(x,z)<=d(x,y)+d(y,z).
  7. 物理性質(zhì)明確若专,在不同的表示域變換后特性不變,例如帕薩瓦爾等式痹愚。
  8. 便于計(jì)算富岳。通常所推導(dǎo)得到的問題是凸問題蛔糯,具有對稱性,可導(dǎo)性窖式。通常具有解析解蚁飒,此外便于通過迭代的方式求解。
  9. 和統(tǒng)計(jì)和估計(jì)理論具有關(guān)聯(lián)萝喘。在某些假設(shè)下淮逻,統(tǒng)計(jì)意義上是最優(yōu)的。

MSE的缺點(diǎn):

  1. 信號(hào)的保真度和該信號(hào)的空間和時(shí)間順序無關(guān)阁簸。即爬早,以同樣的方法,改變兩個(gè)待比較的信號(hào)本身的空間或時(shí)間排列启妹,它們之間的誤差不變筛严。例如,[1 2 3], [3 4 5] 兩組信號(hào)的 MSE 和 [3 2 1],[5 4 3] 的 MSE 一樣饶米。
  2. 誤差信號(hào)和原信號(hào)無關(guān)桨啃。只要誤差信號(hào)不變,無論原信號(hào)如何檬输,MSE 均不變照瘾。例如,對于固定誤差 [1 1 1]丧慈,無論加在 [1 2 3] 產(chǎn)生 [2 3 4] 還是加在 [0 0 0] 產(chǎn)生 [1 1 1]析命,MSE 的計(jì)算結(jié)果不變。
  3. 信號(hào)的保真度和誤差的符號(hào)無關(guān)逃默。即對于信號(hào) [0 0 0]鹃愤,與之相比較的兩個(gè)信號(hào) [1 2 3] 和[-1 -2 -3] 被認(rèn)為和 [0 0 0] 具有同樣的差別。
  4. 信號(hào)的不同采樣點(diǎn)對于信號(hào)的保真度具有同樣的重要性笑旺。

參考1昼浦、參考2參考3

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末筒主,一起剝皮案震驚了整個(gè)濱河市关噪,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌乌妙,老刑警劉巖使兔,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異藤韵,居然都是意外死亡虐沥,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來欲险,“玉大人镐依,你說我怎么就攤上這事√焓裕” “怎么了槐壳?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長喜每。 經(jīng)常有香客問我务唐,道長,這世上最難降的妖魔是什么带兜? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任枫笛,我火速辦了婚禮,結(jié)果婚禮上刚照,老公的妹妹穿的比我還像新娘刑巧。我一直安慰自己,他們只是感情好涩咖,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布海诲。 她就那樣靜靜地躺著繁莹,像睡著了一般檩互。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上咨演,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天闸昨,我揣著相機(jī)與錄音,去河邊找鬼薄风。 笑死饵较,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的遭赂。 我是一名探鬼主播循诉,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼撇他!你這毒婦竟也來了茄猫?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤困肩,失蹤者是張志新(化名)和其女友劉穎划纽,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體锌畸,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡勇劣,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片比默。...
    茶點(diǎn)故事閱讀 38,617評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡幻捏,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出命咐,到底是詐尸還是另有隱情粘咖,我是刑警寧澤,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布侈百,位于F島的核電站瓮下,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏钝域。R本人自食惡果不足惜讽坏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望例证。 院中可真熱鬧路呜,春花似錦、人聲如沸织咧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽笙蒙。三九已至抵屿,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間捅位,已是汗流浹背轧葛。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留艇搀,地道東北人尿扯。 一個(gè)月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像焰雕,于是被迫代替她去往敵國和親衷笋。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評論 2 348