各種熵和Softmax-loss

一 自信息

1.定義:描述某個事件發(fā)生所帶來的信息量,由克勞德·香農(nóng)提出,I(x)=-log(p(x))豪嗽,當(dāng)p(x)=0即隨機(jī)事件不發(fā)生時自信息被定義為無限大,當(dāng)p(x)=1即隨機(jī)事件確定會發(fā)生時自信息為0豌骏。

2. 單位:在自信息的定義中龟梦,對數(shù)的底決定自信息的單位,以2為底則記為比特(bit)窃躲,以e為底(自然對數(shù))則記為奈特(nat)计贰。

二 熵

1. 定義:傳送一個隨機(jī)變量x的平均信息量稱為隨機(jī)變量x的熵,它是表示隨機(jī)變量不確定性的度量蒂窒,是對所有可能發(fā)生的事件產(chǎn)生的信息量的期望躁倒。即自信息I(x)關(guān)于概率分布的期望:H(x)=-\sum_{i=1}^np(x_i)logp(x_i)

當(dāng)概率為均勻分布時,熵最大(不確定性最大)洒琢,此時H(x)=log_2n秧秉。

三 條件熵

1. 定義:在已知隨機(jī)變量X的條件下,隨機(jī)變量Y的不確定性衰抑。即給定X的條件下象迎,Y的條件概率分布的熵對X的數(shù)學(xué)期望:H(Y|X)=-\sum_{x,y}p(x,y)logp(y|x)

四 相對熵(KL散度)

1. 定義:概率分布P對Q的相對熵是P和Q的對數(shù)差在P上的期望值:

D_{KL}(p||q)=E_{p(x)}log\frac{p(x)}{q(x)}

2. 性質(zhì):如果P和Q兩個分布相同,則相對熵為0呛踊;相對熵恒大于等于0砾淌;相對熵具有不對稱性。

五 交叉熵

1. 定義:描述實際概率分布p(x)于期望概率分布的距離谭网,交叉熵越小拇舀,兩個概率分布越接近。

H(p,q)=-\sum_{x}p(x)log(q(x))? ?--->??D_{KL}(p||q)=H(p,q)-H(p)

在機(jī)器學(xué)習(xí)中蜻底,訓(xùn)練數(shù)據(jù)分布是固定的骄崩,即H(p)為常數(shù),在訓(xùn)練中總是希望在訓(xùn)練數(shù)據(jù)上模型學(xué)到的分布和真實數(shù)據(jù)分布越接近越好薄辅,即希望相對熵最小要拂,等價于交叉熵最小,等價于最大似然估計站楚。

參考:https://www.cnblogs.com/kyrieng/p/8694705.html

六 Softmax Loss

1. 定義:L_S=-\frac{1}{M} \sum_{i=1}^Mlog\frac{e^{W_{y_i}^Tf(x_i)+b_{y_i}}}{\sum_{j=1}^Ce^{W_j^Tf(x_i)+b_j} }

=-\frac{1}{M}\sum_{i=1}^M  [W_{y_i}^Tf(x_i)+b_{y_i}-log\sum_{j=1}^Ce^{W_j^Tf(x_i)+b_j} ]

=\frac{1}{M}\sum_{i=1}^M  [log[\sum_{j=1}^Ce^{W_j^Tf(x_i)+b_j}] -[W_{y_i}^Tf(x_i)+b_{y_i}]]

M: 訓(xùn)練batchsize脱惰,x_i:該訓(xùn)練batch中的第i個人臉圖片,f(x_i)x_i對應(yīng)的神經(jīng)網(wǎng)絡(luò)倒數(shù)第二層輸出窿春,y_ix_i對應(yīng)的標(biāo)簽拉一,W和b:網(wǎng)絡(luò)最后一層(分類器)對應(yīng)的權(quán)重和偏置采盒。

2. 關(guān)于softmax的詳細(xì)解釋,參考:http://freemind.pluskid.org/machine-learning/softmax-vs-softmax-loss-numerical-stability/

七 交叉熵和Softmax Loss的關(guān)系

當(dāng)交叉熵中的概率q(x)為Softmax概率時蔚润,交叉熵等價于Softmax loss磅氨,證明如下:

對于輸入訓(xùn)練樣本x,其在訓(xùn)練集上的概率分布為p嫡纠,模型預(yù)測的softmax概率分布為q烦租,則

H(p,q)=-\sum_{x}p(x)log(q(x))?=-\sum_{j=1}^Cp_j(x)log(q_j(x))

其中C表示所有可能的類別數(shù),p_j(x)表示輸入樣本x屬于類別j的概率除盏,對于機(jī)器學(xué)習(xí)的訓(xùn)練樣本而言叉橱,通常輸入樣本x有唯一的標(biāo)簽y,即概率分布p往往為:p_j(x)=1,j=y; p_j(x)=0,j!=y者蠕,所以:

H(p,q)=-log(q_j(x))窃祝,j為x所屬的真實類別,q_j(x)表示輸入樣本x被預(yù)測為真實類別(ground truth)的概率。所以對于M個輸入樣本而言,其平均交叉熵為:-\frac{1}{M} \sum_{i=1}^Mlog(q_j(x_{i}))时甚,其中x_{i}表示第i個輸入樣本糕再,q_j(x_i)為模型預(yù)測第i個樣本屬于其真實類別j的概率玉转。由于概率分布q為softmax的概率分布,即q_j(x_{i})=\frac{e^{W_{y_i}^Tf(x_i)+b_{y_i}}}{\sum_{j=1}^Ce^{W_j^Tf(x_i)+b_j} } 殴蹄,帶入平均交叉熵可得M個樣本的平均交叉熵等于L_s(Softmax loss)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末袭灯,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子稽荧,更是在濱河造成了極大的恐慌橘茉,老刑警劉巖姨丈,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蟋恬,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)歼争,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進(jìn)店門渗勘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人俩莽,你說我怎么就攤上這事”鳎” “怎么了价淌?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵瞒津,是天一觀的道長蝉衣。 經(jīng)常有香客問我,道長巷蚪,這世上最難降的妖魔是什么病毡? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮屁柏,結(jié)果婚禮上啦膜,老公的妹妹穿的比我還像新娘。我一直安慰自己淌喻,他們只是感情好僧家,可當(dāng)我...
    茶點故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著裸删,像睡著了一般八拱。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上涯塔,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天肌稻,我揣著相機(jī)與錄音,去河邊找鬼匕荸。 笑死爹谭,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的榛搔。 我是一名探鬼主播诺凡,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼践惑!你這毒婦竟也來了腹泌?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤童本,失蹤者是張志新(化名)和其女友劉穎真屯,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體穷娱,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡绑蔫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年运沦,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片配深。...
    茶點故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡携添,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出篓叶,到底是詐尸還是另有隱情烈掠,我是刑警寧澤,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布缸托,位于F島的核電站左敌,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏俐镐。R本人自食惡果不足惜矫限,卻給世界環(huán)境...
    茶點故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望佩抹。 院中可真熱鬧叼风,春花似錦、人聲如沸棍苹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽枢里。三九已至孽鸡,卻和暖如春梭灿,著一層夾襖步出監(jiān)牢的瞬間画侣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工溉卓, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人搬泥。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像尉尾,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子沙咏,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,781評論 2 354