2020-10-03各種LossFunction匯總

1. Softmax loss: 
\color{red}{本質(zhì):}鼓勵(lì)目標(biāo)類別的輸出比其他要大晴圾,但是從其公式圖像上可以看出,Softmax鼓勵(lì)不同類別特征分開笼恰,但是并不鼓勵(lì)分開很多冤荆,所以會(huì)出現(xiàn)如下圖情況朴则,

圖1.特征和分類結(jié)果記分圖片

softmax相對(duì)的就是hard max, 我們可以對(duì)比一下例子

圖2 hard和soft max對(duì)比

相同輸出特征情況钓简,softmax比hard max更容易達(dá)到最后的one-hot形式乌妒,或者說softmax降低了訓(xùn)練的難度,使得多分類問題更容易收斂.
\color{red}{如圖1所示外邓,輸入(5,1,1,1)時(shí)撤蚊,其loss已經(jīng)很小了}
\color{red}{,所以此時(shí)特征抽取層已經(jīng)接近收斂梯度不再下降}

但是损话,此情況不滿足我們?nèi)四樧R(shí)別 中特征向量對(duì)比的需求侦啸,人臉識(shí)別中常用歐式距離(l2 distance)和余弦距離(cosin distance)

image.png

L2距離:l2距離越小,向量相似度越高丧枪,可能同類的特征向量距離(黃色)比不同類的特征向量距離(綠色)更大.
image.png

cos距離:夾角越小光涂,cos距離越大,向量相似度越高拧烦,可能同類的特征向量夾角(黃色)比不同類的特征向量夾角(綠色)更大

總的來說:

  1. softmax訓(xùn)練的深度特征顶捷,會(huì)把整個(gè)超空間或者超球,按分類個(gè)數(shù)劃分屎篱,保證類別可分,這一點(diǎn)對(duì)多分類任務(wù)如imageNet非常合適葵蒂,因?yàn)闇y(cè)試類別必定再訓(xùn)練類別中.
    2.但是Softmax不要求類內(nèi)緊湊和類間分離交播,這不符合人臉識(shí)別任務(wù),因?yàn)橛?xùn)練集1w的任務(wù)相對(duì)于測(cè)試集整個(gè)世界70億人類說践付,非常微不足道秦士,我們不能拿到所有人的訓(xùn)練樣本,
    3. 所以需要改造softmax, 除了保證可分性永高,還要做到特征向量類內(nèi)盡可能緊湊隧土,類間盡可能分離.

ArchFace Loss

角度距離比余弦距離在對(duì)角度的影響上更加直接
決策邊界的具體比較如下圖:


image.png

ArchFace是直接在角度空間(angular space)中最大化分類界限.以下是具體公式變動(dòng)過程:


image.png

變動(dòng)則是首先將偏置b設(shè)置為0, 然后權(quán)重和輸入的內(nèi)積用下面一下式子表示:
image.png

當(dāng)用l2正則化處理Wj使||Wj||=1, l2正則化就是將Wj向量中每個(gè)值分別除以Wj的模,從而得到新的Wj, 新的Wj的模就是1.從公式1就可以得到下面式子命爬,此操作再SphereFace, CosineFace中都有.

image.png

然后一方面曹傀,對(duì)輸入xi也用l2正則化處理,同時(shí)乘以一個(gè)scale參數(shù)s饲宛;另一方面將\cos\theta_{y_i}\cos(\theta_{y_i}+m)皆愉,此為arcface核心,m默認(rèn)取0.5,
image.png

以二分類為例,(分離邊界的計(jì)算https://blog.csdn.net/u014380165/article/details/80645489
)
image.png

target logit

了解了Table1中分類界限的計(jì)算后,就容易理解Figure3中的圖了幕庐,因?yàn)榛旧暇褪前凑誘able1中的公式來畫的久锥,看懂Figure3就基本上明白為什么這幾個(gè)損失函數(shù)能夠提高人臉識(shí)別的效果。softmax和W-Norm softmax比較簡(jiǎn)單异剥,坐標(biāo)軸是cosθ1和cosθ2瑟由,分界線的斜率是1。SphereFace中的坐標(biāo)軸是θ1和θ2冤寿,其中class1的線對(duì)應(yīng)Table1中的公式歹苦,因?yàn)閙小于1,cos函數(shù)在該輸入范圍內(nèi)是遞減函數(shù)疚沐,所以斜率(cosmθ1/cosθ2)大于1暂氯。class2那條線同理,同時(shí)兩條線都過原點(diǎn)亮蛔。CosinFace中的坐標(biāo)軸是cosθ1和cosθ2痴施,class1那條線相當(dāng)于將過原點(diǎn)的斜率為1的線向上平移m的結(jié)果,為什么這么說究流?假設(shè)θ2=0辣吃,那么class1線就是cosθ1=m,又因?yàn)榭v坐標(biāo)軸是cosθ1芬探,因此就是平移m神得,class2同理。ArchFace中的坐標(biāo)軸是θ1和θ2偷仿,class1這條線相當(dāng)于將過原點(diǎn)的斜率為1的線向上平移m的結(jié)果(注意哩簿,雖然都是平移m,但是這里的坐標(biāo)軸和CosinFace不同酝静,因此平移的量不一樣)节榜。
因此這里有個(gè)非常重要的結(jié)論:在ArchFace中是直接在角度空間(angular space,也就是橫縱坐標(biāo)是角度θ1和θ2别智,不是softmax或CosineFace中的cosθ1和cosθ2)中最大化分類界限宗苍。


image.png

首先解釋下target logit的概念,target logit指的是網(wǎng)絡(luò)的全連接層輸出薄榛,假設(shè)你的損失函數(shù)是softmax loss讳窟,也就是下面這個(gè)式子:


image.png

那么下面這個(gè)就是target logit
image.png

因此換句話說,target logit就是全連接層輸出矩陣中預(yù)測(cè)類別為真實(shí)類別的輸出敞恋,再看如下target logit的曲線圖丽啡,尤其30-60度范圍內(nèi),arcface的效果要好于其他算法硬猫,同時(shí)可以看出sphereface超參數(shù)調(diào)整需要技巧.
image.png

以下是arcface loss過程


image.png

將m理解為一種間隔
image.png

image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末碌上,一起剝皮案震驚了整個(gè)濱河市倚评,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌馏予,老刑警劉巖天梧,帶你破解...
    沈念sama閱讀 221,548評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異霞丧,居然都是意外死亡呢岗,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門蛹尝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來后豫,“玉大人,你說我怎么就攤上這事突那〈炷穑” “怎么了?”我有些...
    開封第一講書人閱讀 167,990評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵愕难,是天一觀的道長(zhǎng)早龟。 經(jīng)常有香客問我,道長(zhǎng)猫缭,這世上最難降的妖魔是什么葱弟? 我笑而不...
    開封第一講書人閱讀 59,618評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮猜丹,結(jié)果婚禮上芝加,老公的妹妹穿的比我還像新娘。我一直安慰自己射窒,他們只是感情好藏杖,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著脉顿,像睡著了一般蝌麸。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上弊予,一...
    開封第一講書人閱讀 52,246評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音开财,去河邊找鬼汉柒。 笑死,一個(gè)胖子當(dāng)著我的面吹牛责鳍,可吹牛的內(nèi)容都是我干的碾褂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,819評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼历葛,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼正塌!你這毒婦竟也來了嘀略?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤乓诽,失蹤者是張志新(化名)和其女友劉穎帜羊,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鸠天,經(jīng)...
    沈念sama閱讀 46,268評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡讼育,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了稠集。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片奶段。...
    茶點(diǎn)故事閱讀 40,488評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖剥纷,靈堂內(nèi)的尸體忽然破棺而出痹籍,到底是詐尸還是另有隱情,我是刑警寧澤晦鞋,帶...
    沈念sama閱讀 36,181評(píng)論 5 350
  • 正文 年R本政府宣布蹲缠,位于F島的核電站,受9級(jí)特大地震影響鳖宾,放射性物質(zhì)發(fā)生泄漏吼砂。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評(píng)論 3 333
  • 文/蒙蒙 一鼎文、第九天 我趴在偏房一處隱蔽的房頂上張望渔肩。 院中可真熱鬧,春花似錦拇惋、人聲如沸周偎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)蓉坎。三九已至,卻和暖如春胡嘿,著一層夾襖步出監(jiān)牢的瞬間蛉艾,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工衷敌, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留勿侯,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,897評(píng)論 3 376
  • 正文 我出身青樓缴罗,卻偏偏與公主長(zhǎng)得像助琐,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子面氓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評(píng)論 2 359