【CV論文筆記】Focal Loss for Dense Object Detection(Focal Loss 理解)

本文主要用于介紹各路大神(包括rbg, kaiming he等)于2017年提出的適用于目標(biāo)領(lǐng)域的一種新的損失函數(shù)。本筆記主要為方便初學(xué)者快速入門僚匆,以及自我回顧微渠。

論文鏈接:https://arxiv.org/abs/1708.02002
github主頁:https://github.com/facebookresearch/Detectron
rbg大神個(gè)人主頁:http://www.rossgirshick.info/#girshick2014rcnn

基本目錄如下:

  1. 摘要
  2. 核心思想
  3. 總結(jié)

------------------第一菇 - 摘要------------------

1.1 論文摘要

目前最準(zhǔn)確的目標(biāo)檢測(cè)模型就是以兩階段的R-CNN系列為代表的。相比之下咧擂,單階段的目標(biāo)檢測(cè)模型雖然在準(zhǔn)確率上依然落后于兩階段的模型逞盆,但是其簡易和速度快的特性毫無疑問具有巨大的潛力。在這篇文章中松申,我們就深入調(diào)研為什么單階段的模型其準(zhǔn)確率會(huì)不甚理想云芦。在調(diào)研過程中,我們發(fā)現(xiàn)最主要的一個(gè)問題就是在訓(xùn)練過程中的正負(fù)樣本(背景和真實(shí)目標(biāo))不均勻贸桶。因此舅逸,我們?cè)O(shè)計(jì)了一個(gè)新的損失函數(shù),來減少那些易于分類的樣本帶來的損失皇筛。我們新的Focal Loss損失函數(shù)重點(diǎn)關(guān)注那些難于被訓(xùn)練的(hard examples)琉历,并且盡量避免被那些負(fù)樣本所帶偏。為了驗(yàn)證我們模型的有效性水醋,我們還重新設(shè)計(jì)了一個(gè)新的檢測(cè)器旗笔,命名為RetinaNet,我們的實(shí)驗(yàn)表明离例,運(yùn)用了新的損失函數(shù)以后换团,我們的RetinaNet在速度上已經(jīng)能夠媲美那些單階段模型悉稠,同時(shí)在準(zhǔn)確率上能夠壓制現(xiàn)存所有的兩階段模型(存疑)宫蛆。

------------------第二菇 - 核心思想------------------

2.1 Focal Loss損失函數(shù)解釋

既然本文把單階段的模型不如多階段的主要?dú)w因于正負(fù)樣本不均衡這件事情,那我們就直接列出原文的觀點(diǎn)。作者認(rèn)為耀盗,正負(fù)樣本不均衡將會(huì)導(dǎo)致想虎,

1)training is inefficient as most locations are easy negatives that contribute no useful learning signal

2)en masse, the easy negatives can overwhelm training and lead to degenerate models

還是拿目標(biāo)檢測(cè)的場景來理解,單階段的目標(biāo)檢測(cè)器通常會(huì)在第一階段產(chǎn)生高達(dá)100k的候選目標(biāo)叛拷,其中只有極少數(shù)是正樣本舌厨,因此該場景就是一個(gè)典型的正負(fù)樣本不平衡的問題(如下圖所示),然后忿薇,正樣本和負(fù)樣本又都各自有難易之分裙椭,即有些正樣本很容易區(qū)分,有些又很難區(qū)分署浩,因此揉燃,正負(fù)樣本又可以分為如下四類,

正難筋栋,正易炊汤,負(fù)難,負(fù)易

(注:如果有不明白的弊攘,結(jié)合具體的網(wǎng)上盜的一張示意圖明白了【1】)

樣本分布示意圖.jpg

弄清楚了數(shù)據(jù)分布以后抢腐,我們?cè)賮砜磽p失函數(shù)。我們最常用的在計(jì)算分類的時(shí)候常用的損失就是交叉熵?fù)p失(以二分類為例)襟交,

CE(p,y) = \left\{\begin{matrix} -log(p) \ \ \ \ \ if \ y = 1\\ -log(1-p) \ \ \ \ otherwise \end{matrix}\right.

其中p就是模型輸出的概率(y=1)迈倍,為了方便表述,通常定義婿着,

p_t = \left\{\begin{matrix} p \ \ \ \ \ if \ y = 1\\ 1-p\ \ \ \ otherwise \end{matrix}\right.

此時(shí)授瘦,

CE(p_t) = -lop(p_t)

然后,為了解決正負(fù)樣本不平衡的問題竟宋,很自然的我們都會(huì)添加一個(gè)\alpha提完,該參數(shù)通常取決于正負(fù)樣本的比例,

CE(p_t) = -\alpha_tlog(p_t)

當(dāng)然丘侠,\alpha只是平衡了正負(fù)樣本對(duì)于最終損失的貢獻(xiàn)度徒欣,但對(duì)難易不平衡的事情完全沒有幫助。事實(shí)上蜗字,如上述第二條理由所述打肝,在目標(biāo)檢測(cè)的任務(wù)中,存在著大量的易分樣本挪捕,雖然單個(gè)來看每一個(gè)易分樣本(置信度很高的樣本)帶來的損失很低粗梭,但是如果總的易分樣本數(shù)量過多的話,積少成多级零,也會(huì)引領(lǐng)總的損失走向錯(cuò)誤的方向断医。因此,本文作者也認(rèn)為,模型應(yīng)該重點(diǎn)關(guān)注那些難分的樣本(hard examples)鉴嗤,于是據(jù)此理論就提出了一個(gè)新的損失計(jì)算方法斩启,

FL(p_t) = -(1 - p_t)^\gamma log(p_t)

大家仔細(xì)研究一下這個(gè)公式就會(huì)發(fā)現(xiàn),
1)當(dāng)樣本被錯(cuò)分的時(shí)候醉锅,通常p_t是會(huì)比較小的兔簇,因此我們新加的權(quán)值項(xiàng)(1 - p_t)^\gamma也是接近于1的,意思就是該項(xiàng)損失應(yīng)該都有貢獻(xiàn)硬耍;
2)而當(dāng)樣本是正確分類的時(shí)候垄琐,p_t就會(huì)相對(duì)比較大,權(quán)值項(xiàng)也就對(duì)應(yīng)變小了经柴,意思就是該項(xiàng)損失的貢獻(xiàn)是很少的此虑;

因此,最終的Facal Loss就是結(jié)合了上述的2個(gè)點(diǎn)提出的口锭,

FL(p_t) = -\alpha_t (1- p_t)^\gamma log(p_t)

這里也貼一張?jiān)撐闹械膱D朦前,作者發(fā)現(xiàn)\gamma = 2的時(shí)候效果最佳~

Focal Loss.jpg
2.2 RetinaNet網(wǎng)絡(luò)介紹

其實(shí)整一套網(wǎng)絡(luò)架構(gòu),跟RPN網(wǎng)絡(luò)是比較像的鹃操,這里直接貼一張?jiān)撐闹械木W(wǎng)絡(luò)架構(gòu)圖韭寸,

RetinaNet網(wǎng)絡(luò)架構(gòu)圖.jpg

這里簡單提幾個(gè)關(guān)鍵的變化點(diǎn),
1)其基礎(chǔ)提取圖片特征的模型采用的是ResNet荆隘,并且結(jié)合了FPN網(wǎng)絡(luò)恩伺,用以構(gòu)建不同層級(jí)對(duì)應(yīng)的特征圖,因此其基本的架構(gòu)(backbone)就是ResNet + FPN的組合椰拒。

2)對(duì)應(yīng)每一層級(jí)提出的特征晶渠,都會(huì)輸入到2個(gè)結(jié)構(gòu)一摸一樣的子網(wǎng)絡(luò)中(subnetworks),分別用于分類和回歸燃观!倆個(gè)子網(wǎng)絡(luò)的架構(gòu)是一樣的褒脯,但是參數(shù)是不一樣的(sharing a common structure, use separate parameters)。

3)Anchors的設(shè)計(jì)機(jī)制跟RPN中的是相似的缆毁,只不過對(duì)應(yīng)到FPN中番川,每一層級(jí)特征圖對(duì)應(yīng)的Anchor大小是不一樣的。每一個(gè)層級(jí)對(duì)應(yīng)設(shè)置的Anchor比例為\{1:2, 1:1, 2:1\}脊框,每一種比例對(duì)應(yīng)3種大小尺度\{2^0, 2^{1/3}, 2^{2/3}\}颁督,因此總的anchors數(shù)為9。

這里貼一張具體的實(shí)驗(yàn)結(jié)果圖浇雹,方便以后查看(具體實(shí)驗(yàn)過程不再闡述)沉御,

實(shí)驗(yàn)結(jié)果圖1.jpg
實(shí)驗(yàn)結(jié)果圖2.jpg

當(dāng)然作者本文的結(jié)論肯定就是,證明了這種Focal Loss設(shè)計(jì)的有效性了~

------------------第三菇 - 總結(jié)------------------

3.1 總結(jié)

到這里昭灵,整篇論文的核心思想已經(jīng)說清楚了吠裆。本論文主要是提出了一個(gè)新的對(duì)于樣本不均衡問題的損失函數(shù)的設(shè)計(jì)方法聂儒,并實(shí)驗(yàn)證明其可行性,為后續(xù)發(fā)展奠定了基礎(chǔ)硫痰。

簡單總結(jié)一下本文就是先羅列了一下該論文的摘要,再具體介紹了一下本文作者的思路窜护,也簡單表述了一下效斑,自己對(duì)Focal Loss的理解。希望大家讀完本文后能進(jìn)一步加深對(duì)該論文的理解柱徙。有說的不對(duì)的地方也請(qǐng)大家指出缓屠,多多交流,大家一起進(jìn)步~??

參考文獻(xiàn):
【1】https://zhuanlan.zhihu.com/p/80594704

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末护侮,一起剝皮案震驚了整個(gè)濱河市敌完,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌羊初,老刑警劉巖滨溉,帶你破解...
    沈念sama閱讀 217,907評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異长赞,居然都是意外死亡晦攒,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門得哆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來脯颜,“玉大人,你說我怎么就攤上這事贩据《安伲” “怎么了?”我有些...
    開封第一講書人閱讀 164,298評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵饱亮,是天一觀的道長矾芙。 經(jīng)常有香客問我,道長近上,這世上最難降的妖魔是什么蠕啄? 我笑而不...
    開封第一講書人閱讀 58,586評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮戈锻,結(jié)果婚禮上歼跟,老公的妹妹穿的比我還像新娘。我一直安慰自己格遭,他們只是感情好哈街,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,633評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著拒迅,像睡著了一般骚秦。 火紅的嫁衣襯著肌膚如雪她倘。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,488評(píng)論 1 302
  • 那天作箍,我揣著相機(jī)與錄音硬梁,去河邊找鬼。 笑死胞得,一個(gè)胖子當(dāng)著我的面吹牛荧止,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播阶剑,決...
    沈念sama閱讀 40,275評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼跃巡,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼!你這毒婦竟也來了牧愁?” 一聲冷哼從身側(cè)響起素邪,我...
    開封第一講書人閱讀 39,176評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎猪半,沒想到半個(gè)月后兔朦,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,619評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡磨确,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,819評(píng)論 3 336
  • 正文 我和宋清朗相戀三年烘绽,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片俐填。...
    茶點(diǎn)故事閱讀 39,932評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡安接,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出英融,到底是詐尸還是另有隱情盏檐,我是刑警寧澤,帶...
    沈念sama閱讀 35,655評(píng)論 5 346
  • 正文 年R本政府宣布驶悟,位于F島的核電站胡野,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏痕鳍。R本人自食惡果不足惜硫豆,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,265評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望笼呆。 院中可真熱鬧熊响,春花似錦、人聲如沸诗赌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽铭若。三九已至洪碳,卻和暖如春递览,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背瞳腌。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評(píng)論 1 269
  • 我被黑心中介騙來泰國打工绞铃, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人嫂侍。 一個(gè)月前我還...
    沈念sama閱讀 48,095評(píng)論 3 370
  • 正文 我出身青樓儿捧,卻偏偏與公主長得像,于是被迫代替她去往敵國和親吵冒。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,884評(píng)論 2 354