【CV論文筆記】Focal Loss for Dense Object Detection（Focal Loss 理解）

本文主要用于介紹各路大神（包括rbg, kaiming he等）于2017年提出的適用于目標(biāo)領(lǐng)域的一種新的損失函數(shù)。本筆記主要為方便初學(xué)者快速入門僚匆，以及自我回顧微渠。

論文鏈接：https://arxiv.org/abs/1708.02002
github主頁：https://github.com/facebookresearch/Detectron
rbg大神個(gè)人主頁：http://www.rossgirshick.info/#girshick2014rcnn

基本目錄如下：

摘要
核心思想
總結(jié)

------------------第一菇 - 摘要------------------

1.1 論文摘要

目前最準(zhǔn)確的目標(biāo)檢測(cè)模型就是以兩階段的R-CNN系列為代表的。相比之下咧擂，單階段的目標(biāo)檢測(cè)模型雖然在準(zhǔn)確率上依然落后于兩階段的模型逞盆，但是其簡易和速度快的特性毫無疑問具有巨大的潛力。在這篇文章中松申，我們就深入調(diào)研為什么單階段的模型其準(zhǔn)確率會(huì)不甚理想云芦。在調(diào)研過程中，我們發(fā)現(xiàn)最主要的一個(gè)問題就是在訓(xùn)練過程中的正負(fù)樣本（背景和真實(shí)目標(biāo)）不均勻贸桶。因此舅逸，我們?cè)O(shè)計(jì)了一個(gè)新的損失函數(shù)，來減少那些易于分類的樣本帶來的損失皇筛。我們新的Focal Loss損失函數(shù)重點(diǎn)關(guān)注那些難于被訓(xùn)練的（hard examples）琉历，并且盡量避免被那些負(fù)樣本所帶偏。為了驗(yàn)證我們模型的有效性水醋，我們還重新設(shè)計(jì)了一個(gè)新的檢測(cè)器旗笔，命名為RetinaNet，我們的實(shí)驗(yàn)表明离例，運(yùn)用了新的損失函數(shù)以后换团，我們的RetinaNet在速度上已經(jīng)能夠媲美那些單階段模型悉稠，同時(shí)在準(zhǔn)確率上能夠壓制現(xiàn)存所有的兩階段模型（存疑）宫蛆。

------------------第二菇 - 核心思想------------------

2.1 Focal Loss損失函數(shù)解釋

既然本文把單階段的模型不如多階段的主要?dú)w因于正負(fù)樣本不均衡這件事情，那我們就直接列出原文的觀點(diǎn)。作者認(rèn)為耀盗，正負(fù)樣本不均衡將會(huì)導(dǎo)致想虎，

1）training is inefficient as most locations are easy negatives that contribute no useful learning signal

2）en masse, the easy negatives can overwhelm training and lead to degenerate models

還是拿目標(biāo)檢測(cè)的場景來理解，單階段的目標(biāo)檢測(cè)器通常會(huì)在第一階段產(chǎn)生高達(dá)100k的候選目標(biāo)叛拷，其中只有極少數(shù)是正樣本舌厨，因此該場景就是一個(gè)典型的正負(fù)樣本不平衡的問題（如下圖所示），然后忿薇，正樣本和負(fù)樣本又都各自有難易之分裙椭，即有些正樣本很容易區(qū)分，有些又很難區(qū)分署浩，因此揉燃，正負(fù)樣本又可以分為如下四類，

$正難筋栋，正易炊汤，負(fù)難，負(fù)易$

（注：如果有不明白的弊攘，結(jié)合具體的網(wǎng)上盜的一張示意圖明白了【1】）

樣本分布示意圖.jpg

弄清楚了數(shù)據(jù)分布以后抢腐，我們?cè)賮砜磽p失函數(shù)。我們最常用的在計(jì)算分類的時(shí)候常用的損失就是交叉熵?fù)p失（以二分類為例）襟交，

$CE(p,y) = \left\{\begin{matrix} -log(p) \ \ \ \ \ if \ y = 1\\ -log(1-p) \ \ \ \ otherwise \end{matrix}\right.$

其中 $p$ 就是模型輸出的概率（y=1）迈倍，為了方便表述，通常定義婿着，

$p_t = \left\{\begin{matrix} p \ \ \ \ \ if \ y = 1\\ 1-p\ \ \ \ otherwise \end{matrix}\right.$

此時(shí)授瘦，

$CE(p_t) = -lop(p_t)$

然后，為了解決正負(fù)樣本不平衡的問題竟宋，很自然的我們都會(huì)添加一個(gè) $\alpha$ 提完，該參數(shù)通常取決于正負(fù)樣本的比例，

$CE(p_t) = -\alpha_tlog(p_t)$

當(dāng)然丘侠， $\alpha$ 只是平衡了正負(fù)樣本對(duì)于最終損失的貢獻(xiàn)度徒欣，但對(duì)難易不平衡的事情完全沒有幫助。事實(shí)上蜗字，如上述第二條理由所述打肝，在目標(biāo)檢測(cè)的任務(wù)中，存在著大量的易分樣本挪捕，雖然單個(gè)來看每一個(gè)易分樣本（置信度很高的樣本）帶來的損失很低粗梭，但是如果總的易分樣本數(shù)量過多的話，積少成多级零，也會(huì)引領(lǐng)總的損失走向錯(cuò)誤的方向断医。因此，本文作者也認(rèn)為，模型應(yīng)該重點(diǎn)關(guān)注那些難分的樣本（hard examples）鉴嗤，于是據(jù)此理論就提出了一個(gè)新的損失計(jì)算方法斩启，

$FL(p_t) = -(1 - p_t)^\gamma log(p_t)$

大家仔細(xì)研究一下這個(gè)公式就會(huì)發(fā)現(xiàn)，
1）當(dāng)樣本被錯(cuò)分的時(shí)候醉锅，通常 $p_t$ 是會(huì)比較小的兔簇，因此我們新加的權(quán)值項(xiàng) $(1 - p_t)^\gamma$ 也是接近于1的，意思就是該項(xiàng)損失應(yīng)該都有貢獻(xiàn)硬耍；
2）而當(dāng)樣本是正確分類的時(shí)候垄琐， $p_t$ 就會(huì)相對(duì)比較大，權(quán)值項(xiàng)也就對(duì)應(yīng)變小了经柴，意思就是該項(xiàng)損失的貢獻(xiàn)是很少的此虑；

因此，最終的Facal Loss就是結(jié)合了上述的2個(gè)點(diǎn)提出的口锭，

$FL(p_t) = -\alpha_t (1- p_t)^\gamma log(p_t)$

這里也貼一張?jiān)撐闹械膱D朦前，作者發(fā)現(xiàn) $\gamma = 2$ 的時(shí)候效果最佳～

Focal Loss.jpg

2.2 RetinaNet網(wǎng)絡(luò)介紹

其實(shí)整一套網(wǎng)絡(luò)架構(gòu)，跟RPN網(wǎng)絡(luò)是比較像的鹃操，這里直接貼一張?jiān)撐闹械木W(wǎng)絡(luò)架構(gòu)圖韭寸，

RetinaNet網(wǎng)絡(luò)架構(gòu)圖.jpg

這里簡單提幾個(gè)關(guān)鍵的變化點(diǎn)，
1）其基礎(chǔ)提取圖片特征的模型采用的是ResNet荆隘，并且結(jié)合了FPN網(wǎng)絡(luò)恩伺，用以構(gòu)建不同層級(jí)對(duì)應(yīng)的特征圖，因此其基本的架構(gòu)（backbone）就是ResNet + FPN的組合椰拒。

2）對(duì)應(yīng)每一層級(jí)提出的特征晶渠，都會(huì)輸入到2個(gè)結(jié)構(gòu)一摸一樣的子網(wǎng)絡(luò)中（subnetworks），分別用于分類和回歸燃观！倆個(gè)子網(wǎng)絡(luò)的架構(gòu)是一樣的褒脯，但是參數(shù)是不一樣的（sharing a common structure, use separate parameters）。

3）Anchors的設(shè)計(jì)機(jī)制跟RPN中的是相似的缆毁，只不過對(duì)應(yīng)到FPN中番川，每一層級(jí)特征圖對(duì)應(yīng)的Anchor大小是不一樣的。每一個(gè)層級(jí)對(duì)應(yīng)設(shè)置的Anchor比例為 $\{1:2, 1:1, 2:1\}$ 脊框，每一種比例對(duì)應(yīng)3種大小尺度 $\{2^0, 2^{1/3}, 2^{2/3}\}$ 颁督，因此總的anchors數(shù)為9。

這里貼一張具體的實(shí)驗(yàn)結(jié)果圖浇雹，方便以后查看（具體實(shí)驗(yàn)過程不再闡述）沉御，

實(shí)驗(yàn)結(jié)果圖1.jpg

實(shí)驗(yàn)結(jié)果圖2.jpg

當(dāng)然作者本文的結(jié)論肯定就是，證明了這種Focal Loss設(shè)計(jì)的有效性了～

------------------第三菇 - 總結(jié)------------------

3.1 總結(jié)

到這里昭灵，整篇論文的核心思想已經(jīng)說清楚了吠裆。本論文主要是提出了一個(gè)新的對(duì)于樣本不均衡問題的損失函數(shù)的設(shè)計(jì)方法聂儒，并實(shí)驗(yàn)證明其可行性，為后續(xù)發(fā)展奠定了基礎(chǔ)硫痰。

簡單總結(jié)一下本文就是先羅列了一下該論文的摘要，再具體介紹了一下本文作者的思路窜护，也簡單表述了一下效斑，自己對(duì)Focal Loss的理解。希望大家讀完本文后能進(jìn)一步加深對(duì)該論文的理解柱徙。有說的不對(duì)的地方也請(qǐng)大家指出缓屠，多多交流，大家一起進(jìn)步～??

參考文獻(xiàn)：
【1】https://zhuanlan.zhihu.com/p/80594704

最后編輯于：2020.02.01 13:51:51

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末护侮，一起剝皮案震驚了整個(gè)濱河市敌完，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌羊初，老刑警劉巖滨溉，帶你破解...
沈念sama閱讀 217,907評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異长赞，居然都是意外死亡晦攒，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,987評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門得哆，熙熙樓的掌柜王于貴愁眉苦臉地迎上來脯颜，“玉大人，你說我怎么就攤上這事贩据《安伲” “怎么了？”我有些...
開封第一講書人閱讀 164,298評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵饱亮，是天一觀的道長矾芙。經(jīng)常有香客問我，道長近上，這世上最難降的妖魔是什么蠕啄？我笑而不...
開封第一講書人閱讀 58,586評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮戈锻，結(jié)果婚禮上歼跟，老公的妹妹穿的比我還像新娘。我一直安慰自己格遭，他們只是感情好哈街，可當(dāng)我...
茶點(diǎn)故事閱讀 67,633評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著拒迅，像睡著了一般骚秦。火紅的嫁衣襯著肌膚如雪她倘。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,488評(píng)論 1贊 302
城市分裂傳說
那天作箍，我揣著相機(jī)與錄音硬梁，去河邊找鬼。笑死胞得，一個(gè)胖子當(dāng)著我的面吹牛荧止，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播阶剑，決...
沈念sama閱讀 40,275評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼跃巡，長吁一口氣：“原來是場噩夢(mèng)啊……” “哼！你這毒婦竟也來了牧愁？” 一聲冷哼從身側(cè)響起素邪，我...
開封第一講書人閱讀 39,176評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎猪半，沒想到半個(gè)月后兔朦，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,619評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡磨确，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,819評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年烘绽，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片俐填。...
茶點(diǎn)故事閱讀 39,932評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡安接，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出英融，到底是詐尸還是另有隱情盏檐，我是刑警寧澤，帶...
沈念sama閱讀 35,655評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布驶悟，位于F島的核電站胡野，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏痕鳍。R本人自食惡果不足惜硫豆，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,265評(píng)論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望笼呆。院中可真熱鬧熊响，春花似錦、人聲如沸诗赌。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,871評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽铭若。三九已至洪碳，卻和暖如春递览，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背瞳腌。一陣腳步聲響...
開封第一講書人閱讀 32,994評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工绞铃，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人嫂侍。一個(gè)月前我還...
沈念sama閱讀 48,095評(píng)論 3贊 370
代替公主和親
正文我出身青樓儿捧，卻偏偏與公主長得像，于是被迫代替她去往敵國和親吵冒。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,884評(píng)論 2贊 354