ICCV2017:Focal Loss for Dense Object Detection

這篇有關(guān)Focal Loss的paper是何愷明大神提出的又一經(jīng)典paper,除了提出Focal Loss還提出了RetinaNet虐沥,這里就先不對(duì)RetinaNet做介紹泽艘,單純講講Focal Loss

目錄

  • 背景
  • 簡(jiǎn)單介紹
  • 核心思想
  • 論文

背景

  • 我們知道目標(biāo)檢測(cè)的算法主要可以分為兩大類:two-stageone-stage匹涮。前者的代表算法是R-CNN系列槐壳,可以達(dá)到很高的準(zhǔn)確率,但是速度較慢雳攘。后者是指像YOLO這樣直接回歸的檢測(cè)算法吨灭,這類算法速度很快刑巧,但是準(zhǔn)確率不如前者啊楚。作者提出Focal Loss的出發(fā)點(diǎn)也是希望one-stage的算法可以達(dá)到two-stage算法的準(zhǔn)確率特幔,同時(shí)不影響原有的速度。

簡(jiǎn)單介紹

  • 作者剖析了現(xiàn)在one-stage算法準(zhǔn)確率低的原因薄风,作者認(rèn)為是樣本不均衡導(dǎo)致的遭赂。我們知道在目標(biāo)檢測(cè)中横辆,一張圖像可能生成千上萬的候選框,但是其中只有很少一部分是包含目標(biāo)的困肩,這就帶來了類別不均衡(eg:1:1000)锌畸。正因?yàn)榇藢?dǎo)致了:

(1) training is inefficient as most locations are easy negatives that contribute no useful learning signal;
(2) en masse, the easy negatives can overwhelm training and lead to degenerate models.

  • 翻譯過來就是在目標(biāo)檢測(cè)中有很多容易分類的負(fù)樣本貢獻(xiàn)了大部分的loss潭枣,所以模型優(yōu)化得就沒有那么理想
  • 因此針對(duì)類別不均衡問題命咐,作者提出一種新的損失函數(shù):Focal Loss醋奠,這個(gè)損失函數(shù)是在標(biāo)準(zhǔn)交叉熵?fù)p失基礎(chǔ)上修改得到的翰铡。這個(gè)函數(shù)可以通過減少易分類樣本的權(quán)重,使得模型在訓(xùn)練時(shí)更專注于優(yōu)化難分類的樣本例证。為了證明Focal Loss的有效织咧,作者設(shè)計(jì)了一個(gè)新的檢測(cè)網(wǎng)絡(luò):RetinaNet漠秋,并且在訓(xùn)練時(shí)采用Focal Loss訓(xùn)練庆锦。實(shí)驗(yàn)證明RetinaNet不僅可以達(dá)到one-stage detector的速度搂抒,也能有two-stage detector的準(zhǔn)確率。

核心思想

交叉熵

  • 既然Focal Loss是從標(biāo)準(zhǔn)交叉熵而來芳杏,那我們就從標(biāo)準(zhǔn)交叉熵說起:
    CE(p,y)=\begin{cases}{-\log(p)}&{if y=1 }\\\ -\log(1-p) & otherwise \end {cases}(1)

  • 以二分類為例,其中y\in{-1,+1}P\in[0,1]郭膛,P即是該類別的置信度氛悬,為了方便棍现,用P_t替代P己肮,公式如下:
    p_t=\begin{cases} p & if y=1 \\\ 1-p & otherwise\end{cases}(2)

  • 為了方便谎僻,我們用p_t表示樣本屬于正樣本的概率艘绍,所以(1)式可以寫成:
    CE(p,y)=CE(p_t)=-log(p_t)(3)

簡(jiǎn)單改進(jìn)的交叉熵

  • 既然正負(fù)樣本的數(shù)量不平衡诱鞠,那么一種常見的做法就是給正負(fù)樣本加上權(quán)重航夺,對(duì)出現(xiàn)次數(shù)少的正樣本賦予更高的權(quán)重,對(duì)出現(xiàn)次數(shù)多的負(fù)樣本賦予低的權(quán)重缭保。因此可以通過設(shè)定\alpha\in[0,1]的值來控制正負(fù)樣本對(duì)總的loss的權(quán)重帝雇。公式如下:
    CE(p_t)=-\alpha_tlog(p_t) (4)
  • 但是這種形式并沒有解決問題尸闸,因?yàn)檎?fù)樣本中還分難易吮廉,而在目標(biāo)檢測(cè)中大量的候選目標(biāo)都是易分樣本宙址,示意圖如下:


  • 由于數(shù)量極不平衡,易分樣本的數(shù)量相對(duì)來講太多抡砂,最終主導(dǎo)了總的損失大咱。而作者認(rèn)為注益,易分樣本對(duì)模型的提升效果非常小碴巾,模型應(yīng)該主要關(guān)注那些難分樣本丑搔。類似于上面改進(jìn)的思想厦瓢,那我們降低易分樣本的權(quán)重即可啤月,所以Focal Loss就提出了煮仇。

Focal Loss

  • Focal Loss的形式如下:
    FL(p_t)=-(1-p_t)^{\gamma}log(p_t) (5)
  • 其中谎仲,(1-p_t)^{\gamma}稱為調(diào)制系數(shù)浙垫,那為什么加了這個(gè)調(diào)制系數(shù)就可以平衡難易樣本呢强重,我們通過兩個(gè)例子來感受:
  1. 對(duì)于正樣本來說佃声,預(yù)測(cè)出的p_t為0.9這樣比較大的為易分樣本,那么調(diào)制系數(shù)(1-p_t)^{\gamma}接近于0,整個(gè)式子的值就比較小,對(duì)總體的loss基本無貢獻(xiàn)(影響)陕见;若預(yù)測(cè)出的p_t為0.1這樣比較小的為難分樣本仔涩,那么調(diào)制系數(shù)(1-p_t)^{\gamma}接近于1柑肴,損失和原來交叉熵幾乎一樣袍暴,負(fù)樣本同理。這樣減少了易分樣本的影響淋样,讓模型更加關(guān)注難分樣本儡司。
  2. 我們通過一個(gè)具體的數(shù)字來感受一下:假如\gamma取2酵镜,這時(shí)預(yù)測(cè)出的p_t為0.9垢粮,那么損失將比原來衰減(1-0.9)^2=0.01斩跌,也就是這個(gè)易分樣本的損失衰減了一百倍
  • 當(dāng)然我們可以發(fā)現(xiàn),當(dāng)\gamma=0的時(shí)候上沐,focal loss就是傳統(tǒng)的交叉熵?fù)p失,當(dāng)γ增加的時(shí)候蕴侧,調(diào)制系數(shù)也會(huì)增加。 γ增大能增強(qiáng)調(diào)制因子的影響择葡,實(shí)驗(yàn)發(fā)現(xiàn)γ取2最好她我。調(diào)制因子減少了易分樣本的損失貢獻(xiàn),拓寬了樣例接收到低損失的范圍疏哗。
  • 到了這里我們就解決了難易樣本不均衡的問題,再結(jié)合式(4)解決正負(fù)樣本問題的思路,F(xiàn)ocal Loss就可以解決正負(fù)樣本不均衡以及難易樣本不均衡兩個(gè)問題污尉,最后形式如下:
    FL(p_t)=-\alpha(1-p_t)^{\gamma}log(p_t)
  • 作者實(shí)驗(yàn)后發(fā)現(xiàn)锐朴,\gamma取2衣迷,\alpha取0.25效果最好。

論文

https://arxiv.org/abs/1708.02002

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末堆缘,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌钮莲,老刑警劉巖极舔,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件俺附,死亡現(xiàn)場(chǎng)離奇詭異璃哟,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門户矢,熙熙樓的掌柜王于貴愁眉苦臉地迎上來挂洛,“玉大人荠藤,你說我怎么就攤上這事淤井±悖” “怎么了侨糟?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)菱魔。 經(jīng)常有香客問我藻治,道長(zhǎng)雏节,這世上最難降的妖魔是什么怔锌? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任崭孤,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘经伙。我一直安慰自己垮刹,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著内列,像睡著了一般饵筑。 火紅的嫁衣襯著肌膚如雪部脚。 梳的紋絲不亂的頭發(fā)上吹零,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼礁遣。 笑死崭添,一個(gè)胖子當(dāng)著我的面吹牛徙邻,可吹牛的內(nèi)容都是我干的缰犁。 我是一名探鬼主播麦乞,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼姐直,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼愿棋!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤紊服,失蹤者是張志新(化名)和其女友劉穎校赤,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體痒谴,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡铡羡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了烦周。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片怎顾。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡漱贱,死狀恐怖槐雾,靈堂內(nèi)的尸體忽然破棺而出幅狮,到底是詐尸還是另有隱情,我是刑警寧澤崇摄,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站逐抑,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏厕氨。R本人自食惡果不足惜进每,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一命斧、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧冯丙,春花似錦、人聲如沸胃惜。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至利虫,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間糠惫,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國(guó)打工硼讽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓城菊,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親碉克。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容