讀論文系列:Object Detection ECCV2016 SSD

轉(zhuǎn)載請(qǐng)注明作者:夢(mèng)里茶

Single Shot MultiBox Detector

Introduction

一句話概括:SSD就是關(guān)于類別的多尺度RPN網(wǎng)絡(luò)

基本思路:

  • 基礎(chǔ)網(wǎng)絡(luò)后接多層feature map
  • 多層feature map分別對(duì)應(yīng)不同尺度的固定anchor
  • 回歸所有anchor對(duì)應(yīng)的class和bounding box

Model

SSD
  • 輸入:300x300
  • 經(jīng)過VGG-16(只到conv4_3這一層)
  • 經(jīng)過幾層卷積衙傀,得到多層尺寸逐漸減小的feature map
  • 每層feature map分別做3x3卷積,每個(gè)feature map cell(又稱slide window)對(duì)應(yīng)k個(gè)類別和4個(gè)bounding box offset裸卫,同時(shí)對(duì)應(yīng)原圖中6(或4)個(gè)anchor(又稱default box)
    • 38x38, 最后3x3, 1x1三個(gè)feature map的每個(gè)feature map cell只對(duì)應(yīng)4個(gè)anchor,分別為寬高比: 1:1兩種泪电,1:2, 2:1兩種挎峦,因此總共有 38 * 38 * 4 + 19 * 19 * 6 + 10 * 10 * 6 + 5 * 5 * 6 + 3 * 3 * 4 + 1 * 1 * 4 = 8732 個(gè)anchor

    • 其他feature map的feature map cell對(duì)應(yīng)6個(gè)anchor陈哑,分別為寬高比: 1:1兩種,1:2, 2:1兩種盲赊,1:3铣鹏, 3:1兩種

    • 每層的feature map cell對(duì)應(yīng)的anchor計(jì)算方法如下

    • 位置:假設(shè)當(dāng)前feature map cell是位于第i行,第j列哀蘑,則anchor的中心為 ((i+0.5)/|fk|,(j+0.5)/|fk|), fk是第k層feature map的size(比如38)

    • 縮放因子:

      Scale

      其中smin為0.2诚卸,smax為0.9葵第,m為添加的feature map的層數(shù),縮放因子就是為不同feature map選擇不同的大小的anchor合溺,要求小的feature map對(duì)應(yīng)的anchor盡量大卒密,因?yàn)樵叫〉膄eature map,其feature map cell的感受野就越大

    • anchor寬高:


      width
      height

      其中棠赛,ar∈{1,2,3,1/2,1/3}哮奇,可以理解為在縮放因子選擇好anchor尺寸后,用ar來控制anchor形狀睛约,從而得到多尺度的各種anchor鼎俘,當(dāng)ar=1時(shí),增加一種 sk=sqrt(sk-1sk+1)辩涝,于是每個(gè)feature map cell通常對(duì)應(yīng)6種anchor贸伐。

  • 網(wǎng)絡(luò)的訓(xùn)練目標(biāo)就是,回歸各個(gè)anchor對(duì)應(yīng)的類別和位置

Training

樣本

  • 正樣本
    選擇與bounding box jaccard overlap(兩張圖的交集/并集)大于0.5的anchor作為正樣本

  • 樣本比例
    Hard negative mining:由于負(fù)樣本很多怔揩,需要去掉一部分負(fù)樣本捉邢,先整圖經(jīng)過網(wǎng)絡(luò),根據(jù)每個(gè)anchor的最高類置信度進(jìn)行排序商膊,選擇置信度靠前的樣本歌逢,這樣篩選出來的負(fù)樣本也會(huì)更難識(shí)別,并且最終正負(fù)樣本比例大概是1:3

Loss

還是一如既往的location loss + classification loss翘狱,并為location loss添加了系數(shù)α(然而實(shí)際上α=1)進(jìn)行平衡,并在batch維度進(jìn)行平均

SSD Loss
  • x是xijp的集合xijp={1,0}砰苍,用于判斷第i個(gè)anchor是否是第j個(gè)bounding box上的p類樣本
  • c是cip的集合潦匈,cip是第i個(gè)anchor預(yù)測(cè)為第p類的概率
  • l是預(yù)測(cè)的bounding box集合
  • g是ground true bounding box集合

其中定位loss與faster rcnn相同

Location loss

這個(gè)式子里的k不是很明確,其實(shí)想表達(dá)不算背景0類的意思赚导,且前景類只為match的類算location loss

分類loss就是很常用的softmax交叉熵了

classification

核心的內(nèi)容到這里就講完了茬缩,其實(shí)跟YOLO和faster rcnn也很像,是一個(gè)用anchor box充當(dāng)固定的proposal的rpn吼旧,并且用多尺度的anchor來適應(yīng)多種尺度和形狀的目標(biāo)對(duì)象凰锡。

Detail

在訓(xùn)練中還用到了data augmentation(數(shù)據(jù)增強(qiáng)/擴(kuò)充),每張圖片多是由下列三種方法之一隨機(jī)采樣而來

  • 使用整圖
  • crop圖片上的一部分圈暗,crop出來的min面積為0.1,0.3,0.5,0.7,0.9
  • 完全隨機(jī)地crop

然后這些圖片會(huì)被resize到固定的大小掂为,隨機(jī)水平翻轉(zhuǎn),加入一些圖像上的噪聲员串,詳情可以參考另一篇論文:

Some improvements on deep convolutional neural network based image classification

從切除實(shí)驗(yàn)中勇哗,可以看到data augmentaion是很重要的(從65.6到71.6)

Experiment

這個(gè)表中還提到了atrous,指的是空洞卷積寸齐,是圖像分割(deeplab)領(lǐng)域首先提出的一個(gè)卷積層改進(jìn)欲诺,基于相鄰像素冗余的假設(shè)抄谐,跳過相鄰像素進(jìn)行卷積,感受野更大扰法,測(cè)試速度也更快蛹含。

  • 標(biāo)準(zhǔn)卷積:


    conv.gif
  • 空洞卷積:


    dilate_conv.gif

具體可以參考 ICLR2015 Deeplab

從這個(gè)表中也可以看出多種形狀的anchor可以提升準(zhǔn)確率

Result

輸入尺寸為300x300,batch size為8的SSD300可以做到實(shí)時(shí)(59FPS)且準(zhǔn)確(74.3% mAP)的測(cè)試

Summary

SSD算是一個(gè)改進(jìn)性的東西塞颁,站在Faster RCNN的肩膀上達(dá)到了實(shí)時(shí)且準(zhǔn)確的檢測(cè)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末浦箱,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子殴边,更是在濱河造成了極大的恐慌憎茂,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,525評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件锤岸,死亡現(xiàn)場(chǎng)離奇詭異竖幔,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)是偷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門拳氢,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蛋铆,你說我怎么就攤上這事馋评。” “怎么了刺啦?”我有些...
    開封第一講書人閱讀 164,862評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵留特,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我玛瘸,道長(zhǎng)蜕青,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,728評(píng)論 1 294
  • 正文 為了忘掉前任糊渊,我火速辦了婚禮右核,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘渺绒。我一直安慰自己贺喝,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,743評(píng)論 6 392
  • 文/花漫 我一把揭開白布宗兼。 她就那樣靜靜地躺著躏鱼,像睡著了一般。 火紅的嫁衣襯著肌膚如雪针炉。 梳的紋絲不亂的頭發(fā)上挠他,一...
    開封第一講書人閱讀 51,590評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音篡帕,去河邊找鬼殖侵。 笑死贸呢,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的拢军。 我是一名探鬼主播楞陷,決...
    沈念sama閱讀 40,330評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼茉唉!你這毒婦竟也來了固蛾?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,244評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤度陆,失蹤者是張志新(化名)和其女友劉穎艾凯,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體懂傀,經(jīng)...
    沈念sama閱讀 45,693評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡趾诗,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,885評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蹬蚁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片恃泪。...
    茶點(diǎn)故事閱讀 40,001評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖犀斋,靈堂內(nèi)的尸體忽然破棺而出贝乎,到底是詐尸還是另有隱情,我是刑警寧澤叽粹,帶...
    沈念sama閱讀 35,723評(píng)論 5 346
  • 正文 年R本政府宣布览效,位于F島的核電站,受9級(jí)特大地震影響虫几,放射性物質(zhì)發(fā)生泄漏朽肥。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,343評(píng)論 3 330
  • 文/蒙蒙 一持钉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧篱昔,春花似錦每强、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至穗椅,卻和暖如春辨绊,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背匹表。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工门坷, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留宣鄙,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,191評(píng)論 3 370
  • 正文 我出身青樓默蚌,卻偏偏與公主長(zhǎng)得像冻晤,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子绸吸,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,955評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容