MultiBox-CVPR2014

文章: Scalable Object Detection using Deep Neural Networks
作者: Dumitru Erhan, Christian Szegedy, Alexander Toshev, and Dragomir Anguelov

核心亮點(diǎn)

(1) 回歸問題:
將物體檢測(cè)問題定義為輸出多個(gè)bounding box的回歸問題. 同時(shí)每個(gè)bounding box會(huì)輸出關(guān)于是否包含目標(biāo)物體的置信度, 使得模型更加緊湊和高效

(2) 損失函數(shù):
將訓(xùn)練bounding box檢測(cè)器作為整個(gè)網(wǎng)絡(luò)訓(xùn)練過(guò)程的一部分, 也就是說(shuō)在損失函數(shù)中包含了關(guān)于bounding box的損失項(xiàng). 通過(guò)聯(lián)合訓(xùn)練, 不僅利用了神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征表示能力, 而且將檢測(cè)器的訓(xùn)練集成到了網(wǎng)絡(luò)中

(3) 無(wú)類別監(jiān)督訓(xùn)練
作者將本文的目標(biāo)邊框檢測(cè)器在無(wú)監(jiān)督的樣本下訓(xùn)練, 由于本方法主要完成的功能就是畫框, 并不會(huì)輸出框中包含的物體類別, 因此訓(xùn)練的時(shí)候無(wú)需知道樣本的類別信息. 這也使得該方法的計(jì)算復(fù)雜度與類別信息幾乎無(wú)關(guān), 可以輕易的推廣到未知的類別當(dāng)中. (當(dāng)然也可以進(jìn)行相關(guān)類別的訓(xùn)練, 對(duì)每個(gè)類別都訓(xùn)練一個(gè)檢測(cè)器, 模型的總參數(shù)會(huì)隨著類別數(shù)線性增加)

關(guān)鍵技術(shù)

作者將bounding box的檢測(cè)過(guò)程集成到了神經(jīng)網(wǎng)絡(luò)中, 使其轉(zhuǎn)變成了一個(gè)回歸問題, 通過(guò)BP算法優(yōu)化下面的損失函數(shù)即可獲得預(yù)測(cè)的框, 相比于SS算法, 計(jì)算復(fù)雜度更低.

x_{ij}=1 當(dāng)且僅當(dāng)?shù)?i 個(gè)預(yù)測(cè)框與第 j 個(gè)真實(shí)框匹配. l_ig_j 分別是預(yù)測(cè)框和真實(shí)框的歸一化后的坐標(biāo), c_i 代表置信度:

F_{match}(x,l) = \frac{1}{2} \sum_{i,j} x_{ij} \|l_i - g_j\|_2^2

F_{conf}(x,c) = -\sum{i,j} x_{i,j} log(c_i) - \sum_i (1 - \sum_j x_{ij}) log(1-c_i)

F(x,l,c) = \alpha F_{match}(x,l) + F_{conf}(x,c)

x^* = \arg \min_x F(x,l,c)
\text{subject to } x_{ij} \in \{0, 1\}, \sum_i x_{ij}=1

利用BP算法分別對(duì) l_ic_i 求導(dǎo), 以便更新相關(guān)參數(shù)使其損失函數(shù)值更低.

\frac{\partial F}{\partial l_i} = \sum_j (l_i - g_j) x^*_{ij}

\frac{\partial F}{\partial c_i} = \frac{\sum_j x^*_{ij} c_i}{c_i(1-c_i)}

論文細(xì)節(jié)

背景介紹

在(2014年)之前的工作中, 對(duì)于目標(biāo)檢測(cè)任務(wù)都是對(duì)整個(gè)圖片進(jìn)行檢測(cè), 無(wú)法檢測(cè)出同一張圖片中的多個(gè)目標(biāo)物. 于是, 本文就提出了一種目標(biāo)檢測(cè)模型, 可以在一張圖片中預(yù)測(cè)多個(gè)bounding boxes, 并且每個(gè)box都對(duì)應(yīng)了包含某個(gè)類別物體的置信度.

作者使用了一個(gè)單一的DNN網(wǎng)絡(luò), 來(lái)生成候選區(qū)域框, 并且每個(gè)區(qū)域框都會(huì)帶有一個(gè)置信度, 代表這框內(nèi)包含物體的可能性大小.

Model: 模型最后一層的神經(jīng)元的輸出值代表著每個(gè)框的坐標(biāo)和對(duì)應(yīng)的置信度.

Bounding Box: 將左上角和右下角的坐標(biāo)分別作為四個(gè)神經(jīng)元的輸出值. 這些坐標(biāo)都是經(jīng)過(guò)歸一化的.

Confidence: 每個(gè)Box對(duì)應(yīng)的置信度會(huì)單獨(dú)作為一個(gè)神經(jīng)元節(jié)點(diǎn)輸出.

在預(yù)測(cè)階段, 可以利用該模型輸出 K 個(gè)bounding box預(yù)測(cè)結(jié)果, 同時(shí)可以利用NMS算法得到置信度更高的Box集合, 然后將這些集合送到分類器中進(jìn)行分類.

訓(xùn)練目標(biāo): 假設(shè)對(duì)于一個(gè)訓(xùn)練樣本, 具有 M 個(gè)已經(jīng)標(biāo)注好的GT bounding box. 然后, 檢測(cè)器會(huì)生成 K 個(gè)預(yù)測(cè)的bounding box, K 的值一般遠(yuǎn)遠(yuǎn)大于 M. 因此, 我們僅僅需要優(yōu)化 K 中與 M 個(gè)GT匹配度最高的一個(gè)子集合. 優(yōu)化的時(shí)候, 我們盡可能的提高這些子集合內(nèi)部的預(yù)測(cè)框的置信度, 同時(shí)降低其他那些不在子集合里面的框的置信度. 對(duì)此, 形式化描述為下面的函數(shù):

F_{match}(x,l) = \frac{1}{2} \sum_{i,j} x_{ij} \|l_i - g_j\|_2^2

上式中, x_{ij}=1 當(dāng)且僅當(dāng)?shù)?i 個(gè)預(yù)測(cè)框與第 j 個(gè)真實(shí)框匹配. l_ig_j 分別是預(yù)測(cè)框和真實(shí)框的歸一化后的坐標(biāo).

此外, 我們還希望對(duì)預(yù)測(cè)框的置信度進(jìn)行優(yōu)化, 將匹配框的置信度最大化, 這個(gè)過(guò)程轉(zhuǎn)換成最小化下面的式子:

F_{conf}(x,c) = -\sum{i,j} x_{i,j} log(c_i) - \sum_i (1 - \sum_j x_{ij}) log(1-c_i)

從上式可以看到, \sum_j x_{ij} = 1 當(dāng)且僅當(dāng)預(yù)測(cè)框 i 可以匹配到某個(gè)真實(shí)框. 在這種情況下, c_i 將王越來(lái)越大的方向優(yōu)化. 上面這個(gè)式子正式交叉熵.

結(jié)合上面的兩個(gè)公式, 最終的損失函數(shù)如下所示, 其中 \alpha 用于調(diào)節(jié)兩部分的權(quán)重:

F(x,l,c) = \alpha F_{match}(x,l) + F_{conf}(x,c)

優(yōu)化: 對(duì)于每一個(gè)訓(xùn)練樣本, 都希望按照如下最優(yōu)化問題求得 x^* (也就是最優(yōu)化預(yù)測(cè)框與真實(shí)框的匹配方案) :

x^* = \arg \min_x F(x,l,c)
\text{subject to } x_{ij} \in \{0, 1\}, \sum_i x_{ij}=1

由于標(biāo)記物體的數(shù)量非常少, 所以上面公式的計(jì)算復(fù)雜度并不高. 對(duì)于上面的公式, 可以利用BP算法分別對(duì) l_ic_i 求導(dǎo), 以便更新相關(guān)參數(shù)使其損失函數(shù)值更低.

Training Details:

使用了三個(gè)小改動(dòng), 進(jìn)一步提升了精度的速度

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子墩莫,更是在濱河造成了極大的恐慌,老刑警劉巖绣张,帶你破解...
    沈念sama閱讀 221,548評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異关带,居然都是意外死亡侥涵,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門豫缨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人端朵,你說(shuō)我怎么就攤上這事好芭。” “怎么了冲呢?”我有些...
    開封第一講書人閱讀 167,990評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵舍败,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng)邻薯,這世上最難降的妖魔是什么裙戏? 我笑而不...
    開封第一講書人閱讀 59,618評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮厕诡,結(jié)果婚禮上累榜,老公的妹妹穿的比我還像新娘。我一直安慰自己灵嫌,他們只是感情好壹罚,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著寿羞,像睡著了一般猖凛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上绪穆,一...
    開封第一講書人閱讀 52,246評(píng)論 1 308
  • 那天辨泳,我揣著相機(jī)與錄音,去河邊找鬼玖院。 笑死菠红,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的司恳。 我是一名探鬼主播途乃,決...
    沈念sama閱讀 40,819評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼扔傅!你這毒婦竟也來(lái)了耍共?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤猎塞,失蹤者是張志新(化名)和其女友劉穎试读,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體荠耽,經(jīng)...
    沈念sama閱讀 46,268評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钩骇,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了铝量。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片倘屹。...
    茶點(diǎn)故事閱讀 40,488評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖慢叨,靈堂內(nèi)的尸體忽然破棺而出纽匙,到底是詐尸還是另有隱情,我是刑警寧澤拍谐,帶...
    沈念sama閱讀 36,181評(píng)論 5 350
  • 正文 年R本政府宣布烛缔,位于F島的核電站馏段,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏践瓷。R本人自食惡果不足惜院喜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望晕翠。 院中可真熱鬧喷舀,春花似錦、人聲如沸崖面。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)巫员。三九已至庶香,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間简识,已是汗流浹背赶掖。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留七扰,地道東北人奢赂。 一個(gè)月前我還...
    沈念sama閱讀 48,897評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像颈走,于是被迫代替她去往敵國(guó)和親膳灶。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • 夢(mèng)里夢(mèng)的夢(mèng) 叫醒了瞳孔 愿你披著風(fēng)踏著勇立由。夢(mèng)外夢(mèng)的夢(mèng) 沉睡了惶恐 愿你尋它有蹤轧钓。握緊雙手 做一刻英雄 下一秒鐘攤開...
    何夢(mèng)曉閱讀 3,506評(píng)論 35 126
  • ?不知是煙霧,還是塵土遮住了棱棱角角的山锐膜,云彩躲在后面毕箍,任由陽(yáng)光肆意灑下。人們似乎被炎熱逼回了家道盏,窗外了無(wú)一人而柑。樹...
    西夕肸閱讀 191評(píng)論 0 0