SSD:single shot multibox detector

總體:

? ? ? 之前的主流的目標檢測和識別都是深度學習模型結(jié)合區(qū)域和高性能分類器共同完成,雖然這種方法有較好的識別精度缴啡,但是整個模型需要很高的硬件資源且實時性不好。weiliu的SSD類似于YOLO基于回歸的方法解藻,但與之不同的是在其基礎上加入了類似于faster rcnn的anchor機制孝治,這相當于在回歸的基礎上結(jié)合一部分區(qū)域建議的功能。SSD 將輸出一系列離散化的 bounding boxes作為default box福侈,這些 bounding boxes 是在不同層次layers上的 feature maps 上生成的酒来,并且有著不同的aspect ratio和scale。在預測的時候網(wǎng)絡會在每個default box 出現(xiàn)的類別(category)打分肪凛,并調(diào)整box更好的match物體的shape堰汉。另外,網(wǎng)絡會結(jié)合不同不同分辨率的feature map的預測值來更好的處理各種size的物體伟墙。SSD相較于需要proposal的方法更簡單翘鸭,因為它完全消除了proposal generation和subsequent pixel或者特征重采樣feature resampling階段,將整個放入單一網(wǎng)絡戳葵,所有的檢測和識別都可用一個網(wǎng)絡搞定就乓。基于區(qū)域建議的方法由于存在候選區(qū)域的提取拱烁,使得算法的時間花費很大生蚁,實時性比較差,而基于回歸的目標檢測識別沒有候選區(qū)域提取的這一步驟戏自,且識別和檢測在同一網(wǎng)絡里邦投,很容易做到實時

特點:

快且精度較高;

使用小的卷積濾波器預測物體類別和boundingbox的位置offset擅笔,在不同的aspect ratio的檢測時用不同預測器志衣,并將他們都應用于multiple feature maps從而使檢測器能具備多尺度檢測。這樣的話就可以使用不同layers來預測不同尺度從而使檢測器對于低像素的檢測精度提高很多猛们,檢測速度也很快

算法細節(jié):

如上圖念脯,a中SSD訓練需要輸入圖片及每一個物體的ground truth ,b阅懦,c兩種不同的feature map中不同aspect ratio的一系列default box和二,我們預測每一個類別conf:c1,c2..Cp的offset:△(cx,cy耳胎,w惯吕,h)惕它,訓練的時候我們首先將defau box match到gt boxes,比如我們將default box match到上圖的貓和狗废登,這個就當成positive其余的default box就看成negatives淹魄。模型的loss=localization loss(e.g.Smooth L1)+confidence loss(e.g.Softmax).

模型:

??

SSD的方法基于對當前物體boxes的類別實例產(chǎn)生和收集收集一系列固定尺寸的boundingbox 和score,接著通過非最大抑制NMS來產(chǎn)生最終的檢測堡距。前端的網(wǎng)絡層是基于高性能的圖片分類器標準架構(gòu)(在分類層classification layer前截斷)甲锡,后面再加:

多尺度特征圖:

在前段網(wǎng)路層后面加入幾層卷積特征層,這些層的size依次減小羽戒,允許多尺度的檢測器預測缤沦,,這些用來預測檢測的卷積模型對于不同的特征層是不同的易稠。

卷積預測器

每一個增加的feature layer 或者base network存在的的feature map缸废,會生成一系列固定的大小的predictions,對于一個大小為m×n驶社,具有p通道的特征層企量,使用的 convolutional filters 就是3×3×p的 kernels。產(chǎn)生的 predictions亡电,那么就是歸屬類別的一個得分嫂用,或者就是相對于 default box coordinate 的 shape offset

Default boxes 和 aspect ratios

每一個 box 相對于與其對應的 feature map cell 的位置是固定的惫霸。 在每一個 feature map cell 中蔓钟,我們要?predict得到的 box與default box之間的offsets匈织,以及每一個 box 中包含物體的 score(每一個類別概率都要計算出)槐脏。

如上圖蜜托,F(xiàn)eature map cell 是小格子 虛線是default box释液。使用小的卷積濾波器預測物體類別和boundingbox的位置offset熏矿,在不同的aspect ratio的檢測時用不同預測器,并將他們都應用于multiple feature maps從而使檢測器能具備多尺度檢測孝凌。這樣的話就可以使用不同layers來預測不同尺度從而使檢測器這樣對于低像素的檢測精度提高很多,檢測速度也很快

需要注意的:

ground truth只是出現(xiàn)在底層月腋,高層沒有g(shù)round truth蟀架,所以小物體檢測的語義信息,相對信息差一些榆骚。

faster rcnn,yolo,ssd對小目標檢測結(jié)果都不好片拍,原因在于卷積網(wǎng)絡結(jié)構(gòu)的最后一層feature map太小,例如32*32的目標經(jīng)過vgg后變成2*2妓肢,導致之后的檢測和回歸無法滿足要求捌省。SSD使用的VGG16作為特征抽取,SSD中最小尺度的檢測是conv4_3的feature map再經(jīng)過一層卷積輸出的,位于整個網(wǎng)絡非车锬疲靠前的位置纲缓。在conv4_3feature map的分辨率已經(jīng)縮小了8倍,在conv5_3縮小了16倍.比如一個32*32大小的物體,在vgg16 的 conv5_3的feature map 對應僅為2*2. 位置信息有較大的損失.

SSD里負責檢測小目標的層為conv4_3(38*38)對應的尺度為0.2(可人為設置)卷拘。這就對應了SSD所能檢測的尺度大概為0.2上下。在這種情況下祝高,如果物體過于小的話栗弟,甚至在訓練階段,GT都沒法找到相應的的default box與它匹配工闺,效果怎么可能會好乍赫。如果不介意整體檢測效果的話,可以把尺度調(diào)低陆蟆,看看對于小目標的檢測效果是否有提升雷厂。另外,利用多尺度進行檢測也能提高小物體的檢測效果

目前大概有兩種方法可能決絕這個問題:

1. 使用不同層的特征: 比如hyperNet, MultiPath.

2. 保證感受也不縮小的情況下feature map的分辨率不至于縮小太多.這種思路可以考慮采用DeepLab中采用的Hole algorithm.在保證感受野的同時分辨變化較小.

?3.SSD對于高分辨率的底層特征沒有再利用叠殷,而這些層對于檢測小目標很重要罗侯。 Feature Pyramid Networks for Object Detection,就很好的解決這個問題溪猿。

This is not surprising because those small objects may not even have any information at the very top layers.



钩杰。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市诊县,隨后出現(xiàn)的幾起案子讲弄,更是在濱河造成了極大的恐慌,老刑警劉巖依痊,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件避除,死亡現(xiàn)場離奇詭異,居然都是意外死亡胸嘁,警方通過查閱死者的電腦和手機瓶摆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來性宏,“玉大人群井,你說我怎么就攤上這事『潦ぃ” “怎么了书斜?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長酵使。 經(jīng)常有香客問我荐吉,道長,這世上最難降的妖魔是什么口渔? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任样屠,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘痪欲。我一直安慰自己悦穿,他們只是感情好,可當我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布勤揩。 她就那樣靜靜地躺著咧党,像睡著了一般。 火紅的嫁衣襯著肌膚如雪陨亡。 梳的紋絲不亂的頭發(fā)上傍衡,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天,我揣著相機與錄音负蠕,去河邊找鬼蛙埂。 笑死,一個胖子當著我的面吹牛遮糖,可吹牛的內(nèi)容都是我干的绣的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼欲账,長吁一口氣:“原來是場噩夢啊……” “哼屡江!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起赛不,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤惩嘉,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后踢故,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體文黎,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年殿较,在試婚紗的時候發(fā)現(xiàn)自己被綠了耸峭。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡淋纲,死狀恐怖劳闹,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情帚戳,我是刑警寧澤玷或,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站片任,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蔬胯。R本人自食惡果不足惜对供,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧产场,春花似錦鹅髓、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至确徙,卻和暖如春醒串,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背鄙皇。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工芜赌, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人伴逸。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓缠沈,卻偏偏與公主長得像,于是被迫代替她去往敵國和親错蝴。 傳聞我的和親對象是個殘疾皇子洲愤,可洞房花燭夜當晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容