小目標檢測相關技巧總結

摘要概述

小目標問題在物體檢測和語義分割等視覺任務中一直是存在的一個難點云头,小目標的檢測精度通常只有大目標的一半公壤。


MS COCO instance segmentation challenge

CVPR2019論文: Augmentation for small object detection 提到了一些應對小目標檢測的方法,筆者結合這篇論文以及查閱其它資料,對小目標檢測相關技巧在本文進行了部分總結。

小目標的定義:在MS COCO數據集中贝室,面積小于 32*32 的物體被認為是小物體契讲。

MS COCO Metrics

在COCO數據集中,小目標的數量更多滑频,具體為:
41% of objects are small (area < 322)
34% are medium (322 < area < 962)
24% are large (area > 962)
area的計算方法:像素點的個數捡偏。
MS COCO Metrics 詳細介紹參考:https://blog.csdn.net/wangdongwei0/article/details/83033340

小目標難以檢測的原因:分辨率低,圖像模糊峡迷,攜帶的信息少银伟。由此所導致特征表達能力弱,也就是在提取特征的過程中绘搞,能提取到的特征非常少彤避,這不利于我們對小目標的檢測。

現有的比較流行的方法是如何解決小目標檢測問題的看杭?

1忠藤、由于小目標面積太小挟伙,可以放大圖片后再做檢測楼雹,也就是在尺度上做文章,如FPN(Feature Pyramid Networks for Object Detection)尖阔,SNIP(An Analysis of Scale Invariance in Object Detection – SNIP)贮缅。

Feature-Fused SSD: Fast Detection for Small Objects, Detecting Small Objects Using a Channel-Aware Deconvolutional Network 也是在多尺度上做文章的論文。

FPN

2介却、在Anchor上做文章(Faster Rcnn谴供,SSD, FPN都有各自的anchor設計),anchor在設置方面需要考慮三個因素:

anchor的密度:由檢測所用feature map的stride決定齿坷,這個值與前景閾值密切相關桂肌。

anchor的范圍:RetinaNet中是anchor范圍是32~512,這里應根據任務檢測目標的范圍確定永淌,按需調整anchor范圍崎场,或目標變化范圍太大如MS COCO,這時候應采用多尺度測試遂蛀。

anchor的形狀數量:RetinaNet每個位置預測三尺度三比例共9個形狀的anchor谭跨,這樣可以增加anchor的密度,但stride決定這些形狀都是同樣的滑窗步進李滴,需考慮步進會不會太大螃宙,如RetinaNet框架前景閾值是0.5時,一般anchor大小是stride的4倍左右所坯。

該部分anchor內容參考于:https://zhuanlan.zhihu.com/p/55824651

3谆扎、在ROI Pooling上做文章,文章SINet: A Scale-Insensitive Convolutional Neural Network for Fast Vehicle Detection 認為小目標在pooling之后會導致物體結構失真芹助,于是提出了新的Context-Aware RoI Pooling方法堂湖。


Context-Aware RoI Pooling

4籍凝、用生成對抗網絡(GAN)來做小目標檢測:Perceptual Generative Adversarial Networks for Small Object Detection。


Perceptual Generative Adversarial network

進一步從量化的角度來分析(參考CVPR2019論文:Augmentation for small object detection ):

COCO上的統(tǒng)計圖

1苗缩、從COCO上的統(tǒng)計圖可以發(fā)現饵蒂,小目標的個數多,占到了41.43%酱讶,但是含有小目標的圖片只有51.82%退盯,大目標所占比例為24.24%,但是含有大目標的圖像卻有82.28%泻肯。這說明有一半的圖像是不含小目標的渊迁,大部分的小目標都集中在一些少量的圖片中。這就導致在訓練的過程中灶挟,模型有一半的時間是學習不到小目標的特性的琉朽。

此外,對于小目標稚铣,平均能夠匹配的anchor數量為1個箱叁,平均最大的IoU為0.29,這說明很多情況下惕医,有些小目標是沒有對應的anchor或者對應的anchor非常少的耕漱,即使有對應的anchor,他們的IoU也比較小抬伺,平均最大的IoU也才0.29螟够。


anchor示意圖

如上圖,左上角是一個anchor示意圖峡钓,右上角是一個小目標所對應的anchor妓笙,一共有只有三個anchor能夠與小目標配對,且配對的IoU也不高能岩。左下角是一個大目標對應的anchor寞宫,可以發(fā)現有非常多的anchor能夠與其匹配。匹配的anchor數量越多捧灰,則此目標被檢出的概率也就越大淆九。

實現方法:
1、Oversampling :我們通過在訓練期間對這些圖像進行過采樣來解決包含小對象的相對較少圖像的問題(多用這類圖片)毛俏。在實驗中炭庙,我們改變了過采樣率和研究不僅對小物體檢測而且對檢測中大物體的過采樣效果

2、Copy-Pasting Strategies:將小物體在圖片中復制多分煌寇,在保證不影響其他物體的基礎上焕蹄,增加小物體在圖片中出現的次數(把小目標扣下來貼到原圖中去),提升被anchor包含的概率阀溶。

如上圖右下角腻脏,本來只有一個小目標鸦泳,對應的anchor數量為3個,現在將其復制三份永品,則在圖中就出現了四個小目標做鹰,對應的anchor數量也就變成了12個,大大增加了這個小目標被檢出的概率鼎姐。從而讓模型在訓練的過程中钾麸,也能夠有機會得到更多的小目標訓練樣本。

具體的實現方式如下圖:圖中網球和飛碟都是小物體炕桨,本來圖中只有一個網球饭尝,一個飛碟,通過人工復制的方式献宫,在圖像中復制多份钥平。同時要保證復制后的小物體不能夠覆蓋該原來存在的目標。

Copy pasting the small objects

參考代碼:https://github.com/zhpmatrix/VisDrone2018/tree/master/DataAug_Patching
該部分參考文章:https://zhuanlan.zhihu.com/p/57760020

網上有人說可以試一下lucid data dreaming Lucid Data Dreaming for Multiple Object Tracking姊途,這是一種在視頻跟蹤/分割里面比較有效的數據增強手段涉瘾,據說對于小目標物體檢測也很有效。

Lucid Data Dreaming for Multiple Object Tracking

參考代碼:https://github.com/ankhoreva/LucidDataDreaming

其他

基于無人機拍攝圖片的檢測目前也是個熱門研究點(難點是目標小吭净,密度大)睡汹。
相關論文:
The Unmanned Aerial Vehicle Benchmark: Object Detection and Tracking(數據集)
Drone-based Object Counting by Spatially Regularized Regional Proposal Network
Simultaneously Detecting and Counting Dense Vehicles from Drone Images
Vision Meets Drones: A Challenge(數據集)

參考文獻

1:https://zhuanlan.zhihu.com/p/55824651
2:https://zhuanlan.zhihu.com/p/57760020
3:https://www.zhihu.com/question/269877902/answer/548594081
4:https://zhuanlan.zhihu.com/p/60033229
5:https://arxiv.org/abs/1902.07296
6:http://openaccess.thecvf.com/content_cvpr_2017/papers/Li_Perceptual_Generative_Adversarial_CVPR_2017_paper.pdf
7:http://openaccess.thecvf.com/content_cvpr_2017/papers/Lin_Feature_Pyramid_Networks_CVPR_2017_paper.pdf

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市寂殉,隨后出現的幾起案子,更是在濱河造成了極大的恐慌原在,老刑警劉巖友扰,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異庶柿,居然都是意外死亡村怪,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門浮庐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來甚负,“玉大人,你說我怎么就攤上這事审残∷笥颍” “怎么了?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵搅轿,是天一觀的道長病涨。 經常有香客問我,道長璧坟,這世上最難降的妖魔是什么既穆? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任赎懦,我火速辦了婚禮,結果婚禮上幻工,老公的妹妹穿的比我還像新娘励两。我一直安慰自己,他們只是感情好囊颅,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布伐蒋。 她就那樣靜靜地躺著,像睡著了一般迁酸。 火紅的嫁衣襯著肌膚如雪先鱼。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天奸鬓,我揣著相機與錄音焙畔,去河邊找鬼。 笑死串远,一個胖子當著我的面吹牛宏多,可吹牛的內容都是我干的。 我是一名探鬼主播澡罚,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼伸但,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了留搔?” 一聲冷哼從身側響起更胖,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎隔显,沒想到半個月后却妨,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡括眠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年彪标,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片掷豺。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡捞烟,死狀恐怖,靈堂內的尸體忽然破棺而出当船,到底是詐尸還是另有隱情题画,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布生年,位于F島的核電站婴程,受9級特大地震影響,放射性物質發(fā)生泄漏抱婉。R本人自食惡果不足惜档叔,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一桌粉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧衙四,春花似錦铃肯、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至惦界,卻和暖如春挑格,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背沾歪。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工漂彤, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人灾搏。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓挫望,卻偏偏與公主長得像,于是被迫代替她去往敵國和親狂窑。 傳聞我的和親對象是個殘疾皇子媳板,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內容