目標(biāo)檢測(cè)基礎(chǔ)

1. 目標(biāo)檢測(cè)和邊界框

實(shí)際上是人工生成一系列有限個(gè)框,然后給這些框打標(biāo)簽

2. 錨框

目標(biāo)檢測(cè)算法通常會(huì)在輸入圖像中采樣大量的區(qū)域须教,然后判斷這些區(qū)域中是否包含我們感興趣的目標(biāo),并調(diào)整區(qū)域邊緣從而更準(zhǔn)確地預(yù)測(cè)目標(biāo)的真實(shí)邊界框(ground-truth bounding box)坦喘。不同的模型使用的區(qū)域采樣方法可能不同枝嘶。這里我們介紹其中的一種方法:它以每個(gè)像素為中心生成多個(gè)大小和寬高比(aspect ratio)不同的邊界框。這些邊界框被稱為錨框(anchor box)甜无。

2.1 生成多個(gè)錨框

假設(shè)輸入圖像高為h,寬為w哥遮。我們分別以圖像的每個(gè)像素為中心生成不同形狀的錨框岂丘。設(shè)大小為s∈(0,1]且寬高比為r>0,那么錨框的寬和高將分別為ws\sqrt{r}和 hs/\sqrt{r} 眠饮。當(dāng)中心位置給定時(shí)奥帘,已知寬和高的錨框是確定的。

下面我們分別設(shè)定好一組大小 s_1,…,s_n 和一組寬高比r_1,…,r_m仪召。如果以每個(gè)像素為中心時(shí)使用所有的大小與寬高比的組合寨蹋,輸入圖像將一共得到 whnm個(gè)錨框。雖然這些錨框可能覆蓋了所有的真實(shí)邊界框扔茅,但計(jì)算復(fù)雜度容易過高已旧。因此,我們通常只對(duì)包含s_1r_1的大小與寬高比的組合感興趣召娜,即

(s_1,r_1),(s_1,r_2),…,(s_1,r_m),(s_2,r_1),(s_3,r_1),…,(s_n,r_1).

也就是說运褪,以相同像素為中心的錨框的數(shù)量為n+m?1。對(duì)于整個(gè)輸入圖像,我們將一共生成wh(n+m?1)個(gè)錨框吐句。

2.2 交并比

我們剛剛提到某個(gè)錨框較好地覆蓋了圖像中的狗胁后。如果該目標(biāo)的真實(shí)邊界框已知,這里的“較好”該如何量化呢嗦枢?一種直觀的方法是衡量錨框和真實(shí)邊界框之間的相似度。我們知道屯断,Jaccard系數(shù)(Jaccard index)可以衡量?jī)蓚€(gè)集合的相似度文虏。給定集合 A 和 B ,它們的Jaccard系數(shù)即二者交集大小除以二者并集大兄逞荨:

J(A,B)=\frac{|A∩B|}{|A∪B|}.

實(shí)際上氧秘,我們可以把邊界框內(nèi)的像素區(qū)域看成是像素的集合。如此一來趴久,我們可以用兩個(gè)邊界框的像素集合的Jaccard系數(shù)衡量這兩個(gè)邊界框的相似度丸相。當(dāng)衡量?jī)蓚€(gè)邊界框的相似度時(shí),我們通常將Jaccard系數(shù)稱為交并比(Intersection over Union彼棍,IoU)灭忠,即兩個(gè)邊界框相交面積與相并面積之比,如圖9.2所示座硕。交并比的取值范圍在0和1之間:0表示兩個(gè)邊界框無重合像素弛作,1表示兩個(gè)邊界框相等。


IoU

2.3 標(biāo)注訓(xùn)練集的錨框

在訓(xùn)練集中华匾,我們將每個(gè)錨框視為一個(gè)訓(xùn)練樣本映琳。為了訓(xùn)練目標(biāo)檢測(cè)模型,我們需要為每個(gè)錨框標(biāo)注兩類標(biāo)簽:一是錨框所含目標(biāo)的類別蜘拉,簡(jiǎn)稱類別萨西;二是真實(shí)邊界框相對(duì)錨框的偏移量,簡(jiǎn)稱偏移量(offset)旭旭。在目標(biāo)檢測(cè)時(shí)谎脯,我們首先生成多個(gè)錨框,然后為每個(gè)錨框預(yù)測(cè)類別以及偏移量您机,接著根據(jù)預(yù)測(cè)的偏移量調(diào)整錨框位置從而得到預(yù)測(cè)邊界框穿肄,最后篩選需要輸出的預(yù)測(cè)邊界框。

2.4 輸出預(yù)測(cè)邊界框

在模型預(yù)測(cè)階段际看,我們先為圖像生成多個(gè)錨框咸产,并為這些錨框一一預(yù)測(cè)類別和偏移量。隨后仲闽,我們根據(jù)錨框及其預(yù)測(cè)偏移量得到預(yù)測(cè)邊界框脑溢。當(dāng)錨框數(shù)量較多時(shí),同一個(gè)目標(biāo)上可能會(huì)輸出較多相似的預(yù)測(cè)邊界框。為了使結(jié)果更加簡(jiǎn)潔屑彻,我們可以移除相似的預(yù)測(cè)邊界框验庙。常用的方法叫作非極大值抑制(non-maximum suppression,NMS)社牲。

我們來描述一下非極大值抑制的工作原理粪薛。對(duì)于一個(gè)預(yù)測(cè)邊界框B,模型會(huì)計(jì)算各個(gè)類別的預(yù)測(cè)概率搏恤。設(shè)其中最大的預(yù)測(cè)概率為p违寿,該概率所對(duì)應(yīng)的類別即B的預(yù)測(cè)類別。我們也將 p 稱為預(yù)測(cè)邊界框 B 的置信度熟空。在同一圖像上藤巢,我們將預(yù)測(cè)類別非背景的預(yù)測(cè)邊界框按置信度從高到低排序,得到列表L息罗。從 L 中選取置信度最高的預(yù)測(cè)邊界框 B_1 作為基準(zhǔn)掂咒,將所有與 B_1的交并比大于某閾值的非基準(zhǔn)預(yù)測(cè)邊界框從L中移除。這里的閾值是預(yù)先設(shè)定的超參數(shù)迈喉。此時(shí)绍刮,L 保留了置信度最高的預(yù)測(cè)邊界框并移除了與其相似的其他預(yù)測(cè)邊界框。 接下來弊添,從L中選取置信度第二高的預(yù)測(cè)邊界框 B_2 作為基準(zhǔn)录淡,將所有與 B_2 的交并比大于某閾值的非基準(zhǔn)預(yù)測(cè)邊界框從L 中移除。重復(fù)這一過程油坝,直到L中所有的預(yù)測(cè)邊界框都曾作為基準(zhǔn)嫉戚。此時(shí)L中任意一對(duì)預(yù)測(cè)邊界框的交并比都小于閾值。最終澈圈,輸出列表L中的所有預(yù)測(cè)邊界框彬檀。

3. 多尺度目標(biāo)檢測(cè)

在1.節(jié) 錨框中,我們?cè)趯?shí)驗(yàn)中以輸入圖像的每個(gè)像素為中心生成多個(gè)錨框瞬女。這些錨框是對(duì)輸入圖像不同區(qū)域的采樣窍帝。然而,如果以圖像每個(gè)像素為中心都生成錨框诽偷,很容易生成過多錨框而造成計(jì)算量過大坤学。舉個(gè)例子,假設(shè)輸入圖像的高和寬分別為561像素和728像素报慕,如果以每個(gè)像素為中心生成5個(gè)不同形狀的錨框深浮,那么一張圖像上則需要標(biāo)注并預(yù)測(cè)200多萬個(gè)錨框561\times728\times5

減少錨框個(gè)數(shù)并不難眠冈。一種簡(jiǎn)單的方法是在輸入圖像中均勻采樣一小部分像素飞苇,并以采樣的像素為中心生成錨框。此外,在不同尺度下布卡,我們可以生成不同數(shù)量和不同大小的錨框雨让。值得注意的是,較小目標(biāo)比較大目標(biāo)在圖像上出現(xiàn)位置的可能性更多忿等。舉個(gè)簡(jiǎn)單的例子:形狀為1\times1栖忠、1\times2、2\times2的目標(biāo)在形狀為2\times2的圖像上可能出現(xiàn)的位置分別有4贸街、2和1種娃闲。因此,當(dāng)使用較小錨框來檢測(cè)較小目標(biāo)時(shí)匾浪,我們可以采樣較多的區(qū)域;而當(dāng)使用較大錨框來檢測(cè)較大目標(biāo)時(shí)卷哩,我們可以采樣較少的區(qū)域蛋辈。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市将谊,隨后出現(xiàn)的幾起案子冷溶,更是在濱河造成了極大的恐慌,老刑警劉巖尊浓,帶你破解...
    沈念sama閱讀 211,376評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件逞频,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡栋齿,警方通過查閱死者的電腦和手機(jī)苗胀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瓦堵,“玉大人基协,你說我怎么就攤上這事」接茫” “怎么了澜驮?”我有些...
    開封第一講書人閱讀 156,966評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)惋鸥。 經(jīng)常有香客問我杂穷,道長(zhǎng),這世上最難降的妖魔是什么卦绣? 我笑而不...
    開封第一講書人閱讀 56,432評(píng)論 1 283
  • 正文 為了忘掉前任耐量,我火速辦了婚禮,結(jié)果婚禮上迎卤,老公的妹妹穿的比我還像新娘拴鸵。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,519評(píng)論 6 385
  • 文/花漫 我一把揭開白布劲藐。 她就那樣靜靜地躺著八堡,像睡著了一般。 火紅的嫁衣襯著肌膚如雪聘芜。 梳的紋絲不亂的頭發(fā)上兄渺,一...
    開封第一講書人閱讀 49,792評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音汰现,去河邊找鬼挂谍。 笑死,一個(gè)胖子當(dāng)著我的面吹牛瞎饲,可吹牛的內(nèi)容都是我干的口叙。 我是一名探鬼主播,決...
    沈念sama閱讀 38,933評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼嗅战,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼妄田!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起驮捍,我...
    開封第一講書人閱讀 37,701評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤疟呐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后东且,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體启具,經(jīng)...
    沈念sama閱讀 44,143評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,488評(píng)論 2 327
  • 正文 我和宋清朗相戀三年珊泳,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了鲁冯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,626評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡旨椒,死狀恐怖晓褪,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情综慎,我是刑警寧澤涣仿,帶...
    沈念sama閱讀 34,292評(píng)論 4 329
  • 正文 年R本政府宣布,位于F島的核電站示惊,受9級(jí)特大地震影響好港,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜米罚,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,896評(píng)論 3 313
  • 文/蒙蒙 一钧汹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧录择,春花似錦拔莱、人聲如沸碗降。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽讼渊。三九已至,卻和暖如春尊剔,著一層夾襖步出監(jiān)牢的瞬間爪幻,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國打工须误, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留挨稿,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,324評(píng)論 2 360
  • 正文 我出身青樓京痢,卻偏偏與公主長(zhǎng)得像奶甘,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子祭椰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,494評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容