19.1 交并比
- 如果該目標的真實邊界框已知入篮,這里的“較好”該如何量化呢?
- 一種直觀的方法是衡量錨框和真實邊界框之間的相似度幌甘。
- Jaccard系數(shù)(Jaccard index)可以衡量兩個集合的相似度潮售。
-
給定集合A和B,它們的Jaccard系數(shù)即二者交集大小除以二者并集大泄纭:
- 實際上酥诽,可以把邊界框內的像素區(qū)域看成是像素的集合。
- 如此一來遏弱,可以用兩個邊界框的像素集合的Jaccard系數(shù)衡量這兩個邊界框的相似度盆均。
- 當衡量兩個邊界框的相似度時,通常將Jaccard系數(shù)稱為交并比(Intersection over Union漱逸,IoU)泪姨,即兩個邊界框相交面積與相并面積之比,如圖所示饰抒。
-
交并比的取值范圍在0和1之間:0表示兩個邊界框無重合像素肮砾,1表示兩個邊界框相等。
- 交并比是兩個邊界框相交面積與相并面積之比
-
19.2 標注訓練集的錨框
- 在訓練集中袋坑,將每個錨框視為一個訓練樣本
- 為了訓練目標檢測模型仗处,需要為每個錨框標注兩類標簽:
- 一是錨框所含目標的類別,簡稱類別
- 二是真實邊界框相對錨框的偏移量枣宫,簡稱偏移量(offset)
- 在目標檢測時婆誓,首先生成多個錨框,然后為每個錨框預測類別以及偏移量也颤,接著根據(jù)預測的偏移量調整錨框位置從而得到預測邊界框洋幻,最后篩選需要輸出的預測邊界框
- 在目標檢測的訓練集中,每個圖像已標注了真實邊界框的位置以及所含目標的類別
-
在生成錨框之后翅娶,主要依據(jù)與錨框相似的真實邊界框的位置和類別信息為錨框標注
- 標注錨框的類別和偏移量
-
設錨框A及其被分配的真實邊界框B的中心坐標分別為
-
A和B的寬分別為
-
高分別為
-
一個常用的技巧是將A的偏移量標注為:
-
其中常數(shù)的默認值為
如果一個錨框沒有被分配真實邊界框文留,只需將該錨框的類別設為背景好唯。
類別為背景的錨框通常被稱為負類錨框,其余則被稱為正類錨框燥翅。
-
19.3 輸出預測邊界框
-
移除相似的預測邊界框:非極大值抑制(non-maximum suppression骑篙,NMS)。
- 非極大值抑制的工作原理:
- 對于一個預測邊界框B森书,模型會計算各個類別的預測概率靶端。
- 設其中最大的預測概率為p,該概率所對應的類別即B的預測類別拄氯。
- 將p稱為預測邊界框B的置信度
- 在同一圖像上躲查,將預測類別非背景的預測邊界框按置信度從高到低排序它浅,得到列表L译柏。
- 從L中選取置信度最高的預測邊界框B1作為基準,將所有與B1的交并比大于某閾值的非基準預測邊界框從L中移除姐霍。這里的閾值是預先設定的超參數(shù)鄙麦。
- 此時,L保留了置信度最高的預測邊界框并移除了與其相似的其他預測邊界框镊折。
- 接下來胯府,從L中選取置信度第二高的預測邊界框B2作為基準,將所有與B2的交并比大于某閾值的非基準預測邊界框從L中移除恨胚。
- 重復這一過程骂因,直到L中所有的預測邊界框都曾作為基準。
- 此時L中任意一對預測邊界框的交并比都小于閾值赃泡。
-
最終寒波,輸出列表L中的所有預測邊界框。
大數(shù)據(jù)視頻推薦:
騰訊課堂
CSDN
大數(shù)據(jù)語音推薦:
企業(yè)級大數(shù)據(jù)技術應用
大數(shù)據(jù)機器學習案例之推薦系統(tǒng)
自然語言處理
大數(shù)據(jù)基礎
人工智能:深度學習入門到精通