目標(biāo)定位
目標(biāo)檢測(cè)的任務(wù)是在圖片中定位物體帚豪,并將位置標(biāo)注出來(lái)
標(biāo)記四類存在與否碳竟,定位需要定位目標(biāo)中心坐標(biāo)(b_x, b_y)以及圖片的高度(b_h)和寬度(b_w)
輸出可以定義為以下形式:
y_hat 為softmax 的輸出,為八個(gè)元素
第一個(gè)元素 P_c 表示是否有物體(1/0)
接下來(lái)四個(gè)元素定位目標(biāo)(b_x, b_y, b_h, b_w)狸臣,
最后三個(gè)元素表示是否是行人(c1:1/0)莹桅,是否是汽車(c2:1/0)是否是摩托(c3:1/0)
損失函數(shù)
如果 P_c = 1 表示有目標(biāo)出現(xiàn),則 Loos = 8個(gè)元素各自的差的平方之和
如果 P_c = 0 表示沒(méi)有目標(biāo)出現(xiàn)烛亦,則 Loos = P_c的差的平方
因此诈泼,對(duì)于M個(gè)特征點(diǎn)來(lái)說(shuō),輸出要有2m+1個(gè)元素煤禽,第一個(gè)代表是否出現(xiàn)該目標(biāo)铐达,其余每2個(gè)元素表示一個(gè)特征點(diǎn)的 x坐標(biāo)和 y 坐標(biāo)。
目標(biāo)檢測(cè)
1.滑動(dòng)窗口法:
首先選定一個(gè)特定大小的窗口檬果,將窗口內(nèi)的圖片輸入到模型中進(jìn)行預(yù)測(cè)瓮孙;以固定步幅滑動(dòng)該窗口,遍歷圖像的每個(gè)區(qū)域选脊,對(duì)窗內(nèi)的各個(gè)小圖不斷輸入模型進(jìn)行預(yù)測(cè)杭抠;繼續(xù)選取一個(gè)更大的窗口,再次遍歷圖像的每個(gè)區(qū)域恳啥,對(duì)區(qū)域內(nèi)是否有車進(jìn)行預(yù)測(cè)偏灿;遍歷整個(gè)圖像,可以保證在每個(gè)位置都能檢測(cè)到是否有車角寸。
卷積的滑動(dòng)窗口實(shí)現(xiàn):
利用類似卷積核的原理實(shí)現(xiàn)滑動(dòng)窗口菩混,采用和單個(gè)窗口同樣的各層的卷積核來(lái)操作圖片忿墅,可以一次性將所有滑動(dòng)窗口的結(jié)果計(jì)算出來(lái)
2. YOLO 算法:
將圖片分割成n×n個(gè)小的圖片
在圖像的n×n個(gè)格子中分別應(yīng)用圖片分類和定位算法
卷積核方式一次計(jì)算出所有格子的結(jié)果, 計(jì)算效率較高
每個(gè)格子的輸出為8個(gè)元素(P_c, b_x, b_y, b_h, b_w, c1, c2, c3)扁藕,則所有格子的結(jié)果為 nxnx8
對(duì)于每個(gè)網(wǎng)格,以左上角為(0,0)疚脐,以右下角為(1,1)亿柑;
中點(diǎn)b_x、b_y 表示坐標(biāo)值棍弄,在0~1之間望薄;
寬高b_h疟游、b_w 表示比例值,存在>1的情況痕支。
交并比(IOU):交集大小/并集大小颁虐,用來(lái)檢測(cè)預(yù)測(cè)邊界框的準(zhǔn)確性。
多個(gè)格子都認(rèn)為自己是中心卧须,檢測(cè)到了一輛車另绩,那么同一輛車就可能被檢出多次,非最大值抑制可以確保我們的算法對(duì)每個(gè)對(duì)象只檢測(cè)一次花嘶。(預(yù)測(cè)的形狀面積重合多的認(rèn)為是重復(fù)的笋籽,只保留概率最高的那個(gè))
以單個(gè)對(duì)象檢測(cè)為例。對(duì)于圖片每個(gè)網(wǎng)格預(yù)測(cè)輸出矩陣:yi=[P_c, b_x, b_h, b_w]椭员,其中P_c表示有對(duì)象的概率车海,拋棄P_c <= 0.6的邊界框。對(duì)剩余的邊界框隘击,選取最大Pc值的邊界框侍芝,作為預(yù)測(cè)輸出邊界框;拋棄和選取的邊界框IoU?0.5的剩余的邊界框埋同。
3. Anchor Boxes 算法:
使用Anchor Box可以讓一個(gè)檢測(cè)出多個(gè)對(duì)象竭贩。每個(gè)對(duì)象都和以前一樣分配到同一個(gè)格子里面,但是現(xiàn)在還要分配到一個(gè)Anchor Box莺禁,分配的原則是比較并選擇該格子內(nèi)對(duì)象與定義的Anchor Box不同形狀之間的IOU交并比最高的那個(gè)留量。
優(yōu)點(diǎn):1.處理兩個(gè)不同類型的對(duì)象出現(xiàn)在同一格子里面,實(shí)際情況中如果格子夠細(xì)致的話哟冬,一般不會(huì)出現(xiàn)兩個(gè)格子在一個(gè)對(duì)象里面的楼熄。2.能夠讓算法更有針對(duì)行(監(jiān)督學(xué)習(xí)),如果你的數(shù)據(jù)給出的對(duì)象的形狀大概相似浩峡。