1、真實邊界框(ground-truth bounding box)的坐標信息返回值是(左上x,左上y探越,寬,高)
2窑业、以每個像素為中心生成多個大小和寬高比(aspect ratio)不同的邊界框钦幔。這些邊界框被稱為錨框(anchor box)。
假設輸入圖像高為数冬,寬為节槐。我們分別以圖像的每個像素為中心生成不同形狀的錨框。設大小為(0,1]且寬高比為>0拐纱,那么錨框的寬和高將分別為和铜异。當中心位置給定時,已知寬和高的錨框是確定的秸架。
3揍庄、Jaccard系數(Jaccard index)可以衡量兩個集合的相似度。我們通常將Jaccard系數稱為交并比(Intersection over Union东抹,IoU)蚂子。給定集合和沃测,它們的Jaccard系數即二者交集大小除以二者并集大小:
4食茎、當錨框數量較多時蒂破,同一個目標上可能會輸出較多相似的預測邊界框。為了使結果更加簡潔别渔,我們可以移除相似的預測邊界框附迷。常用的方法叫作非極大值抑制(non-maximum suppression,NMS)哎媚。