Outer Faces: 不能夠匹配足夠數(shù)量的positive anchors的人臉沽甥;
High-quality anchors: 回歸Bounding Boxes與對(duì)應(yīng)的ground truth的IoU大于0.5的這些anchors俐填;
1. 介紹
文章基于Anchors框架安接,作者提到,有效的anchor設(shè)計(jì)非常重要英融,這直接影響了FD的性能盏檐。如何選擇anchor尺寸仍然是個(gè)難點(diǎn),一般會(huì)存在錯(cuò)位現(xiàn)象驶悟,如下圖所示:
(a) 圖表示在不同anchor尺度下胡野,每個(gè)ground truth face 匹配的平均anchor數(shù)量;
(b) 圖表示在不同anchor尺度下痕鳍,可以匹配到anchors的人臉的比例硫豆。
從圖中可以看出,雖然隨著anchor 尺度的增大笼呆,每個(gè)人臉匹配的anchors數(shù)量增多熊响,但是能匹配anchors的真實(shí)人臉比例在下降汗茄,這種錯(cuò)位現(xiàn)象啟發(fā)anchor scales的設(shè)計(jì)。
為了解決這種錯(cuò)位現(xiàn)象瞳腌,有兩個(gè)代表性的方法:
1)通過增加offsetting anchors的anchor補(bǔ)償策略,補(bǔ)償 outer faces挑宠;
2) Zhu et al 指定了EMO評(píng)價(jià)標(biāo)準(zhǔn)瞭空,進(jìn)而設(shè)計(jì)更合理的anchor stride和感受野南捂。
盡管這些方法幫助outer faces匹配了更多的anchors,但是也生成了大量冗余或者低質(zhì)量的anchors鞭缭。
從上圖中可以看到,補(bǔ)償?shù)腶nchors與ground truth 產(chǎn)生的平均IoU只有0.42仑濒,所以這種方法使得outer faces匹配到了更多低質(zhì)量的anchors。
作者利用PyramidBox作為Face detector進(jìn)行anchor匹配統(tǒng)計(jì)實(shí)驗(yàn),發(fā)現(xiàn)了一個(gè)非常有趣的現(xiàn)象瞭吃,如下如所示:
這里紅色曲線是累計(jì)IoU的累計(jì)分布曲線,其中IoU是ground truth與可以被正確預(yù)測(cè)的回歸anchors和蚪,這里采用的閾值為0.35,只有在訓(xùn)練階段當(dāng)IoU大于0.35的anchor催束,才被認(rèn)為是匹配的anchors。下圖我們可以發(fā)現(xiàn),inference階段罕容,回歸大于0.35的ancho只值占11%露泊,所以作者認(rèn)為梧喷,不僅僅是匹配的anchors汇歹,那些未匹配的anchors同樣有著重要的地位。然而痰哨,在訓(xùn)練階段,那些未匹配的anchors被認(rèn)為是背景,這是不合理的游昼。如何有效利用這些未匹配的anchors對(duì)提升人臉檢測(cè)的性能非常重要。
作者通過定義High-quality Anchors闲昭,如下圖所示鸯绿,可以看出有65%的High-quality Anchors在訓(xùn)練階段是為匹配的∠鲜郑基于此,作者認(rèn)為當(dāng)前的anchors機(jī)制是不靈活的牺六,并且沒有充分利用anchors。
為了說明大部分回歸的bounding boxes都是未匹配的在訓(xùn)練階段未匹配的anchors艘蹋,作者利用下圖進(jìn)行描述:
其中橫坐標(biāo)表示與ground truth匹配的anchors數(shù)量,縱坐標(biāo)表示在匹配anchors數(shù)量一定的情況下,滿足當(dāng)前條件人臉的數(shù)量。
a) 紅色柱狀圖表示雕薪,在訓(xùn)練階段,當(dāng)IoU>0.35時(shí)蜈亩,與anchors匹配的人臉數(shù)量港华;
b) 藍(lán)色柱狀圖表示,在IoU>0.5時(shí),與回歸的bounding box匹配的人臉數(shù)量;這也就是經(jīng)過網(wǎng)絡(luò)回歸后High-quality Anchors的數(shù)量;
c) 綠色的圖表示,High-quality Anchors經(jīng)過NMS后,剩余的High-quality Anchors的數(shù)量。
上圖可以做如下解釋选浑,例如Number of Anchors = 時(shí)读恃,red = 3257胆数,經(jīng)過網(wǎng)絡(luò)回歸后,High-quality Anchors = 2442,再經(jīng)過NMS后,High-quality Anchors = 316。這里說明316個(gè)High-quality anchors是matched anchors回歸得到的,但是剩下的High-quality Anchors=2442-316=2126,這么多的High-quality Anchors怎么來的箩帚?焕参?作者認(rèn)為這些High-quality Anchors是由訓(xùn)練階段的未匹配Anchors回歸得到的刻帚,所以作者認(rèn)為訓(xùn)練階段未匹配的Anchors也有很強(qiáng)的回歸的能力顷歌。
為了進(jìn)一步說明和驗(yàn)證上述問題赦抖,作者提出了 Online High-quality Anchor Mining Strategy(HAMBox)。這個(gè)方法的思路就是挖掘那些隱藏的High-quality anchors 去給outer faces補(bǔ)償更多的anchors,從而提高回歸的準(zhǔn)確性盈电。