概述
anchor free的人臉檢測方法,同時定位5個關(guān)鍵點捞挥。輸入圖為640X480時,cpu可達到30FPS忧吟,性能也不錯砌函。
WIDER FACE Val/Test-Easy: 0.935/0.932, Medium: 0.924/0.921, Hard: 0.875/0.873 and FDDB discontinuous: 0.980, continuous: 0.732
通過熱圖預測人臉中心
對每一個人臉中心預測一個box,offset溜族,5個landmarks
主干網(wǎng)絡為mobilenet2+FPN
輸入圖保證長寬為32的整數(shù)倍讹俊,輸出圖相對輸入stride為4
github:只提供了demo和model,無訓練代碼煌抒。
實際測試在自拍大頭照上比較差仍劈。可能跟訓練樣本有關(guān)摧玫。
細節(jié)
- 模型輸出為:heatmap(B,1,H/4,W/4),scale(B,2,H/4,W/4),offset(B,2,H/4,W/4),landmark(B,10,H/4,W/4)
- heatmap分支同objects as points耳奕,采用focal loss
focal loss.png
- 由于熱圖只能預測整數(shù)位置绑青,故加上偏移
Loff.png
off.png - scale
size.png
-
landmarks
landmark.png -
總體loss
total loss.png - 增廣:隨機反轉(zhuǎn),隨機scale屋群,color jitter闸婴,隨機crop方塊resize到800*800