目前狈定,人臉關(guān)鍵點(diǎn)檢測(cè)算法在安防,娛樂(lè)等領(lǐng)域的應(yīng)用越來(lái)越多,很多創(chuàng)業(yè)公司纽什,BAT等大公司措嵌,直播、美顏公司等芦缰,都有自己的產(chǎn)品企巢。我們針對(duì)較為流行的幾款人臉標(biāo)定產(chǎn)品進(jìn)行測(cè)試比對(duì),分析各家產(chǎn)品的特點(diǎn)让蕾,方便技術(shù)人員學(xué)習(xí)與開發(fā)浪规。
我們主要選擇了商湯、曠視探孝、智云視圖笋婿、顏鑒、百度等公司的產(chǎn)品進(jìn)行測(cè)試顿颅,其中商湯缸濒、曠視、智云視圖的SDK都提供統(tǒng)一的106點(diǎn)關(guān)鍵點(diǎn)元镀,顏鑒、百度提供了在線測(cè)試霎桅,沒(méi)有離線的SDK可以提供測(cè)試栖疑,我們僅測(cè)試在線模型,作為參考滔驶。
人臉關(guān)鍵點(diǎn)檢測(cè)算法相對(duì)來(lái)說(shuō)已經(jīng)比較成熟遇革,針對(duì)2D人臉關(guān)鍵點(diǎn),我們首先回顧一下目前較好的算法揭糕。2D人臉關(guān)鍵點(diǎn)萝快,ERT算法采用隨機(jī)蕨的方式,速度快著角,但是如果追求高準(zhǔn)確度揪漩,模型較大。3000FPS算法吏口,根據(jù)開源代碼奄容,能夠做到300fps左右,但是同樣模型較大产徊。主流的方式大多采用深度學(xué)習(xí)的方式昂勒,CVPR18的兩篇,一個(gè)商湯的LAB舟铜,利用邊緣信息戈盈,另外SAN,訓(xùn)練數(shù)據(jù)進(jìn)行角度等分析谆刨,這些方式都具有較好的思路塘娶,但是在移動(dòng)端的實(shí)用性不強(qiáng)归斤。
針對(duì)移動(dòng)端106標(biāo)定,我們?cè)谧约簶?biāo)注的1000張直播數(shù)據(jù)集上進(jìn)行了測(cè)評(píng)血柳,主要測(cè)試了商湯SDK官册,face++ SDK,以及智云視圖的SDK难捌。對(duì)比模型大小膝宁,運(yùn)行時(shí)間,準(zhǔn)確率根吁。針對(duì)服務(wù)器端的準(zhǔn)確率员淫,我們測(cè)試了face++,百度击敌,顏鑒介返,由于各家的標(biāo)定數(shù)據(jù)不統(tǒng)一,我們只能給出一個(gè)主觀的比較沃斤。
商湯face landmark(2018.04)圣蝎、face++ landmark(2018.09)、HyperLandmark(2018.08)
速度(華為P10):6ms 衡瓶、6ms徘公、9ms
模型大小:1.3MB哮针,1.6MB关面,2.1MB
精度(平均誤差):8.3%,8.1%十厢,9.6%
在線人臉標(biāo)定:face++等太,百度,顏鑒蛮放。
主觀打分(6個(gè)人)缩抡,分為1-5個(gè)等級(jí),分別為(5包颁,5缝其,4)
部分結(jié)果展示:
TBA