1. 簡介
人臉關(guān)鍵點檢測,是人臉識別壳澳、視頻娛樂化等應(yīng)用的基礎(chǔ)算法,用于標定人臉輪廓及五官茫经。研究人員大多基于300w巷波,helen等68點數(shù)據(jù)集進行算法的研究,存在訓(xùn)練集小卸伞,標定點不充分等因素抹镊。目前業(yè)內(nèi)主流算法包括face++及商湯的人臉標定sdk,支持106點人臉關(guān)鍵點標定荤傲。北京智云視圖科技有限公司開源了一款106人臉標定SDK垮耳,在主流android平臺每幀速度5-8ms,速度快遂黍,穩(wěn)定性高终佛,效果與商湯及face++人臉標定SDK效果基本一致,這里提供給大家免費使用雾家。
為了獲得更好的性能铃彰,近些年設(shè)計的CNN更深,更復(fù)雜榜贴,這樣明顯阻礙了模型的部署應(yīng)用豌研。而手機端的應(yīng)用越來越廣泛妹田,因此唬党,一種輕量化,高效率的網(wǎng)絡(luò)——Shufflenet鬼佣,應(yīng)運而生驶拱。ECCV 2018,face++團隊將Shufflenet-V1的升級版——Shufflenet-V2.我們改進了Shufflenet-v2的結(jié)構(gòu)晶衷,用于關(guān)鍵點特征提取蓝纲。
Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks
近幾年,人臉關(guān)鍵點檢測大多在“由粗到精”(coarse to fine)上研究晌纫,而這篇文章則另辟蹊徑税迷。依作者所說,這是第一篇在人臉關(guān)鍵點檢測任務(wù)上對loss function進行討論分析的文章锹漱,文章在loss function上進行改進箭养,為人臉關(guān)鍵點檢測任務(wù)提出“專用”的loss function——Wing loss,作者的出發(fā)點值得借鑒哥牍。
人臉姿態(tài)估計毕泌,顧名思義喝检,給定一張人臉圖像,確定其姿態(tài)撼泛,姿態(tài)由什么構(gòu)成呢挠说?很簡單(pitch,yaw愿题,roll)三種角度损俭,分別代表上下翻轉(zhuǎn),左右翻轉(zhuǎn)潘酗,平面內(nèi)旋轉(zhuǎn)的角度撩炊。?
目前,人臉姿態(tài)估計有多種方法崎脉,可以分為基于模型的方法拧咳,基于表觀的方法,基于分類的方法囚灼。我之前做過 這方面的調(diào)研骆膝,調(diào)研的結(jié)果很明顯,基于模型的方法得到的效果最好灶体,因為其得到的人臉姿態(tài)是連續(xù)的阅签,而另外兩種,是離散的蝎抽,并且很耗時間政钟。基于模型的估計方法的前提是樟结,手頭必須具備兩樣?xùn)|西养交,一個是人臉特征點(眼鏡,嘴巴瓢宦,鼻子等處的像素位置)碎连,另外一個,是需要自己制作一個3維的,正面的“標準模型”。算法最重要的還是思想逼泣,其余諸如流程什么的,都是實現(xiàn)思想的手段而已倒戏。人臉姿態(tài)估計的思想:旋轉(zhuǎn)三維標準模型一定角度,直到模型上“三維特征點”的“2維投影”恐似,與待測試圖像上的特征點(圖像上的特征點顯然是2維)盡量重合杜跷。這時候我們腦海中就應(yīng)該浮現(xiàn)出一種詭異的場景:在幽暗的燈光中,一個發(fā)著淡藍色光芒的人皮面具一點點的“自我調(diào)整”,突然一下子“完美無缺”的“扣在了你的臉上”葱椭。這就是人臉姿態(tài)估計的思想捂寿。參考:人臉姿態(tài)估計
我們在訓(xùn)練過程中,加入了多任務(wù)孵运,包括微笑秦陋、張嘴、墨鏡治笨、年齡驳概、性別等屬性的識別。
人臉標定目前是短視頻社交旷赖、人臉識別領(lǐng)域應(yīng)用廣泛顺又,我們旨在提供一種可行的方案,讓更多的用戶能夠體驗新的算法帶來的效果提升等孵,同時提供一個交流的平臺稚照,使得更多的算法愛好者進行交流。
https://blog.csdn.net/u011995719/article/details/79435615