?文章首發(fā)于微信公眾號(hào) 《與有三學(xué)AI》
【技術(shù)綜述】人臉年齡估計(jì)研究現(xiàn)狀
今天給大家?guī)硪黄四樧R(shí)別中的年齡估計(jì)技術(shù)陷谱,年齡特征作為人類的一種重要生物特征,計(jì)算機(jī)要如何基于人臉圖像估計(jì)年齡呢哮幢?
01概述
簡單地說蛮浑,基于人臉圖像的年齡估計(jì)是指機(jī)器根據(jù)面部圖像推測出人的大概年齡或所屬的年齡范圍( 年齡段)。
基于人臉圖像的年齡估計(jì)系統(tǒng)一般分為人臉檢測與定位浪箭,年齡特征提取婴梧,年齡估計(jì)下梢,系統(tǒng)性能評價(jià)幾個(gè)部分。根據(jù)提取特征方式的不同又分為傳統(tǒng)方法和深度學(xué)習(xí)方法志秃。同一張圖在不同應(yīng)用中的測定(左商湯右年齡檢測器)
不同的人臉在同一應(yīng)用中測定(百度云AI為例)
不同年齡不同膚色在年齡估計(jì)系統(tǒng)中評分測試
如果基于人臉圖像的年齡估計(jì)問題得到解決怔球,那么在日常生活中基于年齡信息的各種人機(jī)交互系統(tǒng)將在現(xiàn)實(shí)生活中有著極大的應(yīng)用需求。
市場主流年齡估計(jì)軟件包括商湯科技浮还,face++竟坛,百度云AI體驗(yàn)中心,騰訊云AI體驗(yàn)中心钧舌,年齡檢測儀担汤。我們隨機(jī)拿了一些名人照片做測試,總體說來face++在測試集上表現(xiàn)最好洼冻。
02人臉年齡數(shù)據(jù)集與算法評價(jià)指標(biāo)
2.1 公開數(shù)據(jù)集
2.1.1 The IMDB-WIKI dataset數(shù)據(jù)集 【1】
網(wǎng)址:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
介紹:從IMDb和維基百科上爬取的名人圖片崭歧,根據(jù)照片拍攝時(shí)間戳和出生日期計(jì)算得到的年齡信息。應(yīng)該是目前最大的人臉年齡數(shù)據(jù)集
大凶怖巍: 共523051張face images
標(biāo)簽:年齡和性別
2.1.2 Adience Benchmark Of Unfiltered Faces For Gender AndAge Classification 數(shù)據(jù)集【2】
網(wǎng)址:https://www.openu.ac.il/home/hassner/Adience/data.html#frontalized
介紹:iPhone5或更新的智能手機(jī)拍攝
標(biāo)簽:年齡段(0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60+)
大新誓搿:26580張, 2284人
2.1.3 Cross-Age Celebrity Dataset (CACD)【3】
網(wǎng)址:http://bcsiriuschen.github.io/CARC/
描述:與數(shù)據(jù)集2.1.1類似
標(biāo)簽:年齡
大形荼搿:163446張名人圖片所宰,約4.4G
更多數(shù)據(jù)集可自行了解。
2.2 算法評價(jià)指標(biāo)
目前常用的年齡估計(jì)評價(jià)指標(biāo)包括平均絕對誤差( MAE) 和累積指數(shù)(CS) 畜挥。
2.2.1 MAE
平均絕對誤差是指估計(jì)年齡和真實(shí)年齡之間絕對誤差的平均值仔粥,其表達(dá)式為
2.2.2 CS
年齡估計(jì)性能評價(jià)中,人們關(guān)注更多的是所估計(jì)出的年齡值的絕對誤差范圍是否在人們能接受的范圍內(nèi)蟹但,因此累積指數(shù)被用于年齡估計(jì)的性能評價(jià)中躯泰,累積指數(shù)的定義如下:
式中,Nθ≤j表示測試圖像中估計(jì)年齡與真實(shí)年齡的絕對誤差不超過j年的測試圖像數(shù)华糖,分母N為所有測試圖像的總數(shù)麦向。因此CS越大,說明估計(jì)年齡越接近真實(shí)年齡客叉,年齡估計(jì)越準(zhǔn)確磕蛇。
03傳統(tǒng)方法研究思路
傳統(tǒng)方法研究思路景描,自然就是手動(dòng)提取特征,我們基于參考文獻(xiàn)【4】來做說明秀撇。
傳統(tǒng)方法即手動(dòng)提取特征,傳統(tǒng)方法可粗略劃分為手動(dòng)提取特征和年齡估計(jì)兩個(gè)階段向族。
根據(jù)特征所反映的人臉信息呵燕,可以將常用的人臉年齡特征分為形狀特征、紋理特征件相、代數(shù)特征以及混合特征再扭。由于每種類型的特征均從不同角度描述了人臉圖像,為了充分利用各種特征的優(yōu)點(diǎn)夜矗,研究人員通常綜合集成多種人臉特征泛范,并采用不同的數(shù)學(xué)方法對其進(jìn)行處理,從而形成了各具特色的面部年齡特征提取模型紊撕。常見的特征提取模型包括人體測量學(xué)模型( anthropometric models) 罢荡、特征子空間模型(AGES) 、柔性模型( flexible models) 对扶、流形學(xué)習(xí)( age manifold)以及外觀模型( appearance model) 等区赵。
3.1特征提取模型
3.1.1 人體測量學(xué)模型
a) 主要內(nèi)容:
人體測量學(xué)模型利用了人臉的幾何形狀特征進(jìn)行年齡分類,主要是描述隨著年齡的增長人臉整體輪廓變化的數(shù)學(xué)規(guī)律浪南,它所測量的是人臉的一種結(jié)構(gòu)信息笼才。主要過程歸納為人臉輪廓檢測,人臉特征點(diǎn)定位络凿,多種幾何比例測量(如兩眼之間的間距骡送、兩眼之間的間距等),最后利用幾何比例進(jìn)行年齡段的區(qū)分絮记。
b) 適用范圍:
主要適合于對未成年人進(jìn)行年齡分類
c) 局限性:
由于該模型對人體姿態(tài)變換比較敏感摔踱,因此主要適用于提取正面人臉圖像的年齡特征
3.1.2 柔性模型
a) 主要內(nèi)容:
柔性模型將人臉的形狀與灰度/紋理有機(jī)結(jié)合起來,從整體入手到千,充分提取人臉圖像的形狀信息和全局紋理信息昌渤,可以看作是人體測量學(xué)模型的升級(jí)版,其典型的代表是主動(dòng)形狀模型( ASM) 和主動(dòng)外觀模型(AAM)憔四。
b) 適用范圍:
該模型可以更好地適應(yīng)復(fù)雜圖像的特征點(diǎn)定位和特征提取膀息,不僅適用于對青少年進(jìn)行年齡分類,也適用于對中老年人進(jìn)行分類了赵。
c) 局限性:
? 1) 隨著年齡的增長潜支,人臉紋理的變化更多地體現(xiàn)在局部區(qū)域,如額頭柿汛、眼角冗酿、臉頰等埠对,因此采用該模型進(jìn)行特征提取時(shí),將會(huì)丟失掉很多局部紋理信息裁替,可能不利于對老年人進(jìn)行年齡估計(jì)项玛。
? 2) 在訓(xùn)練過程中,柔性模型通常將形狀和紋理空間分別進(jìn)行訓(xùn)練弱判,這將會(huì)損失掉大量紋理和形狀之間的有效信息襟沮。
? 3) 此外柔性模型的確定依賴于很多臉部特征點(diǎn)的準(zhǔn)確定位,一旦定位出現(xiàn)誤差昌腰,這種誤差將很容易在后續(xù)處理中被放大开伏。
3.1.3 外觀模型
a) 主要內(nèi)容:
外觀模型將人臉幾何特征與全局信息,局部信息(如面部紋理信息遭商、頻率信息和膚色信息)相融合進(jìn)行人臉描述固灵,進(jìn)而進(jìn)行年齡估計(jì),可以看作是柔性模型的升級(jí)版劫流,目前應(yīng)用最為廣泛巫玻。
b) 適用范圍:
它較好地描述了面部的紋理特性,并常常與形狀特征相融合困介,可以較好地實(shí)現(xiàn)全年齡段的年齡估計(jì)大审。
c) 局限性:
只能用于粗略估計(jì),給出一個(gè)大概的年齡段座哩。
3.2 年齡估計(jì)
基于人臉圖像的年齡估計(jì)是一類“特殊”的模式識(shí)別問題: 一方面由于每個(gè)年齡值都可以看作是一個(gè)類徒扶,所以年齡估計(jì)可以被看作是一種分類問題;另一方面根穷,年齡值的增長是一個(gè)有序數(shù)列的不斷變化過程姜骡,因此年齡估計(jì)也可被視為一種回歸問題。有研究者通過對已有年齡估計(jì)工作進(jìn)行總結(jié)后認(rèn)為: 針對不同的年齡數(shù)據(jù)庫和不同的年齡特征屿良、分類模式和回歸模式具有各自的優(yōu)越性圈澈,因此將二者有機(jī)融合可以有效提高年齡估計(jì)的精度。由于傳統(tǒng)的年齡估計(jì)模式忽略了人臉?biāo)ダ系膭?dòng)態(tài)性尘惧,最近研究人員又將Rank模型引入到年齡估計(jì)方法中康栈,并取得了較好的效果。
3.2.1 分類模型
每個(gè)年齡值都可以看作是一個(gè)類喷橙,所以年齡估計(jì)可以被看作是一種分類問題啥么。分類模式采用模式分類的理念與方法實(shí)現(xiàn)年齡的估計(jì)》∮猓可以分為對年齡段進(jìn)行分類和對具體年齡值進(jìn)行分類悬荣。
3.2.2 回歸模型
年齡值的增長是一個(gè)有序數(shù)列的不斷變化過程,因此年齡估計(jì)也可被視為一種回歸性問題疙剑÷扔兀回歸模式運(yùn)用回歸分析的方法践叠,通過建立表征人臉年齡變化規(guī)律的函數(shù)模型來實(shí)現(xiàn)年齡的估計(jì)。
3.2.3 Rank模型
人類衰老是一個(gè)“動(dòng)態(tài)”變化的個(gè)性化過程嚼蚀。傳統(tǒng)的基于分類模式的年齡估計(jì)把年齡分成了若干個(gè)年齡段禁灼,沒有考慮到不同年齡之間的相互關(guān)系,因此損失了很多重要的信息; 傳統(tǒng)的回歸模式雖然考慮到了年齡之間的相關(guān)性轿曙,但是卻假設(shè)人的衰老是一個(gè)“靜態(tài)”過程匾二,即不同年齡的人的衰老變化規(guī)律一致。此外拳芙,在日常生活中,我們對一個(gè)人進(jìn)行年齡判定時(shí)皮璧,總是將該人臉與我們熟悉的且知道相應(yīng)年齡的人臉圖像進(jìn)行比較舟扎,通過綜合大量的比較結(jié)果進(jìn)行年齡判斷。
因此悴务,年齡估計(jì)過程可以看成是對大量人臉有效信息對進(jìn)行比較的過程睹限,也就是通過若干組二值分類結(jié)果就可以得到相應(yīng)的年齡估計(jì)值,通過尋找當(dāng)前年齡標(biāo)簽在年齡序列中的相對位置來確定最終的年齡值讯檐,從而有效克服了傳統(tǒng)的年齡估計(jì)方法忽略了人類面部衰老過程中的動(dòng)態(tài)性羡疗、模糊性以及個(gè)性化的特點(diǎn).
3.2.4 混合年齡估計(jì)模型
不同的估計(jì)模式具有不同的優(yōu)勢,因此可以將各種估計(jì)模式綜合起來進(jìn)行年齡的估計(jì)别洪。所謂混合年齡估計(jì)模式就是使用多個(gè)不同的年齡估計(jì)器代替單個(gè)年齡估計(jì)器來進(jìn)行年齡估計(jì)叨恨。
04深度學(xué)習(xí)方法研究思路
近年來伴隨著深度學(xué)習(xí)的火爆,應(yīng)用深度學(xué)習(xí)方法解決人臉年齡估計(jì)問題成為了主流挖垛。
實(shí)際上痒钝,就是利用深度學(xué)習(xí)自己學(xué)習(xí)特征,替換掉了上面?zhèn)鹘y(tǒng)方法提取的一系列特征痢毒。在大數(shù)據(jù)的加持下送矩,模型的魯棒性遠(yuǎn)超傳統(tǒng)方法。下圖就是文獻(xiàn)【1】哪替,奪得ChaLearn LAP 2015 challenge的pipeline栋荸。
該文是多個(gè)模型的融合,將年級(jí)估計(jì)問題作為一個(gè)0~100歲的101類的分類問題來研究凭舶。
有的文獻(xiàn)【5】會(huì)利用神經(jīng)網(wǎng)絡(luò)提取特征后做一些PCA的維度晌块,實(shí)際上筆者認(rèn)為沒有這個(gè)必要。
在經(jīng)過正確的人臉檢測和對齊后库快,現(xiàn)有的深度學(xué)習(xí)模型完全能夠end-to-end的解決這個(gè)問題摸袁。
05總結(jié)
基于人臉的年齡估計(jì)仍然是一個(gè)可以繼續(xù)研究的問題,因?yàn)橐悦李伒葹榇淼募夹g(shù)义屏,干擾著算法的準(zhǔn)確性靠汁。
不過蜂大,年齡的估計(jì)本身就不一定能反映真實(shí)的生理年齡,有的人就是比同齡人顯得年輕很多或者老很多蝶怔,所以該技術(shù)不可能像指紋識(shí)別或者人臉識(shí)別一樣奶浦,在非常重要的應(yīng)用中獨(dú)當(dāng)一面,而只能作為輔助算法踢星。不過澳叉,研究研究還是很好玩的。
作者:言有三
鏈接:http://www.reibang.com/p/1861b7dc9a0e
來源:簡書
簡書著作權(quán)歸作者所有沐悦,任何形式的轉(zhuǎn)載都請聯(lián)系作者獲得授權(quán)并注明出處成洗。