原文發(fā)表在個(gè)人博客Technology-機(jī)器學(xué)習(xí)-人臉識(shí)別矿筝,轉(zhuǎn)載請(qǐng)注明出處。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域念脯,其動(dòng)機(jī)在于建立狞洋、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來解釋數(shù)據(jù)绿店。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)
局部連接
傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)是全連接吉懊,即一層的神經(jīng)元與上一層的所有神經(jīng)元都建立連接,這樣導(dǎo)致參數(shù)非常多假勿,計(jì)算量非常大借嗽,而CNN是局部連接,一層的神經(jīng)元只與上一層的部分神經(jīng)元建立連接转培,這樣可以減少參數(shù)和計(jì)算量恶导。
權(quán)值共享
給一張輸入圖片,用一個(gè)filter去掃時(shí)浸须,filter里面的數(shù)就叫權(quán)重惨寿。用該filter對(duì)整個(gè)圖片進(jìn)行了某個(gè)特征的掃描,例如Edge detection删窒,這個(gè)過程就是權(quán)值共享裂垦,因?yàn)闄?quán)重不變。
人臉識(shí)別
多個(gè)CNN加其他層易稠,遍歷而成的人臉識(shí)別處理結(jié)構(gòu):
層提取到的信息的演進(jìn):
人臉檢測(cè)
傳統(tǒng)算法
識(shí)別:滑動(dòng)窗口+分類器
用一個(gè)固定大小的窗口去滑動(dòng)掃描圖像缸废,并通過分類器去分辨是否是人臉。有時(shí)候人臉在圖片中過小驶社,所以還要通過放大圖片來掃描企量。
訓(xùn)練:特征+Adaboost
傳統(tǒng)特征:LBP/HOG/Harr
圖片原始的RGB信息,維度太高亡电,計(jì)算量過大届巩,且不具備魯棒性,即光照和旋轉(zhuǎn)份乒,對(duì)RGB信息影響非常大恕汇。
利用LBP得到二進(jìn)制值,再轉(zhuǎn)換成十進(jìn)制:
效果圖:
Adaboost
由于移動(dòng)設(shè)備對(duì)計(jì)算速度有一定要求或辖,所以用多個(gè)弱分類器加權(quán)疊加來完成一個(gè)強(qiáng)分類器瘾英,從而保證速度。
深度學(xué)習(xí)
特征的選取是比較復(fù)雜的颂暇,可能需要大量的統(tǒng)計(jì)學(xué)和生物學(xué)知識(shí)積累缺谴,而深度學(xué)習(xí)不需要選擇特征,這是其很大優(yōu)勢(shì)耳鸯,另外通過GPU代替CPU等方式湿蛔,可以得到一個(gè)更好的效果膀曾。
關(guān)鍵點(diǎn)檢測(cè)、跟蹤
傳統(tǒng)算法
Cascade regression/ESR/SDM
傳統(tǒng)算法步驟:
- 根據(jù)人臉檢測(cè)的框位置阳啥,先初始化初始臉部輪廓位置;
- 進(jìn)行上一步位置和圖形特征檢測(cè)下一步位置(一般是迭代殘差);
- 進(jìn)行迭代添谊,最終得到相對(duì)準(zhǔn)確的輪廓位置。
深度學(xué)習(xí)
深度學(xué)習(xí)算法步驟:
- 對(duì)圖像進(jìn)行輪廓定位態(tài)校正;
- 全局粗定位;
- 局部精細(xì)定位察迟。
典型應(yīng)用:
人臉語義分割
人臉語義分割:自定確定人臉每個(gè)pixel的所屬類別(哪個(gè)器官)斩狱。
基于CDNN訓(xùn)練一個(gè)直接model輸入圖像到輸出概率map的模型,然后將圖像輸入扎瓶,即可得出pixel-level的分類概率輸出喊废。
典型應(yīng)用:
屬性識(shí)別
人臉屬性識(shí)別:自動(dòng)估計(jì)人臉的屬性,比如性別栗弟、年齡污筷、表情、人種乍赫、是否佩戴眼鏡瓣蛀、美丑等。
傳統(tǒng)算法
步驟:
- 基于特征點(diǎn)定位結(jié)果進(jìn)行幾何矯正;
- 手工特征提取(HOG\LBP\GABOR)
- 分類器/回歸(SVM\BOOSTRING)
深度學(xué)習(xí)
基于CDNN雷厂,直接在一個(gè)網(wǎng)絡(luò)中學(xué)習(xí)并識(shí)別出多個(gè)屬性惋增。
典型應(yīng)用:
活體檢測(cè)
活體檢測(cè):確定識(shí)別的物體是活物,而非死物改鲫。
人臉識(shí)別
人臉識(shí)別:根據(jù)人臉的表觀特征自動(dòng)識(shí)別人的身份诈皿。
深度學(xué)習(xí)
通過深度學(xué)習(xí)來進(jìn)學(xué)習(xí)特征,讓同一個(gè)人在特征空間中距離非常近像棘,而不同人則非常遠(yuǎn)稽亏,且必須具備不受光照等影響的魯棒性。
基本步驟
- 人臉檢測(cè);
- 關(guān)鍵點(diǎn)定位;
- 人臉表示缕题。
人臉切割
將人臉切割成小塊截歉,每塊去學(xué)習(xí)Model。
特征融合
將每一塊學(xué)習(xí)到的特征烟零,進(jìn)行特征融合瘪松。
訓(xùn)練過程
- 訓(xùn)練分類;
- 對(duì)于兩張照片的比較,用pairwise模式進(jìn)行訓(xùn)練锨阿,得到兩張圖的特征宵睦,并計(jì)算特征間的距離,小于閾值時(shí)墅诡,則判斷為同一個(gè)人;
- 對(duì)于三張照片的比較壳嚎,用triplet模式進(jìn)行訓(xùn)練,得到三張圖之間的關(guān)系,而不是關(guān)注于距離值诬辈。
看了又看:
300行代碼實(shí)現(xiàn)手寫漢字識(shí)別
如何在一周內(nèi)做一款拼音輸入法
iOS-線程同步詳解