前言
很多人都認為人臉識別是一項非常難以實現(xiàn)的工作,看到名字就害怕蔚出,然后心懷忐忑到網(wǎng)上一搜弟翘,看到網(wǎng)上N頁的教程立馬就放棄了。這些人里包括曾經(jīng)的我自己骄酗。其實如果如果你不是非要深究其中的原理稀余,只是要實現(xiàn)這一工作的話,人臉識別也沒那么難酥筝。今天我們就來看看如何在40行代碼以內簡單地實現(xiàn)人臉識別滚躯。
一點區(qū)分
對于大部分人來說雏门,區(qū)分人臉檢測和人臉識別完全不是問題嘿歌。但是網(wǎng)上有很多教程有無無意地把人臉檢測說成是人臉識別掸掏,誤導群眾,造成一些人認為二者是相同的宙帝。其實丧凤,人臉檢測解決的問題是確定一張圖上有木有人臉,而人臉識別解決的問題是這個臉是誰的步脓≡复可以說人臉檢測是是人識別的前期工作。今天我們要做的是人臉識別靴患。
所用工具
Anaconda 2——Python 2
Dlib
scikit-image
Dlib
對于今天要用到的主要工具仍侥,還是有必要多說幾句的。Dlib是基于現(xiàn)代C++的一個跨平臺通用的框架鸳君,作者非常勤奮农渊,一直在保持更新。Dlib內容涵蓋機器學習或颊、圖像處理砸紊、數(shù)值算法、數(shù)據(jù)壓縮等等囱挑,涉獵甚廣醉顽。更重要的是,Dlib的文檔非常完善平挑,例子非常豐富游添。就像很多庫一樣,Dlib也提供了Python的接口弹惦,安裝非常簡單否淤,用pip只需要一句即可:
pip install dlib
上面需要用到的scikit-image同樣只是需要這么一句:
pip install scikit-image
- 注:如果用pip install dlib安裝失敗的話,那安裝起來就比較麻煩了棠隐。錯誤提示很詳細石抡,按照錯誤提示一步步走就行了。
人臉識別
之所以用Dlib來實現(xiàn)人臉識別助泽,是因為它已經(jīng)替我們做好了絕大部分的工作啰扛,我們只需要去調用就行了。Dlib里面有人臉檢測器嗡贺,有訓練好的人臉關鍵點檢測器隐解,也有訓練好的人臉識別模型。今天我們主要目的是實現(xiàn)诫睬,而不是深究原理煞茫。感興趣的同學可以到官網(wǎng)查看源碼以及實現(xiàn)的參考文獻。今天的例子既然代碼不超過40行,其實是沒啥難度的续徽。有難度的東西都在源碼和論文里蚓曼。
首先先通過文件樹看一下今天需要用到的東西:
準備了六個候選人的圖片放在candidate-faces文件夾中,然后需要識別的人臉圖片test.jpg钦扭。我們的工作就是要檢測到test.jpg中的人臉纫版,然后判斷她到底是候選人中的誰。另外的girl-face-rec.py是我們的python腳本客情。shape_predictor_68_face_landmarks.dat是已經(jīng)訓練好的人臉關鍵點檢測器其弊。dlib_face_recognition_resnet_model_v1.dat是訓練好的ResNet人臉識別模型。ResNet是何凱明在微軟的時候提出的深度殘差網(wǎng)絡膀斋,獲得了 ImageNet 2015 冠軍梭伐,通過讓網(wǎng)絡對殘差進行學習,在深度和精度上做到了比CNN 更加強大仰担。
1. 前期準備
shape_predictor_68_face_landmarks.dat和dlib_face_recognition_resnet_model_v1.dat都可以在這里找到籽御。不能點擊超鏈接的可以直接輸入以下網(wǎng)址:http://dlib.net/files/。
然后準備幾個人的人臉圖片作為候選人臉惰匙,最好是正臉技掏。放到candidate-faces文件夾中。
本文這里準備的是六張圖片项鬼,如下:
她們分別是
然后準備四張需要識別的人臉圖像哑梳,其實一張就夠了,這里只是要看看不同的情況:
可以看到前兩張和候選文件中的本人看起來還是差別不小的绘盟,第三張是候選人中的原圖鸠真,第四張圖片微微側臉,而且右側有陰影龄毡。
2.識別流程
數(shù)據(jù)準備完畢吠卷,接下來就是代碼了。識別的大致流程是這樣的:
- 先對候選人進行人臉檢測沦零、關鍵點提取祭隔、描述子生成后,把候選人描述子保存起來路操。
- 然后對測試人臉進行人臉檢測疾渴、關鍵點提取、描述子生成屯仗。
- 最后求測試圖像人臉描述子和候選人臉描述子之間的歐氏距離搞坝,距離最小者判定為同一個人。
3.代碼
代碼不做過多解釋魁袜,因為已經(jīng)注釋的非常完善了桩撮。以下是girl-face-rec.py
# -*- coding: UTF-8 -*-
import sys,os,dlib,glob,numpy
from skimage import io
if len(sys.argv) != 5:
? ? print "請檢查參數(shù)是否正確"
exit()
# 1.人臉關鍵點檢測器
predictor_path = sys.argv[1]
# 2.人臉識別模型
face_rec_model_path = sys.argv[2]
# 3.候選人臉文件夾
faces_folder_path = sys.argv[3]
# 4.需識別的人臉
img_path = sys.argv[4]
# 1.加載正臉檢測器
detector = dlib.get_frontal_face_detector()
# 2.加載人臉關鍵點檢測器
sp = dlib.shape_predictor(predictor_path)
# 3. 加載人臉識別模型
facerec = dlib.face_recognition_model_v1(face_rec_model_path)
# win = dlib.image_window()
# 候選人臉描述子list
descriptors = []
# 對文件夾下的每一個人臉進行:
# 1.人臉檢測
# 2.關鍵點檢測
# 3.描述子提取
for f in glob.glob(os.path.join(faces_folder_path, "*.jpg")):
? ? print("Processing file: {}".format(f))
? ? img = io.imread(f)
? ? #win.clear_overlay()
? ? #win.set_image(img)
? ? # 1.人臉檢測
? ? dets = detector(img, 1)
? ? print("Number of faces detected: {}".format(len(dets)))
? ? for k, d in enumerate(dets):
? ? # 2.關鍵點檢測
? ? ? ? shape = sp(img, d)
? ? ? ? # 畫出人臉區(qū)域和和關鍵點
? ? ? ? # win.clear_overlay()
? ? ? ? # win.add_overlay(d)
? ? ? ? # win.add_overlay(shape)
? ? ? ? # 3.描述子提取敦第,128D向量
? ? ? ? face_descriptor = facerec.compute_face_descriptor(img, shape)
? ? ? ? # 轉換為numpy array
? ? ? ? v = numpy.array(face_descriptor)
? ? ? ? descriptors.append(v)
# 對需識別人臉進行同樣處理
# 提取描述子,不再注釋
img = io.imread(img_path)
dets = detector(img, 1)
dist = []
for k, d in enumerate(dets):
? ? shape = sp(img, d)
? ? face_descriptor = facerec.compute_face_descriptor(img, shape)
? ? d_test = numpy.array(face_descriptor)
# 計算歐式距離
for i in descriptors:
? ? dist_ = numpy.linalg.norm(i-d_test)
? ? dist.append(dist_)
# 候選人名單
candidate = ['Unknown1','Unknown2','Shishi','Unknown4','Bingbing','Feifei']
# 候選人和距離組成一個dict
c_d = dict(zip(candidate,dist))
cd_sorted = sorted(c_d.iteritems(), key=lambda d:d[1])
print "\n The person is: ",cd_sorted[0][0]
dlib.hit_enter_to_continue()
?4.運行結果
我們在.py所在的文件夾下打開命令行店量,運行如下命令
python girl-face-rec.py 1.dat 2.dat ./candidate-faecs test1.jpg
由于shape_predictor_68_face_landmarks.dat和dlib_face_recognition_resnet_model_v1.dat名字實在太長申尼,所以我把它們重命名為1.dat和2.da。
運行結果如下:
The person is Bingbing垫桂。
記憶力不好的同學可以翻上去看看test1.jpg是誰的圖片。有興趣的話可以把四張測試圖片都運行下試試粟按。
這里需要說明的是诬滩,前三張圖輸出結果都是非常理想的。但是第四張測試圖片的輸出結果是候選人4灭将。對比一下兩張圖片可以很容易發(fā)現(xiàn)混淆的原因疼鸟。
機器畢竟不是人,機器的智能還需要人來提升庙曙。
有興趣的同學可以繼續(xù)深入研究如何提升識別的準確率空镜。比如每個人的候選圖片用多張,然后對比和每個人距離的平均值之類的捌朴。全憑自己了吴攒。