隨著人工智能的日益火熱,計算機視覺領域發(fā)展迅速悬包,尤其在人臉識別或物體檢測方向更為廣泛,今天就為大家?guī)碜罨A的人臉識別基礎馍乙,從一個個函數(shù)開始走進這個奧妙的世界布近。
首先看一下本實驗需要的數(shù)據(jù)集,為了簡便我們只進行兩個人的識別丝格,選取了beyond樂隊的主唱黃家駒和貝斯手黃家強撑瞧,這哥倆長得有幾分神似,這也是對人臉識別的一個考驗:
兩個文件夾显蝌,一個為訓練數(shù)據(jù)集预伺,一個為測試數(shù)據(jù)集,訓練數(shù)據(jù)集中有兩個文件夾0和1曼尊,之前看一些資料有說這里要遵循“slabel”命名規(guī)則酬诀,但后面處理起來比較麻煩,因為目前opencv接受的人臉識別標簽為整數(shù)骆撇,那我們就直接用整數(shù)命名吧:
為了方便瞒御,我們每個人用20張照片來訓練,0代表黃家駒神郊,1代表黃家強:
開始啦:
- 檢測人臉葵腹。這應該是最基本的高每,給我們一張圖片,我們要先檢測出人臉的區(qū)域践宴,然后才能
進行操作鲸匿,opencv已經(jīng)內(nèi)置了很多分類檢測器,我們這次用haar:
def detect_face(img):
將測試圖像轉(zhuǎn)換為灰度圖像阻肩,因為opencv人臉檢測器需要灰度圖像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
加載OpenCV人臉檢測分類器Haar
face_cascade = cv2.CascadeClassifier('./haarcascade_frontalface_default.xml')
檢測多尺度圖像带欢,返回值是一張臉部區(qū)域信息的列表(x,y,寬,高)
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.2, minNeighbors=5)
如果未檢測到面部,則返回原始圖像
if (len(faces) == 0):
return None, None
目前假設只有一張臉烤惊,xy為左上角坐標乔煞,wh為矩形的寬高
(x, y, w, h) = faces[0]
返回圖像的正面部分
return gray[y:y + w, x:x + h], faces[0]
2.有了數(shù)據(jù)集和檢測人臉的功能后,我們就可以進行預訓練了柒室,最后返回所有訓練圖片的人臉檢測信息和標簽:
# 該函數(shù)將讀取所有的訓練圖像渡贾,從每個圖像檢測人臉并將返回兩個相同大小的列表,分別為臉部信息和標簽
def prepare_training_data(data_folder_path):
# 獲取數(shù)據(jù)文件夾中的目錄(每個主題的一個目錄)
dirs = os.listdir(data_folder_path)
# 兩個列表分別保存所有的臉部和標簽
faces = []
labels = []
# 瀏覽每個目錄并訪問其中的圖像
for dir_name in dirs:
# dir_name(str類型)即標簽
label = int(dir_name)
# 建立包含當前主題主題圖像的目錄路徑
subject_dir_path = data_folder_path + "/" + dir_name
# 獲取給定主題目錄內(nèi)的圖像名稱
subject_images_names = os.listdir(subject_dir_path)
# 瀏覽每張圖片并檢測臉部雄右,然后將臉部信息添加到臉部列表faces[]
for image_name in subject_images_names:
# 建立圖像路徑
image_path = subject_dir_path + "/" + image_name
# 讀取圖像
image = cv2.imread(image_path)
# 顯示圖像0.1s
cv2.imshow("Training on image...", image)
cv2.waitKey(100)
# 檢測臉部
face, rect = detect_face(image)
# 我們忽略未檢測到的臉部
if face is not None:
#將臉添加到臉部列表并添加相應的標簽
faces.append(face)
labels.append(label)
cv2.waitKey(1)
cv2.destroyAllWindows()
#最終返回值為人臉和標簽列表
return faces, labels
3.有了臉部信息和對應標簽后空骚,我們就可以使用opencv自帶的識別器來進行訓練了:
#調(diào)用prepare_training_data()函數(shù)
faces, labels = prepare_training_data("training_data")
#創(chuàng)建LBPH識別器并開始訓練,當然也可以選擇Eigen或者Fisher識別器
face_recognizer = cv2.face.LBPHFaceRecognizer_create()
face_recognizer.train(faces, np.array(labels))
4.訓練完畢后就可以進行預測了擂仍,在這之前我們可以設定一下預測的格式囤屹,包括用矩形框框出人臉并標出其名字,當然最后別忘了建立標簽與真實姓名直接的映射表:
#根據(jù)給定的(x逢渔,y)坐標和寬度高度在圖像上繪制矩形
def draw_rectangle(img, rect):
(x, y, w, h) = rect
cv2.rectangle(img, (x, y), (x + w, y + h), (128, 128, 0), 2)
# 根據(jù)給定的(x肋坚,y)坐標標識出人名
def draw_text(img, text, x, y):
cv2.putText(img, text, (x, y), cv2.FONT_HERSHEY_COMPLEX, 1, (128, 128, 0), 2)
#建立標簽與人名的映射列表(標簽只能為整數(shù))
subjects = ["jiaju", "jiaqiang"]
5.現(xiàn)在就可以定義我們的預測函數(shù)了:
# 此函數(shù)識別傳遞的圖像中的人物并在檢測到的臉部周圍繪制一個矩形及其名稱
def predict(test_img):
#生成圖像的副本,這樣就能保留原始圖像
img = test_img.copy()
#檢測人臉
face, rect = detect_face(img)
#預測人臉
label = face_recognizer.predict(face)
# 獲取由人臉識別器返回的相應標簽的名稱
label_text = subjects[label[0]]
# 在檢測到的臉部周圍畫一個矩形
draw_rectangle(img, rect)
# 標出預測的名字
draw_text(img, label_text, rect[0], rect[1] - 5)
#返回預測的圖像
return img
6.最后使用我們test_data中的圖片進行預測并顯示最終效果:
#加載測試圖像
test_img1 = cv2.imread("test_data/test1.jpg")
test_img2 = cv2.imread("test_data/test2.jpg")
#執(zhí)行預測
predicted_img1 = predict(test_img1)
predicted_img2 = predict(test_img2)
#顯示兩個圖像
cv2.imshow(subjects[0], predicted_img1)
cv2.imshow(subjects[1], predicted_img2)
cv2.waitKey(0)
cv2.destroyAllWindows()
來看看識別的結(jié)果:
這就是人臉識別最基本的流程肃廓,后續(xù)還會進一步的研究智厌,下一篇我們將討論本次實驗的一些細節(jié)和注意事項,算是對本篇的一次挖掘和總結(jié)吧盲赊。最后附上完整代碼:
# # -*- coding:utf-8 -*-
import cv2
import os
import numpy as np
# 檢測人臉
def detect_face(img):
#將測試圖像轉(zhuǎn)換為灰度圖像铣鹏,因為opencv人臉檢測器需要灰度圖像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#加載OpenCV人臉檢測分類器Haar
face_cascade = cv2.CascadeClassifier('./haarcascade_frontalface_default.xml')
#檢測多尺度圖像,返回值是一張臉部區(qū)域信息的列表(x,y,寬,高)
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.2, minNeighbors=5)
# 如果未檢測到面部角钩,則返回原始圖像
if (len(faces) == 0):
return None, None
#目前假設只有一張臉吝沫,xy為左上角坐標,wh為矩形的寬高
(x, y, w, h) = faces[0]
#返回圖像的正面部分
return gray[y:y + w, x:x + h], faces[0]
# 該函數(shù)將讀取所有的訓練圖像递礼,從每個圖像檢測人臉并將返回兩個相同大小的列表惨险,分別為臉部信息和標簽
def prepare_training_data(data_folder_path):
# 獲取數(shù)據(jù)文件夾中的目錄(每個主題的一個目錄)
dirs = os.listdir(data_folder_path)
# 兩個列表分別保存所有的臉部和標簽
faces = []
labels = []
# 瀏覽每個目錄并訪問其中的圖像
for dir_name in dirs:
# dir_name(str類型)即標簽
label = int(dir_name)
# 建立包含當前主題主題圖像的目錄路徑
subject_dir_path = data_folder_path + "/" + dir_name
# 獲取給定主題目錄內(nèi)的圖像名稱
subject_images_names = os.listdir(subject_dir_path)
# 瀏覽每張圖片并檢測臉部,然后將臉部信息添加到臉部列表faces[]
for image_name in subject_images_names:
# 建立圖像路徑
image_path = subject_dir_path + "/" + image_name
# 讀取圖像
image = cv2.imread(image_path)
# 顯示圖像0.1s
cv2.imshow("Training on image...", image)
cv2.waitKey(100)
# 檢測臉部
face, rect = detect_face(image)
# 我們忽略未檢測到的臉部
if face is not None:
#將臉添加到臉部列表并添加相應的標簽
faces.append(face)
labels.append(label)
cv2.waitKey(1)
cv2.destroyAllWindows()
#最終返回值為人臉和標簽列表
return faces, labels
#調(diào)用prepare_training_data()函數(shù)
faces, labels = prepare_training_data("training_data")
#創(chuàng)建LBPH識別器并開始訓練脊髓,當然也可以選擇Eigen或者Fisher識別器
face_recognizer = cv2.face.LBPHFaceRecognizer_create()
face_recognizer.train(faces, np.array(labels))
#根據(jù)給定的(x辫愉,y)坐標和寬度高度在圖像上繪制矩形
def draw_rectangle(img, rect):
(x, y, w, h) = rect
cv2.rectangle(img, (x, y), (x + w, y + h), (128, 128, 0), 2)
# 根據(jù)給定的(x,y)坐標標識出人名
def draw_text(img, text, x, y):
cv2.putText(img, text, (x, y), cv2.FONT_HERSHEY_COMPLEX, 1, (128, 128, 0), 2)
#建立標簽與人名的映射列表(標簽只能為整數(shù))
subjects = ["jiaju", "jiaqiang"]
# 此函數(shù)識別傳遞的圖像中的人物并在檢測到的臉部周圍繪制一個矩形及其名稱
def predict(test_img):
#生成圖像的副本将硝,這樣就能保留原始圖像
img = test_img.copy()
#檢測人臉
face, rect = detect_face(img)
#預測人臉
label = face_recognizer.predict(face)
# 獲取由人臉識別器返回的相應標簽的名稱
label_text = subjects[label[0]]
# 在檢測到的臉部周圍畫一個矩形
draw_rectangle(img, rect)
# 標出預測的名字
draw_text(img, label_text, rect[0], rect[1] - 5)
#返回預測的圖像
return img
#加載測試圖像
test_img1 = cv2.imread("test_data/test1.jpg")
test_img2 = cv2.imread("test_data/test2.jpg")
#執(zhí)行預測
predicted_img1 = predict(test_img1)
predicted_img2 = predict(test_img2)
#顯示兩個圖像
cv2.imshow(subjects[0], predicted_img1)
cv2.imshow(subjects[1], predicted_img2)
cv2.waitKey(0)
cv2.destroyAllWindows()
如果你依然在編程的世界里迷茫恭朗,
不知道自己的未來規(guī)劃屏镊,
對python感興趣,
這里推薦一下我的學習交流圈QQ群:895 797 751痰腮,
里面都是學習python的而芥,
伙伴們有哪些地方不清楚的可以留言