寫在前面--碎碎念
上次更新了一篇關(guān)于如何使用python自帶的tkinter庫(kù)實(shí)現(xiàn)人臉識(shí)別的界面啼染,大致介紹了我們想達(dá)到的設(shè)計(jì)目標(biāo)和tkinter庫(kù)的基礎(chǔ)知識(shí)。在這個(gè)小程序中拒啰,涉及到了攝像頭調(diào)用(包括截圖永淌、存圖、圖片大小修改)拼余、后臺(tái)機(jī)器學(xué)習(xí)模型調(diào)用兩個(gè)核心功能闸拿,還有tkinter界面的布局空盼、美化、顯示圖片和模型預(yù)測(cè)結(jié)果等展示效果新荤。
聲明
由于整體實(shí)現(xiàn)需要深度學(xué)習(xí)網(wǎng)絡(luò)的調(diào)用揽趾,這里不對(duì)深度學(xué)習(xí)人臉識(shí)別的具體實(shí)現(xiàn)進(jìn)行展現(xiàn)解釋。而且是小伙伴的項(xiàng)目苛骨,也涉及到他人的科研成果篱瞎,所以只借用這個(gè)項(xiàng)目的形式針對(duì)界面部分進(jìn)行詳細(xì)說明,還請(qǐng)理解痒芝。不會(huì)提供包括深度學(xué)習(xí)模型實(shí)現(xiàn)在內(nèi)的完整代碼俐筋,伸手黨請(qǐng)繞道。
一严衬、初始化
1澄者、模塊導(dǎo)入
# -*- coding: utf-8 -*-
#代碼默認(rèn)python2版本,python3有出入的地方在注釋中
from Tkinter import * # from tkinter import *導(dǎo)入tkinter庫(kù)
import tkFileDialog # from tkinter import filedialog 調(diào)用文件讀取彈窗模塊请琳,實(shí)現(xiàn)用戶可以選擇本地圖片作為輸入
from PIL import Image, ImageTk #調(diào)用圖片處理模塊粱挡,保證png后綴名可用
import cv2 #導(dǎo)入OpenCV庫(kù)
import threading #多線程調(diào)用,從視頻流中獲取新的幀
import datetime #為保存的截圖文件獲取一個(gè)易讀的時(shí)間相關(guān)名稱
import os #調(diào)用系統(tǒng)命令
import caffe #導(dǎo)入caffe俄精,深度學(xué)習(xí)框架調(diào)用
import filter #圖片處理
import scipy.misc #以圖像形式保存數(shù)組
import numpy as np #數(shù)組運(yùn)算
import re #正則表達(dá)式匹配操作
import linecache #把文件讀入到緩存中询筏,在以后訪問文件的時(shí)候,就不必要再?gòu)挠脖P讀取
2竖慧、變量定義
#全局變量
filename = "" #初始文件名
synname = "" #添加擾動(dòng)后的合成文件名
flag = int(0)
var3 = ""
3嫌套、網(wǎng)絡(luò)初始化
根據(jù)調(diào)用網(wǎng)絡(luò)逆屡,進(jìn)行初始化操作:略
這個(gè)對(duì)深度學(xué)習(xí)有研究的同學(xué)來說應(yīng)該不是問題~~
二、界面模塊與內(nèi)部功能對(duì)應(yīng)關(guān)系
人臉識(shí)別演示界面與功能對(duì)應(yīng).png
三踱讨、界面設(shè)置
if __name__ == '__main__':
root = Tk()
frame = Frame(root,bg='#3b3a4a')#設(shè)置背景顏色
frame.pack(expand=YES,fill=BOTH,anchor='n')#背景顏色填充整個(gè)窗口
root.title("人臉識(shí)別演示")#設(shè)置窗口標(biāo)題
root.geometry("800x600")#注意中間是小寫x
root.iconbitmap('muma.ico')#設(shè)置窗口標(biāo)題欄小logo魏蔗,注意需要是ico格式
#選擇圖片按鈕
Button(frame,text="選擇文件",command=get_file,height=1,width=8,bg='#1ebad6',font=('微軟雅黑',14)).grid(row=4,column=1,padx=10)
Button(frame,text="拍照截圖",command=shot_pic,height=1,width=8,bg='#1ebad6',font=('微軟雅黑',14)).grid(row=5,column=1,padx=10)
#選擇擾動(dòng)按鈕
Button(frame,text="選擇擾動(dòng)",command=get_trg,height=1,width=8,bg='#1ebad6',font=('微軟雅黑',14)).grid(row=12,column=1,padx=10,sticky=S)
#添加顯示原始圖片的背景圖片
img1 = Image.open("picbg.png")
photo1 = ImageTk.PhotoImage(img1)
img_label1 = Label(frame, imag=photo1,bd=0)
img_label1.grid(row=4,column=2,rowspan=3,columnspan=3,padx=4,pady=10)
#添加顯示合成圖片的背景圖片
img2 = Image.open("picbg.png")
photo2 = ImageTk.PhotoImage(img2)
img_label2 = Label(frame, imag=photo2,bd=0)
img_label2.grid(row=12,column=2,rowspan=3,columnspan=3,padx=4,pady=20)
#顯示圖片標(biāo)簽
frm_L0 = Frame(frame)
var0 = StringVar()
Label(frm_L0,text="圖片標(biāo)簽:").pack(side=LEFT)
Entry(frm_L0,textvariable=var0,bd=0).pack(side=LEFT)
frm_L0.grid(row=7,column=3)
#選擇原始圖片訓(xùn)練模型
Button(frame, text="原始模型", command=can_data1, height=1, width=8,font=('微軟雅黑',12),activebackground='pink', bg='#161626',fg='#f2f2f4',bd=1).grid(row=4, column=6,padx=4,pady=10)
Button(frame, text="修改模型", command=can_data2, height=1, width=8,font=('微軟雅黑',12),activebackground='pink', bg='#c0c0c8',bd=1).grid(row=5, column=6,padx=4,pady=10)
#選擇合成圖片訓(xùn)練模型
Button(frame, text="原始模型", command=can_data3, height=1, width=8,font=('微軟雅黑',12),activebackground='pink', bg='#161626',fg='#f2f2f4',bd=1).grid(row=12, column=6,padx=4,pady=10)
Button(frame, text="修改模型", command=can_data4, height=1, width=8,font=('微軟雅黑',12),activebackground='pink', bg='#c0c0c8',bd=1).grid(row=13, column=6,padx=4,pady=10)
#設(shè)置原始圖片處理
#設(shè)置原始模型預(yù)測(cè)結(jié)果的顯示框
nfrm_L1 = Frame(frame)
var11 = StringVar()
var11.set("")
Label(nfrm_L1, text="分類結(jié)果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L1, textvariable=var11,bd=0).pack()
nfrm_L1.grid(row=4, column=8,padx=2)
#設(shè)置原始預(yù)測(cè)結(jié)果置信度的顯示框
nfrm_L2 = Frame(frame)
var12 = StringVar()
var12.set("")
Label(nfrm_L2, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L2, textvariable=var12, bd=0).pack()
nfrm_L2.grid(row=4,column=9,padx=2)
#設(shè)置修改模型預(yù)測(cè)結(jié)果的顯示框
mfrm_L1 = Frame(frame)
var13 = StringVar()
var13.set("")
Label(mfrm_L1,text="分類結(jié)果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L1,textvariable=var13,bd=0).pack()
mfrm_L1.grid(row=5,column=8,padx=2)
#設(shè)置修改預(yù)測(cè)結(jié)果置信度的顯示框
mfrm_L2 = Frame(frame)
var14 = StringVar()
var14.set("")
Label(mfrm_L2, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L2, textvariable=var14, bd=0).pack()
mfrm_L2.grid(row=5,column=9,padx=2)
#設(shè)置合成圖片處理
#設(shè)置原始模型預(yù)測(cè)結(jié)果的顯示框
nfrm_L3 = Frame(frame)
var21 = StringVar()
var21.set("")
Label(nfrm_L3, text="分類結(jié)果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L3, textvariable=var21, bd=0).pack()
nfrm_L3.grid(row=12, column=8)
#設(shè)置原始預(yù)測(cè)結(jié)果置信度的顯示框
nfrm_L4 = Frame(frame)
var22 = StringVar()
var22.set("")
Label(nfrm_L4, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L4, textvariable=var22, bd=0).pack()
nfrm_L4.grid(row=12, column=9)
#設(shè)置修改模型預(yù)測(cè)結(jié)果的顯示框
mfrm_L3 = Frame(frame)
var23 = StringVar()
var23.set("")
Label(mfrm_L3,text="分類結(jié)果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L3,textvariable=var23,bd=0).pack()
mfrm_L3.grid(row=13, column=8)
#設(shè)置修改模型預(yù)測(cè)結(jié)果置信度的顯示框
mfrm_L4 = Frame(frame)
var24 = StringVar()
var24.set("")
Label(mfrm_L4, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L4,textvariable=var24,bd=0).pack()
mfrm_L4.grid(row=13, column=9)
root.mainloop()
四、功能實(shí)現(xiàn)
1勇蝙、攝像頭拍照截圖
def shot_pic():
global flag
global filename
flag = 0
#視頻窗口設(shè)置
capture = cv2.VideoCapture(0)
capture.set(cv2.CAP_PROP_FRAME_WIDTH, 640) #寬224
capture.set(cv2.CAP_PROP_FRAME_HEIGHT, 480) #高224
top = Toplevel()
top.title('camera shot')
frm_top = Frame(top)
Button(top, height=2, width=8, text='截取圖片',command=stop_pic).pack(side=TOP)
canvas = Canvas(top, bg='black', height=480, width=640)
canvas.pack()
#實(shí)時(shí)獲取視頻
while (capture.isOpened()):
ret, frame = capture.read() #ret表示是否成功讀取視頻幀
if ret:
cv2image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGBA)
img = Image.fromarray(cv2image)
image_file = ImageTk.PhotoImage(img)
canvas.create_image(0, 0, anchor='nw', image=image_file, tags='c1')
frm_top.update_idletasks()
frm_top.update()
if flag==1:
cv2.imwrite("cut_img.jpg", frame) # 保存路徑
img = cv2.imread('cut_img.jpg')
img = img[110:420,180:490] #高沫勿,寬
img = cv2.resize(img,(224,224))
cv2.imwrite("cut_img.jpg", img) # 保存路徑
filename = "cut_img.jpg"
break
capture.release()
cv2.destroyAllWindows()
top.destroy()
#主窗口打開截圖
pic_name = "cut_img.jpg"
var0.set(pic_name) #圖片標(biāo)簽
img1 = Image.open(pic_name) # 打開圖片
photo1 = ImageTk.PhotoImage(img1) # 用PIL模塊的PhotoImage打開
img_label1.config(imag=photo1)
mainloop()
2、對(duì)圖片進(jìn)行處理
def crop(image_size, output_size, image):
topleft = ((output_size[0] - image_size[0])/2, (output_size[1] - image_size[1])/2)
return image.copy()[:,:,topleft[0]:topleft[0]+image_size[0], topleft[1]:topleft[1]+image_size[1]]
def classify(fname):
averageImage = [129.1863, 104.7624, 93.5940]
pix = scipy.misc.imread(fname)
data = np.float32(np.rollaxis(pix, 2)[::-1])
data[0] -= averageImage[2]
data[1] -= averageImage[1]
data[2] -= averageImage[0]
return np.array([data])