題外話
開篇先說一點(diǎn)題外話芍锚,我主要想通過這一期的教程表達(dá)一個(gè)觀點(diǎn),那就是科研非常重要泥张,而且入門其實(shí)沒有那么難莹痢。
我在知乎上看到一篇文章种蘸,有一個(gè)清華大學(xué)物理系的助理研究員帶著福州一中的應(yīng)屆畢業(yè)生董焌鍇合作完成了一篇論文,已被《Science Bulletin》接收竞膳。在該研究員撰寫的專欄文章[1]里航瞭,我得知“在此后不久,董焌鍇拿到了美國康奈爾大學(xué)物理系的本科錄取通知書坦辟,完全沒有了高考升學(xué)的壓力刊侯。”看到這长窄,我雖然還沒有孩子滔吠,但更加堅(jiān)定了我以后鼓勵(lì)孩子盡早做科研的決心。
鼓勵(lì)孩子主要有兩個(gè)原因挠日,一是我不會(huì)逼自己的孩子疮绷。我在本科求學(xué)數(shù)學(xué)系期間,就聽說很多數(shù)學(xué)系教授把自己的孩子逼得非常討厭數(shù)學(xué)嚣潜,基本與理工類的科技行業(yè)say goodbye了冬骚。如果那些教授們在教育理念和方法上有所改變,那些孩子說不定還真能在數(shù)學(xué)里得到很多快樂懂算。二是我覺得行行出人才只冻。只要孩子努力做更好的自己就好了。大家也都知道歌手樸樹的父母都是北京大學(xué)的教授计技,其父濮祖蔭還是著名的地球物理專家喜德,但是樸樹卻從小立志做文藝青年。我個(gè)人倒是覺得樸樹帶給我的感動(dòng)和影響是超越他父親垮媒。所以呢舍悯,我也不是覺得科研是大家必須做的事情。
如果孩子喜歡科研睡雇,那么鼓勵(lì)孩子做出成績萌衬,并且受到認(rèn)可,從而進(jìn)入更好的平臺(tái)提升自己它抱,那簡直就是不要太完美帮踉ァ!
題外話到此為止观蓄,下面進(jìn)入正題混移。
人臉識別究竟是什么
人臉識別是一個(gè)非常實(shí)用的技術(shù)祠墅。很多公司的考勤就是用的人臉識別技術(shù)。人臉識別也是一個(gè)非常古老的計(jì)算機(jī)視覺問題沫屡,研究歷史至少有將近30年饵隙。早期有一篇非常出名的文章介紹特征臉[2]撮珠,是人臉識別領(lǐng)域的一個(gè)里程碑技術(shù)沮脖,原理非常簡單,就是人臉在高維空間里的低維子空間里芯急,所以可以通過降維來得到更好的識別效果勺届。下圖大致表達(dá)了特征臉的基本思想[3].
在維基百科的詞條介紹里[4], 狹義的人臉識別特指通過人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。人臉識別還可以是確認(rèn)(verification)和鑒別(identification)娶耍。確認(rèn)的過程是這樣的免姿,你先輸入你的身份ID,然后系統(tǒng)把你的人臉和你輸入身份ID的人臉作對比榕酒,如果極度相似胚膊,那么就可以確認(rèn)你是你輸入的身份ID這個(gè)人。而鑒別則是把你的人臉直接和系統(tǒng)里已有的人臉一一匹配想鹰,如果你的人臉和系統(tǒng)里的某張人臉極度相似紊婉,那么就鑒別出你的身份。確認(rèn)和鑒別都是生物特征識別和安防里常用的方法辑舷。
按照機(jī)器學(xué)習(xí)領(lǐng)域的方法喻犁,識別主要可以分為兩大類:分類和聚類。在之前的文章[5]里何缓,我介紹過分類是一種監(jiān)督學(xué)習(xí)肢础,分類過程中需要有類別的標(biāo)簽;而聚類是一種無監(jiān)督學(xué)習(xí)碌廓,聚類過程中可以不需要類別標(biāo)簽传轰。在本文中,人臉識別特指人臉的分類問題谷婆,也就是上文中的鑒別慨蛙。
人臉識別算法的必要組成
A 人臉模板(Template)
在人臉識別系統(tǒng)里,我們首先需要人臉識別的系統(tǒng)里已經(jīng)有一些人臉的照片波材,這些照片作為模板被放在人臉識別的系統(tǒng)里股淡。模板的重要性不言而喻,如果沒有這些模板廷区,我們都不知道要識別誰唯灵,還怎么談人臉識別?隙轻!收集和預(yù)處理人臉模板是一項(xiàng)龐大的工程埠帕,不過簡單的自動(dòng)化處理就可以得到還算滿意的結(jié)果垢揩。
在數(shù)學(xué)模型上,人臉模板經(jīng)常被稱為訓(xùn)練集敛瓷。訓(xùn)練集是訓(xùn)練人臉識別算法的參數(shù)的數(shù)據(jù)集叁巨。在訓(xùn)練集中,有很多人的人臉照片呐籽。假設(shè)某一個(gè)訓(xùn)練集里有K個(gè)人锋勺,每張照片的都被轉(zhuǎn)換成一個(gè)豎直方向上的向量,那么第k個(gè)人的多張人臉照片就可以組成一個(gè)矩陣Xk狡蝶,全部人臉模板就可以用一個(gè)矩陣表示(要是這里支持寫latex就好了):
X = [X1,...,Xk,...,XK]庶橱。
B 算法模型
有了模板之后,我們就可以根據(jù)輸入的測試樣本來進(jìn)行人臉識別了贪惹。這里假設(shè)y是待識別的測試樣本苏章,和X的每一列樣本一樣,是一張人臉照片轉(zhuǎn)換成的豎直方向上的向量奏瞬。
上一次教程里枫绅,我介紹了最小二乘回歸模型。這個(gè)簡單的模型被我導(dǎo)師在2011年的ICCV大會(huì)論文[6]里指出可以有效地應(yīng)用在人臉識別里硼端〔⒘埽基本模型非常簡單:
上圖是一個(gè)優(yōu)化模型,X = [X1,...,Xk,...,XK]是所有類別的人臉的所有照片組成的矩陣显蝌,也叫訓(xùn)練矩陣预伺;y是輸入的測試樣本,是一個(gè)和X每一列一樣大小的向量曼尊;p是輸入的測試樣本在訓(xùn)練樣本下的表達(dá)系數(shù)酬诀,也是一個(gè)向量,維數(shù)等于訓(xùn)練集中樣本的個(gè)數(shù)骆撇。在這個(gè)模型里主要求上述優(yōu)化模型的解瞒御,也非常簡單:
向量p畫出來的大概樣子是這樣的(大家可以忽略):
物理涵義就是輸入樣本可以被訓(xùn)練集里的樣本線性表達(dá)。
在得到p之后神郊,我們下一步該怎么用p進(jìn)行人臉識別呢肴裙?
請注意p是在訓(xùn)練集中所有的人臉照片上的表達(dá)系數(shù)向量,那么p在每個(gè)人的人臉照片Xi里的表達(dá)可以用pi來表達(dá)涌乳。那么y在不同類里可以得到不同的重構(gòu)蜻懦。即y在第i個(gè)人的人臉照片里的重構(gòu)人臉是yi=Xi*pi。如果y是第i個(gè)人的人臉照片夕晓,那么y應(yīng)該約等于yi宛乃,即y被第i個(gè)人的人臉照片Xi重構(gòu)出來的誤差就會(huì)最小。這就是人臉識別的最關(guān)鍵原理。
接下來人臉識別的步驟就很簡單而直觀了征炼,即分別計(jì)算每一個(gè)人的人臉照片重構(gòu)y的誤差析既,然后規(guī)定y就是誤差最小的那一類人臉照片所屬于的那個(gè)人:
人臉識別例子
我先給出一幅圖,讓大家有一個(gè)直觀的印象谆奥。
在上圖中眼坏,左邊是輸入的測試樣本y,中間的每一張都是一個(gè)人的人臉照片Xi酸些,那么y在全部訓(xùn)練集X=[X1,...,XK]上可以根據(jù)上面的最小二乘回歸模型得到一個(gè)表達(dá)系數(shù)向量p宰译。然后我們可以計(jì)算y在每一張人連照片Xi上的重構(gòu)誤差,誤差越大擂仍,相似性越低囤屹,誤差越小,相似性越高逢渔。比如在上圖中,y恰好與X2(數(shù)據(jù)庫里第一行左二)的誤差最低乡括,相似度達(dá)到了96%肃廓,那么y就是數(shù)據(jù)庫里第一行左二的那個(gè)人的人臉照片,與我自己的辨別相符诲泌,達(dá)到了人臉識別的目的盲赊。
人臉識別的重要性
人臉識別有多重要?人臉識別不僅在安防敷扫,海關(guān)等重要場合里發(fā)揮了很大的作用哀蘑,而且在找回遺失的孤兒上起到關(guān)鍵作用。這里不得不稱贊一下人工智能技術(shù)最近在找回丟失兒童方面所作出的貢獻(xiàn)[7]葵第,這里面有一項(xiàng)很關(guān)鍵的技術(shù)就是人臉識別绘迁,尤其是跨年齡人臉識別技術(shù)(當(dāng)然,最后還是要用DNA匹配技術(shù)深度確認(rèn))卒密。
據(jù)我所知缀台,騰訊優(yōu)圖實(shí)驗(yàn)室應(yīng)該是目前國內(nèi)做人臉識別最好的機(jī)構(gòu)之一[8]。
昨天非常榮幸收到騰訊優(yōu)圖某位高管的郵件哮奇,郵件里他邀請我去騰訊優(yōu)圖面試膛腐。希望我以后能在人臉識別領(lǐng)域做出對社會(huì)真正有貢獻(xiàn)的技術(shù)。
參考文獻(xiàn):
[1] 尹璋琦, 與高中生合作發(fā)表學(xué)術(shù)論文, https://zhuanlan.zhihu.com/p/28315413鼎俘。
[2] Turk M, Pentland A. Eigenfaces for recognition. Journal of cognitive neuroscience, 1991, 3(1): 71-86.
[3] 自動(dòng)人臉識別基本原理哲身,https://b2museum.cdstm.cn/identification/rlsb-2.htm。
[4]?https://zh.wikipedia.org/wiki/%E4%BA%BA%E8%84%B8%E8%AF%86%E5%88%AB贸伐,維基百科勘天。
[5] 人工智能依然需要被“監(jiān)督”,微信公眾號“君君玩科技”。
[6] Zhang L, Yang M, Feng X. Sparse representation or collaborative representation: Which helps face recognition? IEEE international conference on computer vision (ICCV), 2011.
[7]?http://www.sohu.com/a/133773386_500237
[8] 準(zhǔn)確率99.80%误辑!騰訊優(yōu)圖再次刷新人臉識別世界紀(jì)錄,?http://tech.qq.com/a/20170330/033980.htm