如何理解并實(shí)現(xiàn)一個(gè)簡單的人臉識別算法（下）：人臉識別

題外話

開篇先說一點(diǎn)題外話芍锚，我主要想通過這一期的教程表達(dá)一個(gè)觀點(diǎn)，那就是科研非常重要泥张，而且入門其實(shí)沒有那么難莹痢。

我在知乎上看到一篇文章种蘸，有一個(gè)清華大學(xué)物理系的助理研究員帶著福州一中的應(yīng)屆畢業(yè)生董焌鍇合作完成了一篇論文，已被《Science Bulletin》接收竞膳。在該研究員撰寫的專欄文章[1]里航瞭，我得知“在此后不久，董焌鍇拿到了美國康奈爾大學(xué)物理系的本科錄取通知書坦辟，完全沒有了高考升學(xué)的壓力刊侯。”看到這长窄，我雖然還沒有孩子滔吠，但更加堅(jiān)定了我以后鼓勵(lì)孩子盡早做科研的決心。

鼓勵(lì)孩子主要有兩個(gè)原因挠日，一是我不會(huì)逼自己的孩子疮绷。我在本科求學(xué)數(shù)學(xué)系期間，就聽說很多數(shù)學(xué)系教授把自己的孩子逼得非常討厭數(shù)學(xué)嚣潜，基本與理工類的科技行業(yè)say goodbye了冬骚。如果那些教授們在教育理念和方法上有所改變，那些孩子說不定還真能在數(shù)學(xué)里得到很多快樂懂算。二是我覺得行行出人才只冻。只要孩子努力做更好的自己就好了。大家也都知道歌手樸樹的父母都是北京大學(xué)的教授计技，其父濮祖蔭還是著名的地球物理專家喜德，但是樸樹卻從小立志做文藝青年。我個(gè)人倒是覺得樸樹帶給我的感動(dòng)和影響是超越他父親垮媒。所以呢舍悯，我也不是覺得科研是大家必須做的事情。

如果孩子喜歡科研睡雇，那么鼓勵(lì)孩子做出成績萌衬，并且受到認(rèn)可，從而進(jìn)入更好的平臺(tái)提升自己它抱，那簡直就是不要太完美帮踉ァ！

題外話到此為止观蓄，下面進(jìn)入正題混移。

人臉識別究竟是什么

人臉識別是一個(gè)非常實(shí)用的技術(shù)祠墅。很多公司的考勤就是用的人臉識別技術(shù)。人臉識別也是一個(gè)非常古老的計(jì)算機(jī)視覺問題沫屡，研究歷史至少有將近30年饵隙。早期有一篇非常出名的文章介紹特征臉[2]撮珠，是人臉識別領(lǐng)域的一個(gè)里程碑技術(shù)沮脖，原理非常簡單，就是人臉在高維空間里的低維子空間里芯急，所以可以通過降維來得到更好的識別效果勺届。下圖大致表達(dá)了特征臉的基本思想[3].

在維基百科的詞條介紹里[4], 狹義的人臉識別特指通過人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。人臉識別還可以是確認(rèn)（verification）和鑒別（identification）娶耍。確認(rèn)的過程是這樣的免姿，你先輸入你的身份ID，然后系統(tǒng)把你的人臉和你輸入身份ID的人臉作對比榕酒，如果極度相似胚膊，那么就可以確認(rèn)你是你輸入的身份ID這個(gè)人。而鑒別則是把你的人臉直接和系統(tǒng)里已有的人臉一一匹配想鹰，如果你的人臉和系統(tǒng)里的某張人臉極度相似紊婉，那么就鑒別出你的身份。確認(rèn)和鑒別都是生物特征識別和安防里常用的方法辑舷。

按照機(jī)器學(xué)習(xí)領(lǐng)域的方法喻犁，識別主要可以分為兩大類：分類和聚類。在之前的文章[5]里何缓，我介紹過分類是一種監(jiān)督學(xué)習(xí)肢础，分類過程中需要有類別的標(biāo)簽；而聚類是一種無監(jiān)督學(xué)習(xí)碌廓，聚類過程中可以不需要類別標(biāo)簽传轰。在本文中，人臉識別特指人臉的分類問題谷婆，也就是上文中的鑒別慨蛙。

人臉識別算法的必要組成

A 人臉模板（Template）

在人臉識別系統(tǒng)里，我們首先需要人臉識別的系統(tǒng)里已經(jīng)有一些人臉的照片波材，這些照片作為模板被放在人臉識別的系統(tǒng)里股淡。模板的重要性不言而喻，如果沒有這些模板廷区，我們都不知道要識別誰唯灵，還怎么談人臉識別？隙轻！收集和預(yù)處理人臉模板是一項(xiàng)龐大的工程埠帕，不過簡單的自動(dòng)化處理就可以得到還算滿意的結(jié)果垢揩。

在數(shù)學(xué)模型上，人臉模板經(jīng)常被稱為訓(xùn)練集敛瓷。訓(xùn)練集是訓(xùn)練人臉識別算法的參數(shù)的數(shù)據(jù)集叁巨。在訓(xùn)練集中，有很多人的人臉照片呐籽。假設(shè)某一個(gè)訓(xùn)練集里有K個(gè)人锋勺，每張照片的都被轉(zhuǎn)換成一個(gè)豎直方向上的向量，那么第k個(gè)人的多張人臉照片就可以組成一個(gè)矩陣Xk狡蝶，全部人臉模板就可以用一個(gè)矩陣表示(要是這里支持寫latex就好了)：

X = [X1,...,Xk,...,XK]庶橱。

B 算法模型

有了模板之后，我們就可以根據(jù)輸入的測試樣本來進(jìn)行人臉識別了贪惹。這里假設(shè)y是待識別的測試樣本苏章，和X的每一列樣本一樣，是一張人臉照片轉(zhuǎn)換成的豎直方向上的向量奏瞬。

上一次教程里枫绅，我介紹了最小二乘回歸模型。這個(gè)簡單的模型被我導(dǎo)師在2011年的ICCV大會(huì)論文[6]里指出可以有效地應(yīng)用在人臉識別里硼端〔⒘埽基本模型非常簡單：

上圖是一個(gè)優(yōu)化模型，X = [X1,...,Xk,...,XK]是所有類別的人臉的所有照片組成的矩陣显蝌，也叫訓(xùn)練矩陣预伺；y是輸入的測試樣本，是一個(gè)和X每一列一樣大小的向量曼尊；p是輸入的測試樣本在訓(xùn)練樣本下的表達(dá)系數(shù)酬诀，也是一個(gè)向量，維數(shù)等于訓(xùn)練集中樣本的個(gè)數(shù)骆撇。在這個(gè)模型里主要求上述優(yōu)化模型的解瞒御，也非常簡單：

向量p畫出來的大概樣子是這樣的（大家可以忽略）：

物理涵義就是輸入樣本可以被訓(xùn)練集里的樣本線性表達(dá)。

在得到p之后神郊，我們下一步該怎么用p進(jìn)行人臉識別呢肴裙？

請注意p是在訓(xùn)練集中所有的人臉照片上的表達(dá)系數(shù)向量，那么p在每個(gè)人的人臉照片Xi里的表達(dá)可以用pi來表達(dá)涌乳。那么y在不同類里可以得到不同的重構(gòu)蜻懦。即y在第i個(gè)人的人臉照片里的重構(gòu)人臉是yi=Xi*pi。如果y是第i個(gè)人的人臉照片夕晓，那么y應(yīng)該約等于yi宛乃，即y被第i個(gè)人的人臉照片Xi重構(gòu)出來的誤差就會(huì)最小。這就是人臉識別的最關(guān)鍵原理。

接下來人臉識別的步驟就很簡單而直觀了征炼，即分別計(jì)算每一個(gè)人的人臉照片重構(gòu)y的誤差析既，然后規(guī)定y就是誤差最小的那一類人臉照片所屬于的那個(gè)人：

人臉識別例子

我先給出一幅圖，讓大家有一個(gè)直觀的印象谆奥。

在上圖中眼坏，左邊是輸入的測試樣本y，中間的每一張都是一個(gè)人的人臉照片Xi酸些，那么y在全部訓(xùn)練集X=[X1,...,XK]上可以根據(jù)上面的最小二乘回歸模型得到一個(gè)表達(dá)系數(shù)向量p宰译。然后我們可以計(jì)算y在每一張人連照片Xi上的重構(gòu)誤差，誤差越大擂仍，相似性越低囤屹，誤差越小，相似性越高逢渔。比如在上圖中，y恰好與X2（數(shù)據(jù)庫里第一行左二）的誤差最低乡括，相似度達(dá)到了96%肃廓，那么y就是數(shù)據(jù)庫里第一行左二的那個(gè)人的人臉照片，與我自己的辨別相符诲泌，達(dá)到了人臉識別的目的盲赊。

人臉識別的重要性

人臉識別有多重要？人臉識別不僅在安防敷扫，海關(guān)等重要場合里發(fā)揮了很大的作用哀蘑，而且在找回遺失的孤兒上起到關(guān)鍵作用。這里不得不稱贊一下人工智能技術(shù)最近在找回丟失兒童方面所作出的貢獻(xiàn)[7]葵第，這里面有一項(xiàng)很關(guān)鍵的技術(shù)就是人臉識別绘迁，尤其是跨年齡人臉識別技術(shù)（當(dāng)然，最后還是要用DNA匹配技術(shù)深度確認(rèn)）卒密。

據(jù)我所知缀台，騰訊優(yōu)圖實(shí)驗(yàn)室應(yīng)該是目前國內(nèi)做人臉識別最好的機(jī)構(gòu)之一[8]。

昨天非常榮幸收到騰訊優(yōu)圖某位高管的郵件哮奇，郵件里他邀請我去騰訊優(yōu)圖面試膛腐。希望我以后能在人臉識別領(lǐng)域做出對社會(huì)真正有貢獻(xiàn)的技術(shù)。

參考文獻(xiàn)：

[1] 尹璋琦, 與高中生合作發(fā)表學(xué)術(shù)論文, https://zhuanlan.zhihu.com/p/28315413鼎俘。

[2] Turk M, Pentland A. Eigenfaces for recognition. Journal of cognitive neuroscience, 1991, 3(1): 71-86.

[3] 自動(dòng)人臉識別基本原理哲身，https://b2museum.cdstm.cn/identification/rlsb-2.htm。

[4]?https://zh.wikipedia.org/wiki/%E4%BA%BA%E8%84%B8%E8%AF%86%E5%88%AB贸伐，維基百科勘天。

[5] 人工智能依然需要被“監(jiān)督”，微信公眾號“君君玩科技”。

[6] Zhang L, Yang M, Feng X. Sparse representation or collaborative representation: Which helps face recognition? IEEE international conference on computer vision (ICCV), 2011.

[7]?http://www.sohu.com/a/133773386_500237

[8] 準(zhǔn)確率99.80%误辑！騰訊優(yōu)圖再次刷新人臉識別世界紀(jì)錄,?http://tech.qq.com/a/20170330/033980.htm

最后編輯于：2019.06.22 14:10:22

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末沧踏，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子巾钉，更是在濱河造成了極大的恐慌翘狱，老刑警劉巖，帶你破解...
沈念sama閱讀 218,386評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件砰苍，死亡現(xiàn)場離奇詭異潦匈，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)赚导，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,142評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門茬缩，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人吼旧，你說我怎么就攤上這事凰锡。” “怎么了圈暗？”我有些...
開封第一講書人閱讀 164,704評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵掂为，是天一觀的道長。經(jīng)常有香客問我员串，道長勇哗，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,702評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任寸齐，我火速辦了婚禮欲诺，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘渺鹦。我一直安慰自己扰法，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,716評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布海铆。她就那樣靜靜地躺著迹恐，像睡著了一般。火紅的嫁衣襯著肌膚如雪卧斟。梳的紋絲不亂的頭發(fā)上殴边，一...
開封第一講書人閱讀 51,573評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音珍语，去河邊找鬼锤岸。笑死，一個(gè)胖子當(dāng)著我的面吹牛板乙，可吹牛的內(nèi)容都是我干的是偷。我是一名探鬼主播拳氢，決...
沈念sama閱讀 40,314評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼蛋铆！你這毒婦竟也來了馋评？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,230評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤刺啦，失蹤者是張志新（化名）和其女友劉穎留特，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體玛瘸，經(jīng)...
沈念sama閱讀 45,680評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡蜕青，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,873評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了糊渊。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片右核。...
茶點(diǎn)故事閱讀 39,991評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖渺绒，靈堂內(nèi)的尸體忽然破棺而出贺喝，到底是詐尸還是另有隱情，我是刑警寧澤芒篷，帶...
沈念sama閱讀 35,706評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布搜变，位于F島的核電站，受9級特大地震影響针炉，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜扳抽，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,329評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一篡帕、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧贸呢，春花似錦镰烧、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,910評論 0贊 22
一樁弒父案怔鳖，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至固蛾，卻和暖如春结执，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背艾凯。一陣腳步聲響...
開封第一講書人閱讀 33,038評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工献幔，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人趾诗。一個(gè)月前我還...
沈念sama閱讀 48,158評論 3贊 370
代替公主和親
正文我出身青樓蜡感，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子郑兴，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,941評論 2贊 355

如何理解并實(shí)現(xiàn)一個(gè)簡單的人臉識別算法（下）：人臉識別

推薦閱讀更多精彩內(nèi)容