如何理解并實(shí)現(xiàn)一個(gè)簡單的人臉識別算法(下):人臉識別

題外話

開篇先說一點(diǎn)題外話芍锚,我主要想通過這一期的教程表達(dá)一個(gè)觀點(diǎn),那就是科研非常重要泥张,而且入門其實(shí)沒有那么難莹痢。

我在知乎上看到一篇文章种蘸,有一個(gè)清華大學(xué)物理系的助理研究員帶著福州一中的應(yīng)屆畢業(yè)生董焌鍇合作完成了一篇論文已被《Science Bulletin》接收竞膳。在該研究員撰寫的專欄文章[1]里航瞭,我得知“在此后不久,董焌鍇拿到了美國康奈爾大學(xué)物理系的本科錄取通知書坦辟,完全沒有了高考升學(xué)的壓力刊侯。”看到這长窄,我雖然還沒有孩子滔吠,但更加堅(jiān)定了我以后鼓勵(lì)孩子盡早做科研的決心。

鼓勵(lì)孩子主要有兩個(gè)原因挠日,一是我不會(huì)逼自己的孩子疮绷。我在本科求學(xué)數(shù)學(xué)系期間,就聽說很多數(shù)學(xué)系教授把自己的孩子逼得非常討厭數(shù)學(xué)嚣潜,基本與理工類的科技行業(yè)say goodbye了冬骚。如果那些教授們在教育理念和方法上有所改變,那些孩子說不定還真能在數(shù)學(xué)里得到很多快樂懂算。二是我覺得行行出人才只冻。只要孩子努力做更好的自己就好了。大家也都知道歌手樸樹的父母都是北京大學(xué)的教授计技,其父濮祖蔭還是著名的地球物理專家喜德,但是樸樹卻從小立志做文藝青年。我個(gè)人倒是覺得樸樹帶給我的感動(dòng)和影響是超越他父親垮媒。所以呢舍悯,我也不是覺得科研是大家必須做的事情。

如果孩子喜歡科研睡雇,那么鼓勵(lì)孩子做出成績萌衬,并且受到認(rèn)可,從而進(jìn)入更好的平臺(tái)提升自己它抱,那簡直就是不要太完美帮踉ァ!

題外話到此為止观蓄,下面進(jìn)入正題混移。

人臉識別究竟是什么

人臉識別是一個(gè)非常實(shí)用的技術(shù)祠墅。很多公司的考勤就是用的人臉識別技術(shù)。人臉識別也是一個(gè)非常古老的計(jì)算機(jī)視覺問題沫屡,研究歷史至少有將近30年饵隙。早期有一篇非常出名的文章介紹特征臉[2]撮珠,是人臉識別領(lǐng)域的一個(gè)里程碑技術(shù)沮脖,原理非常簡單,就是人臉在高維空間里的低維子空間里芯急,所以可以通過降維來得到更好的識別效果勺届。下圖大致表達(dá)了特征臉的基本思想[3].

在維基百科的詞條介紹里[4], 狹義的人臉識別特指通過人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。人臉識別還可以是確認(rèn)(verification)和鑒別(identification)娶耍。確認(rèn)的過程是這樣的免姿,你先輸入你的身份ID,然后系統(tǒng)把你的人臉和你輸入身份ID的人臉作對比榕酒,如果極度相似胚膊,那么就可以確認(rèn)你是你輸入的身份ID這個(gè)人。而鑒別則是把你的人臉直接和系統(tǒng)里已有的人臉一一匹配想鹰,如果你的人臉和系統(tǒng)里的某張人臉極度相似紊婉,那么就鑒別出你的身份。確認(rèn)和鑒別都是生物特征識別和安防里常用的方法辑舷。

按照機(jī)器學(xué)習(xí)領(lǐng)域的方法喻犁,識別主要可以分為兩大類:分類和聚類。在之前的文章[5]里何缓,我介紹過分類是一種監(jiān)督學(xué)習(xí)肢础,分類過程中需要有類別的標(biāo)簽;而聚類是一種無監(jiān)督學(xué)習(xí)碌廓,聚類過程中可以不需要類別標(biāo)簽传轰。在本文中,人臉識別特指人臉的分類問題谷婆,也就是上文中的鑒別慨蛙。

人臉識別算法的必要組成

A 人臉模板(Template)

在人臉識別系統(tǒng)里,我們首先需要人臉識別的系統(tǒng)里已經(jīng)有一些人臉的照片波材,這些照片作為模板被放在人臉識別的系統(tǒng)里股淡。模板的重要性不言而喻,如果沒有這些模板廷区,我們都不知道要識別誰唯灵,還怎么談人臉識別?隙轻!收集和預(yù)處理人臉模板是一項(xiàng)龐大的工程埠帕,不過簡單的自動(dòng)化處理就可以得到還算滿意的結(jié)果垢揩。

在數(shù)學(xué)模型上,人臉模板經(jīng)常被稱為訓(xùn)練集敛瓷。訓(xùn)練集是訓(xùn)練人臉識別算法的參數(shù)的數(shù)據(jù)集叁巨。在訓(xùn)練集中,有很多人的人臉照片呐籽。假設(shè)某一個(gè)訓(xùn)練集里有K個(gè)人锋勺,每張照片的都被轉(zhuǎn)換成一個(gè)豎直方向上的向量,那么第k個(gè)人的多張人臉照片就可以組成一個(gè)矩陣Xk狡蝶,全部人臉模板就可以用一個(gè)矩陣表示(要是這里支持寫latex就好了):

X = [X1,...,Xk,...,XK]庶橱。

B 算法模型

有了模板之后,我們就可以根據(jù)輸入的測試樣本來進(jìn)行人臉識別了贪惹。這里假設(shè)y是待識別的測試樣本苏章,和X的每一列樣本一樣,是一張人臉照片轉(zhuǎn)換成的豎直方向上的向量奏瞬。

上一次教程里枫绅,我介紹了最小二乘回歸模型。這個(gè)簡單的模型被我導(dǎo)師在2011年的ICCV大會(huì)論文[6]里指出可以有效地應(yīng)用在人臉識別里硼端〔⒘埽基本模型非常簡單:

上圖是一個(gè)優(yōu)化模型,X = [X1,...,Xk,...,XK]是所有類別的人臉的所有照片組成的矩陣显蝌,也叫訓(xùn)練矩陣预伺;y是輸入的測試樣本,是一個(gè)和X每一列一樣大小的向量曼尊;p是輸入的測試樣本在訓(xùn)練樣本下的表達(dá)系數(shù)酬诀,也是一個(gè)向量,維數(shù)等于訓(xùn)練集中樣本的個(gè)數(shù)骆撇。在這個(gè)模型里主要求上述優(yōu)化模型的解瞒御,也非常簡單:

向量p畫出來的大概樣子是這樣的(大家可以忽略):

物理涵義就是輸入樣本可以被訓(xùn)練集里的樣本線性表達(dá)。

在得到p之后神郊,我們下一步該怎么用p進(jìn)行人臉識別呢肴裙?

請注意p是在訓(xùn)練集中所有的人臉照片上的表達(dá)系數(shù)向量,那么p在每個(gè)人的人臉照片Xi里的表達(dá)可以用pi來表達(dá)涌乳。那么y在不同類里可以得到不同的重構(gòu)蜻懦。即y在第i個(gè)人的人臉照片里的重構(gòu)人臉是yi=Xi*pi。如果y是第i個(gè)人的人臉照片夕晓,那么y應(yīng)該約等于yi宛乃,即y被第i個(gè)人的人臉照片Xi重構(gòu)出來的誤差就會(huì)最小。這就是人臉識別的最關(guān)鍵原理。

接下來人臉識別的步驟就很簡單而直觀了征炼,即分別計(jì)算每一個(gè)人的人臉照片重構(gòu)y的誤差析既,然后規(guī)定y就是誤差最小的那一類人臉照片所屬于的那個(gè)人:

人臉識別例子

我先給出一幅圖,讓大家有一個(gè)直觀的印象谆奥。

在上圖中眼坏,左邊是輸入的測試樣本y,中間的每一張都是一個(gè)人的人臉照片Xi酸些,那么y在全部訓(xùn)練集X=[X1,...,XK]上可以根據(jù)上面的最小二乘回歸模型得到一個(gè)表達(dá)系數(shù)向量p宰译。然后我們可以計(jì)算y在每一張人連照片Xi上的重構(gòu)誤差,誤差越大擂仍,相似性越低囤屹,誤差越小,相似性越高逢渔。比如在上圖中,y恰好與X2(數(shù)據(jù)庫里第一行左二)的誤差最低乡括,相似度達(dá)到了96%肃廓,那么y就是數(shù)據(jù)庫里第一行左二的那個(gè)人的人臉照片,與我自己的辨別相符诲泌,達(dá)到了人臉識別的目的盲赊。


人臉識別的重要性

人臉識別有多重要?人臉識別不僅在安防敷扫,海關(guān)等重要場合里發(fā)揮了很大的作用哀蘑,而且在找回遺失的孤兒上起到關(guān)鍵作用。這里不得不稱贊一下人工智能技術(shù)最近在找回丟失兒童方面所作出的貢獻(xiàn)[7]葵第,這里面有一項(xiàng)很關(guān)鍵的技術(shù)就是人臉識別绘迁,尤其是跨年齡人臉識別技術(shù)(當(dāng)然,最后還是要用DNA匹配技術(shù)深度確認(rèn))卒密。

據(jù)我所知缀台,騰訊優(yōu)圖實(shí)驗(yàn)室應(yīng)該是目前國內(nèi)做人臉識別最好的機(jī)構(gòu)之一[8]。

昨天非常榮幸收到騰訊優(yōu)圖某位高管的郵件哮奇,郵件里他邀請我去騰訊優(yōu)圖面試膛腐。希望我以后能在人臉識別領(lǐng)域做出對社會(huì)真正有貢獻(xiàn)的技術(shù)。

參考文獻(xiàn):

[1] 尹璋琦, 與高中生合作發(fā)表學(xué)術(shù)論文, https://zhuanlan.zhihu.com/p/28315413鼎俘。

[2] Turk M, Pentland A. Eigenfaces for recognition. Journal of cognitive neuroscience, 1991, 3(1): 71-86.

[3] 自動(dòng)人臉識別基本原理哲身,https://b2museum.cdstm.cn/identification/rlsb-2.htm

[4]?https://zh.wikipedia.org/wiki/%E4%BA%BA%E8%84%B8%E8%AF%86%E5%88%AB贸伐,維基百科勘天。

[5] 人工智能依然需要被“監(jiān)督”,微信公眾號“君君玩科技”。

[6] Zhang L, Yang M, Feng X. Sparse representation or collaborative representation: Which helps face recognition? IEEE international conference on computer vision (ICCV), 2011.

[7]?http://www.sohu.com/a/133773386_500237

[8] 準(zhǔn)確率99.80%误辑!騰訊優(yōu)圖再次刷新人臉識別世界紀(jì)錄,?http://tech.qq.com/a/20170330/033980.htm

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末沧踏,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子巾钉,更是在濱河造成了極大的恐慌翘狱,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,386評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件砰苍,死亡現(xiàn)場離奇詭異潦匈,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)赚导,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評論 3 394
  • 文/潘曉璐 我一進(jìn)店門茬缩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人吼旧,你說我怎么就攤上這事凰锡。” “怎么了圈暗?”我有些...
    開封第一講書人閱讀 164,704評論 0 353
  • 文/不壞的土叔 我叫張陵掂为,是天一觀的道長。 經(jīng)常有香客問我员串,道長勇哗,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,702評論 1 294
  • 正文 為了忘掉前任寸齐,我火速辦了婚禮欲诺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘渺鹦。我一直安慰自己扰法,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評論 6 392
  • 文/花漫 我一把揭開白布海铆。 她就那樣靜靜地躺著迹恐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪卧斟。 梳的紋絲不亂的頭發(fā)上殴边,一...
    開封第一講書人閱讀 51,573評論 1 305
  • 那天,我揣著相機(jī)與錄音珍语,去河邊找鬼锤岸。 笑死,一個(gè)胖子當(dāng)著我的面吹牛板乙,可吹牛的內(nèi)容都是我干的是偷。 我是一名探鬼主播拳氢,決...
    沈念sama閱讀 40,314評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蛋铆!你這毒婦竟也來了馋评?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,230評論 0 276
  • 序言:老撾萬榮一對情侶失蹤刺啦,失蹤者是張志新(化名)和其女友劉穎留特,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體玛瘸,經(jīng)...
    沈念sama閱讀 45,680評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蜕青,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了糊渊。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片右核。...
    茶點(diǎn)故事閱讀 39,991評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖渺绒,靈堂內(nèi)的尸體忽然破棺而出贺喝,到底是詐尸還是另有隱情,我是刑警寧澤芒篷,帶...
    沈念sama閱讀 35,706評論 5 346
  • 正文 年R本政府宣布搜变,位于F島的核電站,受9級特大地震影響针炉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜扳抽,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評論 3 330
  • 文/蒙蒙 一篡帕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧贸呢,春花似錦镰烧、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至固蛾,卻和暖如春结执,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背艾凯。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評論 1 270
  • 我被黑心中介騙來泰國打工献幔, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人趾诗。 一個(gè)月前我還...
    沈念sama閱讀 48,158評論 3 370
  • 正文 我出身青樓蜡感,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子郑兴,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評論 2 355

推薦閱讀更多精彩內(nèi)容