利用機(jī)器學(xué)習(xí)進(jìn)行人臉顏值評(píng)分

科學(xué)可以讓童話變成現(xiàn)實(shí)玻褪, 還記得《白雪公主》里面的魔鏡么纵菌, 利用人類科技真是可以讓平民老百姓也能有一個(gè)了吻氧。 因?yàn)槿祟愖層?jì)算機(jī)也可以自己用機(jī)器學(xué)習(xí)做判斷了瓤球。

利用機(jī)器學(xué)習(xí)的常用步驟就是先讓機(jī)器學(xué)習(xí)融欧,再讓機(jī)器干活。

對(duì)人臉進(jìn)行打分這個(gè)事兒怎么學(xué)習(xí)卦羡, 肯定得給計(jì)算機(jī)一堆照片噪馏,告訴它每一張照片的得分是多少, 計(jì)算機(jī)學(xué)習(xí)完了绿饵, 再給它一個(gè)它沒(méi)見(jiàn)過(guò)的照片欠肾, 讓它打個(gè)分,看看學(xué)習(xí)的好不好拟赊。

學(xué)習(xí)的話可以利用一些機(jī)器學(xué)習(xí)的框架刺桃,比如 Caffe, Tensorflow, 不過(guò)這些框架安裝比較費(fèi)勁, 使用起來(lái)比較麻煩吸祟,運(yùn)行時(shí)間也比較長(zhǎng)瑟慈。 我們?cè)囋囉米罨A(chǔ)的機(jī)器學(xué)習(xí)庫(kù)來(lái)解決這個(gè)事吧桃移。 本文涉及到的代碼和文檔都放在了 Github 的這個(gè)鏈接里了:

https://github.com/oatmeal3000/female-face-rating

首先,我們得把人臉照片中的關(guān)鍵信息提出來(lái)葛碧,這個(gè)信息越少越好借杰, 這樣以后計(jì)算機(jī)進(jìn)行學(xué)習(xí)的時(shí)候比較省事。 對(duì)人臉來(lái)講进泼, 決定顏值高低的是一些關(guān)鍵點(diǎn)的位置蔗衡。 這些關(guān)鍵點(diǎn)的位置在照片中就是用橫縱坐標(biāo)來(lái)表示。 所以我們先從網(wǎng)上找到一些妹子的照片乳绕,這些照片放在了 source/web_image 文件夾里粘都,對(duì)于每張照片的評(píng)分, 放在了 data/ratings.txt 文件里刷袍。 以照片文件夾路徑為參數(shù)翩隧, 我們運(yùn)行 1_facial_landmarks.py 程序, 它可以把每張照片中人臉的關(guān)鍵點(diǎn)提取出來(lái)呻纹,存在一個(gè)文本文件里堆生。 這個(gè)程序里面用到了 dlib 庫(kù)的人臉識(shí)別功能, 把照片中的人臉找出來(lái)雷酪,再去找人臉中的關(guān)鍵點(diǎn)淑仆。這塊有一個(gè)特別需要注意的地方, 因?yàn)槲覀兪菑囊粋€(gè)文件夾里的 500 張照片逐個(gè)照片去找關(guān)鍵點(diǎn)的哥力,在程序中用 listdir 函數(shù)列出這 500 張照片時(shí)蔗怠, 千萬(wàn)要記得排序!因?yàn)?listdir 函數(shù)列出來(lái)的文件名順序吩跋,并不是按照照片文件名中的序號(hào)順序寞射, 所以調(diào)用了一下 sort 函數(shù):
list_im.sort(reverse = True, key=lambda x:int(x[8:-4]))

第二步, 我們可以從人臉的關(guān)鍵點(diǎn)里計(jì)算一下特征锌钮。 這個(gè)特征就是各個(gè)關(guān)鍵點(diǎn)之間的距離比例桥温。 當(dāng)然我們可以把任意兩個(gè)人臉關(guān)鍵點(diǎn)之間的距離算一下, 再算一下這個(gè)距離與其他所有距離之間的比例梁丘。 但是人臉關(guān)鍵點(diǎn)至少有幾十個(gè)侵浸, 我們?cè)趺礈p少一下程序計(jì)算量。 這樣我們等待的時(shí)間也可以少一點(diǎn)氛谜。 我們可以站在對(duì)人臉美學(xué)研究比較多的專家的肩膀上掏觉,來(lái)實(shí)現(xiàn)這個(gè)目的。 韓國(guó)科學(xué)家在這方面比較先進(jìn)值漫,因?yàn)樗鼈兊恼菁夹g(shù)應(yīng)用的太普遍了澳腹, 看看這篇文章 “A Novel Framework for Assessing Facial Attractiveness Based on Facial Proportions”, 它總結(jié)了幾個(gè)決定人臉美麗程度的幾個(gè)重要比例,我們可以拿過(guò)來(lái)用遵湖。 這幾個(gè)關(guān)鍵點(diǎn)距離比例,我們把它算好后放在 data/features_ALL.txt 文本文件中晚吞。

第三步延旧, 有了每張照片的特征和評(píng)分, 我們就可以把他們?nèi)咏o計(jì)算機(jī)學(xué)習(xí)了槽地。 我們還有個(gè)可以減少學(xué)習(xí)時(shí)間的手段可以利用迁沫,就是主成分分析 Principal Component Analysis
(PCA) 大法。 我們算出來(lái)的特征還是有點(diǎn)多捌蚊,我們用 PCA 給它減少點(diǎn)集畅, scikit-learn 中有 PCA 的庫(kù)可以直接利用。 特征想要減少到多少呢缅糟, 可以利用已有的數(shù)據(jù)集實(shí)驗(yàn)確定一下挺智, 或者隨便給它一個(gè)差不多不太大的值先用用看。 之后我們就可以利用機(jī)器學(xué)習(xí)的模型進(jìn)行訓(xùn)練了窗宦。 常用的模型有線性回歸赦颇、邏輯回歸、支持向量機(jī)赴涵、隨機(jī)森林和高斯過(guò)程回歸媒怯。不同的模型表現(xiàn)效果會(huì)不太一樣,針對(duì)某個(gè)特定的問(wèn)題髓窜, 你可以都實(shí)驗(yàn)一下扇苞,挑選一個(gè)表現(xiàn)最好的。 這個(gè)標(biāo)準(zhǔn)可以根據(jù) Pearson correlation 寄纵, 從你的數(shù)據(jù)集里專門拿出來(lái)一小部分做個(gè)測(cè)試鳖敷,實(shí)驗(yàn)一下,看看這個(gè)模型的訓(xùn)練結(jié)果和測(cè)試數(shù)據(jù)集吻合程度高不高程拭。 學(xué)習(xí)訓(xùn)練的結(jié)果就放在 model文件夾里面哄陶,后面就可以利用它進(jìn)行顏值評(píng)分了。

第四步哺壶, 給程序一張它沒(méi)見(jiàn)過(guò)的照片屋吨,讓計(jì)算機(jī)自己判斷吧。 我們還是要從這張照片中把人臉找出來(lái)山宾,找到人臉中的所有關(guān)鍵點(diǎn)至扰。利用關(guān)鍵點(diǎn)計(jì)算出我們感興趣的特征 (記得那篇韓國(guó)論文了沒(méi)有) ,把我們第三步生成的訓(xùn)練結(jié)果模型加載進(jìn)來(lái)资锰,利用那個(gè)訓(xùn)練過(guò)的模型進(jìn)行預(yù)測(cè)評(píng)分吧敢课。

以上就是一個(gè)機(jī)器學(xué)習(xí)的完整過(guò)程,具體實(shí)現(xiàn)請(qǐng)實(shí)驗(yàn)代碼~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市直秆,隨后出現(xiàn)的幾起案子濒募,更是在濱河造成了極大的恐慌,老刑警劉巖圾结,帶你破解...
    沈念sama閱讀 219,589評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件瑰剃,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡筝野,警方通過(guò)查閱死者的電腦和手機(jī)晌姚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,615評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)歇竟,“玉大人挥唠,你說(shuō)我怎么就攤上這事』酪椋” “怎么了宝磨?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,933評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)盅安。 經(jīng)常有香客問(wèn)我懊烤,道長(zhǎng),這世上最難降的妖魔是什么宽堆? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,976評(píng)論 1 295
  • 正文 為了忘掉前任腌紧,我火速辦了婚禮,結(jié)果婚禮上畜隶,老公的妹妹穿的比我還像新娘壁肋。我一直安慰自己,他們只是感情好籽慢,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,999評(píng)論 6 393
  • 文/花漫 我一把揭開(kāi)白布浸遗。 她就那樣靜靜地躺著,像睡著了一般箱亿。 火紅的嫁衣襯著肌膚如雪跛锌。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,775評(píng)論 1 307
  • 那天届惋,我揣著相機(jī)與錄音髓帽,去河邊找鬼。 笑死脑豹,一個(gè)胖子當(dāng)著我的面吹牛郑藏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播瘩欺,決...
    沈念sama閱讀 40,474評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼必盖,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼拌牲!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起歌粥,我...
    開(kāi)封第一講書(shū)人閱讀 39,359評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤塌忽,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后失驶,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體土居,經(jīng)...
    沈念sama閱讀 45,854評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,007評(píng)論 3 338
  • 正文 我和宋清朗相戀三年突勇,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片坷虑。...
    茶點(diǎn)故事閱讀 40,146評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡甲馋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出迄损,到底是詐尸還是另有隱情定躏,我是刑警寧澤,帶...
    沈念sama閱讀 35,826評(píng)論 5 346
  • 正文 年R本政府宣布芹敌,位于F島的核電站痊远,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏氏捞。R本人自食惡果不足惜碧聪,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,484評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望液茎。 院中可真熱鬧逞姿,春花似錦、人聲如沸捆等。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,029評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)栋烤。三九已至谒养,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間明郭,已是汗流浹背买窟。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,153評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留薯定,地道東北人蔑祟。 一個(gè)月前我還...
    沈念sama閱讀 48,420評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像沉唠,于是被迫代替她去往敵國(guó)和親疆虚。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,107評(píng)論 2 356

推薦閱讀更多精彩內(nèi)容