一件發(fā)生在大約兩年前的故事,在通過聚類算法分析了洛杉磯2萬女性的600萬個OkCupid(可以理解為美國的世紀(jì)家園)問題的答案以后,35歲的數(shù)學(xué)家Chris McKinlay開始用程序以每天1000個人的速度給與他高匹配的女性組發(fā)送個人簡介被济,最后在約會到第88次后,向28歲的Tien Wang求婚羡宙,找到了真愛孵坚。
今天火箭君就來講述一下,Chris效率姻緣的來龍去脈滞时,順便安利一本書給大家看:
緣起OkCupid
OkCupid是在2004年由一個哈弗大學(xué)數(shù)學(xué)系畢業(yè)生創(chuàng)立的叁幢。每一個會員都會被要求回答一系列涉及政治、宗教坪稽、家庭曼玩、手機(jī)、感情的問題窒百。平均每個會員都會回答從上千個問題中挑選出的350個問題黍判。隨后OkCupid網(wǎng)站通過算法把雙方匹配起來,推薦給用戶篙梢。
Chris發(fā)現(xiàn)OkCupid這網(wǎng)站不靠譜啊顷帖,他只會被那些恰巧和他回答了同一些問題的女性匹配,這導(dǎo)致他能找到的女性匹配率非常低。為了解決這個問題窟她,他決定自己弄一個算法搞清楚回答了什么問題的姑娘是他鐘意的類型陈症,同時剔除那些不誠實的回答。這樣他就能把把網(wǎng)站上即使回答了不同問題的姑娘震糖,也囊括進(jìn)來录肯。
下面這個人就是本次故事的主角:Chris McKinlay
第一步:搞數(shù)據(jù)
Chris注冊了12個假賬號,然后用Python腳本去訪問他可能感興趣的25-45歲異性和雙性戀女性(好的大哥吊说,你贏了= =+)的頁面论咏,然后存下這些人的各種信息(身高、抽煙習(xí)慣颁井、興趣厅贪、星座什么的所有的亂七八糟的東西)
接著就是要知道這些人的問題答案了。OkCupid也不是傻子雅宾,防抓取機(jī)制導(dǎo)致他的機(jī)器人腳本沒辦法大量獲取目標(biāo)姑娘的問題答案养涮。為此,Chris又訓(xùn)練了一個腳本機(jī)器人眉抬,模擬真人試用網(wǎng)站的習(xí)慣贯吓,并抓取信息。一周以后蜀变,他的機(jī)器人抓取到了2萬個姑娘回答的600萬個問題悄谐。
第二步:找規(guī)律
Chris用了一個叫K-Modes的算法成功發(fā)現(xiàn):2萬個姑娘可以被歸為統(tǒng)計學(xué)上顯著不同的7類。然后他又抓取了5000個姑娘的信息库北,去證明自己找到的規(guī)律是真的…… 下面這圖就是他的聚類結(jié)果
第三步:找到合適自己的
Chris逐個查看了這7個類型爬舰,有的年紀(jì)過大,有的太信基督寒瓦。最后他關(guān)注了兩種合適自己的類型:25歲左右情屹,從事藝術(shù)和音樂工作的獨(dú)立創(chuàng)作者(A組)和年齡稍大些,從事設(shè)計孵构、編輯工作的人(B組)屁商。他決定同時出擊烟很!
第四步:出擊颈墅!
為了獲得建立在真實基礎(chǔ)上的姻緣,Chris誠實回答了自己的每一個問題雾袱。然后恤筛,這哥們又寫了一個算法來決定回答的每個問題的重要性——他為每一組女性各創(chuàng)造了一份自己的檔案:第一個檔案的照片是他在彈奏吉他,第二個的照片是他在攀巖芹橡。
火箭君去人肉了一下毒坛,找到了疑似的那張照片,大家隨便感受下..
此時,他發(fā)現(xiàn)煎殷,他能夠在網(wǎng)站上找到的女性屯伞,已經(jīng)有大量99%匹配的女性了,超過90%匹配的更是數(shù)不勝數(shù)豪直。因為在OkCupid上劣摇,你需要訪問別人的頁面,別人會看到你訪問過他們弓乙,所以Chris又只好寫了個程序末融,每天訪問1000個目標(biāo)姑娘的首頁,不斷重復(fù)暇韧,姑娘們就會發(fā)現(xiàn):“哇勾习!有個超配自己的帥哥訪問了我的主頁!”
結(jié)果就是懈玻,他的OkCupid主頁每天被他的目標(biāo)女性訪問400次巧婶,私信也開始不斷飛來(差不多一天20個人私信他,表示對他有興趣)~
第五步:線下約會
數(shù)學(xué)工作已經(jīng)完成了涂乌,下面Chris要做的就是約會了粹舵。這哥們隨即在將近2個月的時間里,進(jìn)行了87次約會骂倘,其中和大多數(shù)人的約會都只進(jìn)行了一次眼滤,他只能和極少部分的人進(jìn)行兩次甚至三次約會。
成功!!
最后當(dāng)?shù)?8次約會時历涝,與他91%匹配的Christine Tien Wang出現(xiàn)時诅需,他們雙雙關(guān)閉了OkCupid賬戶。最后Chris在Skype聊天時拿出鉆戒向Tien Wang求婚荧库,Tien Wang同意了堰塌。
故事說完了~Chris在科學(xué)的分析之后,獲得了僅僅八十八分之一的約會成功率分衫,從上百萬陌生人里找到了老婆……
如果你昨天被虐慘了想知道怎么做:
Chris出了一本書《Optimal Cupid: Mastering the Hidden Logic of OkCupid》场刑,安利一下,你可以點(diǎn)擊原文直接去亞馬遜買~
如果你想雞湯一點(diǎn):那么這個故事告訴我們……
▼
▼
▼
▼
▼
▼
▼
▼