婚配模擬實(shí)驗(yàn)

婚戀配對(duì)實(shí)驗(yàn)

目的:

通過模擬匹配,探索常見的尋偶標(biāo)準(zhǔn),哪一種更大的概率找到對(duì)象盔几。

一、婚戀配對(duì)模擬規(guī)則:

  1. 按照一定規(guī)則生成了 1 萬男性 + 1 萬女性樣本:
    • 在配對(duì)實(shí)驗(yàn)中袱瓮,這 2 萬個(gè)樣本具有各自不同的個(gè)人屬性(財(cái)富、內(nèi)涵爱咬、樣貌)尺借,每項(xiàng)屬性都有一個(gè)得分。
    • 財(cái)富值符合指數(shù)分布精拟,內(nèi)涵和顏值符合正態(tài)分布燎斩。
    • 三項(xiàng)的平均值都為 60 分,標(biāo)準(zhǔn)差都為 15 分蜂绎。
  2. 模擬實(shí)驗(yàn)栅表,基于現(xiàn)實(shí)世界的提煉以及適度簡化,概括了三個(gè)最主流的擇偶策略:
    • 策略1:門當(dāng)戶對(duì)师枣,要求雙方三項(xiàng)指標(biāo)加和的總分接近怪瓶,差值不超過 20 分(算均值);
    • 策略2:男才女貌践美,男性要求女性的外貌分比自己高出至少 10 分洗贰,女性要求男性的財(cái)富分比自己高出至少 10 分;
    • 策略3:志趣相投陨倡、適度引領(lǐng)哆姻,要求對(duì)方的內(nèi)涵得分在比自己 低 10 分 ~ 高 10分 之間,且外貌和財(cái)富兩項(xiàng)與自己的得分差值都在 5 分之內(nèi)玫膀。
  3. 這里按單項(xiàng)選擇矛缨,用男性去匹配女性,每一輪實(shí)驗(yàn)中帖旨,我們將三種策略隨機(jī)平分給所有樣本(即采用每種策略的男性有 3333 個(gè)樣本)
  4. 我們?yōu)閱紊砟信S機(jī)選擇一個(gè)對(duì)象箕昭,若對(duì)方互相符合要求就算配對(duì)成功,配對(duì)失敗的男女則進(jìn)入下一輪配對(duì)解阅。

二落竹、樣本數(shù)據(jù)處理

  1. 處理樣本數(shù)據(jù)
    • 在配對(duì)實(shí)驗(yàn)中,這 2 萬個(gè)樣本具有各自不同的個(gè)人屬性(財(cái)富货抄、內(nèi)涵述召、樣貌),每項(xiàng)屬性都有一個(gè)得分蟹地。
    • 財(cái)富值符合指數(shù)分布积暖,內(nèi)涵和顏值符合正態(tài)分布。
    • 三項(xiàng)的平均值都為 60 分怪与,標(biāo)準(zhǔn)差都為 15 分夺刑。

    要求:

    1. 構(gòu)建函數(shù)實(shí)現(xiàn)樣本數(shù)據(jù)生成模型,函數(shù)參數(shù)之一為“樣本數(shù)量”,并用該模型生成 1 萬男性 + 1 萬女性數(shù)據(jù)樣本(包括三個(gè)指標(biāo):財(cái)富遍愿、內(nèi)涵存淫、樣貌)
    2. 繪制柱狀圖查看每個(gè)人的屬性分值情況

    提示:

    • 正態(tài)分布:np.random.normal(loc = 60,scale = 15.size = n)
    • 指數(shù)分布:np.random.exponential(scale = 15,size = n) + 45
    正態(tài)分布與指數(shù)分布
    樣本數(shù)據(jù)屬性分值情況

數(shù)據(jù)生成后的格式:

數(shù)據(jù)生成后的格式
  1. 生成 99 個(gè)男性、99 個(gè)女性樣本數(shù)據(jù)沼填,分別針對(duì)三種策略構(gòu)建算法函數(shù)(核心:篩選人數(shù))
    • 策略1:門當(dāng)戶對(duì)桅咆,要求雙方三項(xiàng)指標(biāo)加和的總分接近,差值不超過 20 分坞笙;

    • 策略2:男才女貌岩饼,男性要求女性的外貌分比自己高出至少 10 分,女性要求男性的財(cái)富分比自己高出至少 10 分羞海;

    • 策略3:志趣相投、適度引領(lǐng)曲管,要求對(duì)方的內(nèi)涵得分在比自己低 10 分 ~ 高 10分之間却邓,且外貌和財(cái)富兩項(xiàng)與自己的得分差值都在 5 分之內(nèi)。

    • 每一輪實(shí)驗(yàn)中院水,我們將三種策略隨機(jī)平分給所有的樣本腊徙,這里則是三種分別 33 人。

    • 這里不同策略匹配結(jié)果可能重合檬某,所以為了簡化模型

      → 這里先進(jìn)行策略 1 模擬

      → 模擬成功后去掉該輪成功匹配的女性數(shù)據(jù)撬腾,再進(jìn)行策略 2 模擬

      → 模擬成功后去掉該輪成功匹配的女性數(shù)據(jù),再進(jìn)行策略 3 模擬

要求:

  1. 生成樣本數(shù)據(jù)
  2. 給男性樣本數(shù)據(jù)恢恼,隨機(jī)分配策略選擇 → 這里以男性為出發(fā)作為策略選擇方
  3. 嘗試做第一輪匹配民傻,記錄成功的匹配結(jié)果,并篩選出失敗的男女進(jìn)入下一輪匹配
  4. 構(gòu)建模型场斑,并模擬 1 萬男性 + 1 萬女性的配對(duì)實(shí)驗(yàn)
  5. 通過數(shù)據(jù)分析漓踢,回答下面的問題:
    • 百分之多少的樣本數(shù)據(jù)成功匹配到了對(duì)象?
    • 采取不同擇偶策略的匹配成功率分別是多少漏隐?
    • 采取不同擇偶策略的男性各項(xiàng)平均分是多少喧半?

提示:

  1. 擇偶策略評(píng)判標(biāo)準(zhǔn):
    • 若匹配成功,則該男性與被匹配在這一輪都算成功青责,退出游戲
    • 若匹配失敗挺据,則該男性與被匹配在這一輪都算失敗,并進(jìn)行下一輪
    • 若同時(shí)多個(gè)男性選擇了同一個(gè)女性脖隶,且滿足成功配對(duì)要求扁耐,則綜合評(píng)分高的男性算為匹配成功
  2. 構(gòu)建空的數(shù)據(jù)集,用于存儲(chǔ)匹配成功的數(shù)據(jù)
  3. 每一輪匹配之后产阱,刪除成功匹配的數(shù)據(jù)之后做葵,進(jìn)入下一輪,這里刪除數(shù)據(jù)用 df.drop()
  4. 這里建議用 while 去做迭代 → 當(dāng)該輪沒有任何配對(duì)成功心墅,則停止實(shí)驗(yàn)酿矢。

匹配成功的數(shù)據(jù)存儲(chǔ)格式:

匹配成功的數(shù)據(jù)存儲(chǔ)格式
結(jié)論1:
  1. 71.22% 的樣本數(shù)據(jù)成功匹配到了對(duì)象

  2. 策略1 的匹配成功率為 100.00%

    策略2 的匹配成功率為 39.03%

    策略3 的匹配成功率為 73.78%

    即門當(dāng)戶對(duì)匹配率最高榨乎,其次是志趣相投,男才女貌的匹配率較低瘫筐。

  3. 擇偶策略1的男性 → 財(cái)富均值為 60.15蜜暑,內(nèi)涵均值 59.85,外貌均值為 59.84
    擇偶策略2的男性 → 財(cái)富均值為 72.05策肝,內(nèi)涵均值 60.22肛捍,外貌均值為 55.17
    擇偶策略3的男性 → 財(cái)富均值為 57.80,內(nèi)涵均值 59.91之众,外貌均值為 57.80

    三個(gè)策略均值相差不大

  4. 通過箱型圖查看整體趨勢(shì)可以得出拙毫,策略2 的財(cái)富值明顯較高;內(nèi)涵方面 3 個(gè)策略都相差不大棺禾;外貌方面缀蹄,策略1 和 策略3 外貌的最高值高于策略2。

  5. 以 99 男 + 99 女的樣本數(shù)據(jù)膘婶,繪制匹配折線圖

    要求:

    1. 生成樣本數(shù)據(jù)缺前,模擬匹配實(shí)驗(yàn)
    2. 生成繪制數(shù)據(jù)表格
    3. bokeh 制圖
      • 找了設(shè)置圖例,并且可交互(消隱身模式)

    提示:

    1. bokeh 制圖時(shí)悬襟,y 軸為男性衅码,x 軸為女性

    2. 繪制數(shù)據(jù)表格中,需要把男女性的數(shù)字編號(hào)提取出來脊岳,這樣圖表橫縱軸好識(shí)別

    3. bokeh 繪制折線圖示意:p.line([0,女性數(shù)字編號(hào),女性數(shù)字編號(hào)],[男性數(shù)字編號(hào),男性數(shù)字編號(hào),0])
      數(shù)據(jù)表格格式
配對(duì)實(shí)驗(yàn)過程模擬示意
  1. 生成不同類型男女配對(duì)成功率矩陣圖

    要求:

    1. 以之前 1 萬男 + 1 萬女實(shí)驗(yàn)的結(jié)果為數(shù)據(jù)

    2. 按照財(cái)富值逝段、內(nèi)涵值、外貌值分別給三個(gè)區(qū)間割捅,以區(qū)間來評(píng)判“男女類型”

      • 高分(70 - 100)惹恃,中分(50 - 70),低分(0 -50)
      • 按照此類分布棺牧,男女性都可以分為 27 中類型:財(cái)高品高顏高巫糙,財(cái)高品中顏高,財(cái)高品低顏高 等
    3. bokeh 制圖

      • 散點(diǎn)圖
      • 27 行 * 27列颊乘,三點(diǎn)的顏色深淺代表匹配成功率

提示:

  1. 注意繪圖的數(shù)據(jù)結(jié)構(gòu)

  2. 這里散點(diǎn)圖通過 xy 軸定位數(shù)據(jù)参淹,然后通過設(shè)置顏色的透明度來表示匹配成功率

  3. alpha 字段為每種類型匹配成功率標(biāo)準(zhǔn)化之后的結(jié)果,再乘以一個(gè)參數(shù)

    → data['alpha'] = (data['chance'] - data['chance'].min()) /(data['chance'].max() - data['chance'].min()) * 8

Bokeh 繪圖數(shù)據(jù)結(jié)構(gòu)

Bokeh 繪圖數(shù)據(jù)結(jié)構(gòu):

不同類型配對(duì)成功率

由上圖可知乏悄,男性財(cái)中品中顏低 與 女性財(cái)?shù)推分蓄佒?的匹配率較高浙值,相當(dāng)于 顏值較低的普通男性 與 財(cái)富值較低的普通女性 的匹配率較高。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末檩小,一起剝皮案震驚了整個(gè)濱河市开呐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖筐付,帶你破解...
    沈念sama閱讀 206,968評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件卵惦,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡瓦戚,警方通過查閱死者的電腦和手機(jī)沮尿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來较解,“玉大人畜疾,你說我怎么就攤上這事∮∠危” “怎么了啡捶?”我有些...
    開封第一講書人閱讀 153,220評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長奸焙。 經(jīng)常有香客問我瞎暑,道長,這世上最難降的妖魔是什么忿偷? 我笑而不...
    開封第一講書人閱讀 55,416評(píng)論 1 279
  • 正文 為了忘掉前任金顿,我火速辦了婚禮臊泌,結(jié)果婚禮上鲤桥,老公的妹妹穿的比我還像新娘。我一直安慰自己渠概,他們只是感情好茶凳,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著播揪,像睡著了一般贮喧。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上猪狈,一...
    開封第一講書人閱讀 49,144評(píng)論 1 285
  • 那天箱沦,我揣著相機(jī)與錄音,去河邊找鬼雇庙。 笑死谓形,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的疆前。 我是一名探鬼主播寒跳,決...
    沈念sama閱讀 38,432評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼竹椒!你這毒婦竟也來了童太?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評(píng)論 0 261
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎书释,沒想到半個(gè)月后翘贮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,586評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡征冷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評(píng)論 2 325
  • 正文 我和宋清朗相戀三年择膝,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片检激。...
    茶點(diǎn)故事閱讀 38,137評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡肴捉,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出叔收,到底是詐尸還是另有隱情齿穗,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評(píng)論 4 324
  • 正文 年R本政府宣布饺律,位于F島的核電站窃页,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏复濒。R本人自食惡果不足惜脖卖,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望巧颈。 院中可真熱鬧畦木,春花似錦、人聲如沸砸泛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽唇礁。三九已至勾栗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間盏筐,已是汗流浹背围俘。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評(píng)論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留琢融,地道東北人界牡。 一個(gè)月前我還...
    沈念sama閱讀 45,595評(píng)論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像吏奸,于是被迫代替她去往敵國和親欢揖。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 書名基因:不平等的遺傳作者(美)道爾頓·康利(Dalton Conley) / (美)詹森·弗萊徹(Jason F...
    xuwensheng閱讀 5,358評(píng)論 1 11
  • 用stata算集中指數(shù)采用Stata系統(tǒng)自帶數(shù)據(jù)庫auto.dta奋蔚。 一她混、集中趨勢(shì)的統(tǒng)計(jì)描述以變量price為例進(jìn)...
    古洞洞閱讀 5,867評(píng)論 1 3
  • 去年為了考CPA購入IPAD烈钞,為了攜帶方便,促進(jìn)學(xué)習(xí)坤按,買了MINI4毯欣。后來知道了PRO 可以配蘋果筆畫畫以后就特別...
    小杏仁閱讀 923評(píng)論 0 5
  • 第一步:目標(biāo)市場(chǎng)定位 目標(biāo)市場(chǎng)定位是一個(gè)市場(chǎng)細(xì)分與目標(biāo)市場(chǎng)選擇的過程,即明白為誰服務(wù)(Who)臭脓。在市場(chǎng)分化的今天酗钞,...
    產(chǎn)品技術(shù)Zane閱讀 1,134評(píng)論 0 6
  • 上朝為官千百度,不見明人把事悟来累。官官官官官中關(guān)砚作,事事事事事中視。明眼才可看明事嘹锁,明人才可做明官葫录。不得其中是何意,又...
    東風(fēng)唐閱讀 205評(píng)論 0 0