今天認識了一個很有趣的統(tǒng)計學名詞,叫做“伯克森悖論”(Berkson's paradox),也稱為“伯克森偏見”(Berkson's bias)适瓦。
它指的是,當不同樣本被納入統(tǒng)計的概率不同時谱仪,樣本的兩個不顯著相關(guān)的特征就能夠表現(xiàn)出一定的相關(guān)性玻熙。
因為抽樣方法的錯誤,導(dǎo)致樣本不能代表總體疯攒,所以可能就會得到錯誤的結(jié)論(即觀察到相關(guān)性)嗦随。這屬于理性的思考。
但當伯克森悖論發(fā)生在生活中時敬尺,我們可能就無法做到理性思考了枚尼。
下面給你舉個例子。
假設(shè)男人的長相和性格是兩個不相關(guān)的特征砂吞,那么所有男人在這兩個特征上的分布就如下圖所示署恍,一個點代表了一個男人。對所有點進行擬合蜻直,得到一條斜率為 0 的直線盯质,代表了從總體上來看,男人長相與性格無關(guān):
現(xiàn)在概而,假如有一個比較挑的女孩呼巷,我們就叫她 A 吧。A 只愿意接觸長相和性格都達到一定水平的男人赎瑰,要么夠帥王悍,要么性格夠好,即要滿足:
長相 + 性格 ≥ 某個閾值
也就是說乡范,只有下圖右上角區(qū)域的男人配名,會入 A 的法眼啤咽。這些男人,構(gòu)成了 A 的異性交際圈渠脉。
對這些男人的長相和性格進行擬合宇整,發(fā)現(xiàn)居然長相和性格呈現(xiàn)了負相關(guān)的關(guān)系(斜率為負)!所以 A 就會說芋膘,以我多年經(jīng)驗發(fā)現(xiàn)鳞青,長相帥的男人,大多性格都不太好为朋。
你說她錯吧臂拓,她也沒錯,她觀察到的現(xiàn)象就是這樣子习寸,但你總覺得哪里不對胶惰,卻也找不到證據(jù)來反駁她。
這樣的例子還有很多霞溪,你是否也聽說過下面的經(jīng)驗之談:
- 女人越漂亮孵滞,就越不聰明;
- 男人越聰明鸯匹,表達能力越差坊饶;
- 流行音樂/書籍都沒什么深度;
- ......
現(xiàn)在殴蓬,知道了“伯克森悖論”以后匿级,你就知道如何來解釋這種現(xiàn)象了 —— 我們每個人的生活經(jīng)歷不同,所接觸到的人也不同染厅,我們通過有限觀察得到的結(jié)論痘绎,并不一定適用于其他人,因為我們觀察到的樣本分布糟秘,并不能代表總體樣本的分布简逮!
另外,如果你還了解“幸存者偏差”的話尿赚,可能會覺得和“伯克森悖論”很像。確實蕉堰,這兩個概念凌净,描述的都是“選擇偏差”,出錯的根本原因在于抽樣得到的樣本不能代表總體屋讶。兩者區(qū)別在于冰寻,“幸存者偏差”研究的對象是一個特征,描述的是在一個特征維度上抽樣不均勻所導(dǎo)致偏差的現(xiàn)象皿渗;而“伯克森悖論”研究的對象是兩個不相關(guān)特征斩芭,描述的是抽樣不均勻所導(dǎo)致兩個特征呈現(xiàn)一定的相關(guān)性的現(xiàn)象轻腺。
最后,我想說的是划乖,如果你能從生活和工作中總結(jié)出什么經(jīng)驗贬养,那么恭喜你,你是個善于發(fā)現(xiàn)和總結(jié)的人琴庵,我歡迎你分享你的收獲误算,但也請你不要把你的經(jīng)驗強加在我身上,因為迷殿,我們不一樣儿礼。