辛普森悖論(Simpson's Paradox)民褂,或者辛普森詭論,是英國(guó)統(tǒng)計(jì)學(xué)家E.H.辛普森(E.H.Simpson)于1951年提出的悖論疯潭,即在某個(gè)條件下的兩組數(shù)據(jù)赊堪,分別討論時(shí)都會(huì)滿足某種性質(zhì),可是一旦合并考慮竖哩,卻可能導(dǎo)致相反的結(jié)論哭廉。
當(dāng)人們嘗試探究?jī)煞N變量(比如新生錄取率與性別)是否具有相關(guān)性的時(shí)候,會(huì)分別對(duì)之進(jìn)行分組研究相叁。然而遵绰,在分組比較中都占優(yōu)勢(shì)的一方,在總評(píng)中有時(shí)反而是失勢(shì)的一方增淹。有如下例子(來(lái)自https://zh.wikipedia.org/wiki/%E8%BE%9B%E6%99%AE%E6%A3%AE%E6%82%96%E8%AE%BA):
一所美國(guó)高校的兩個(gè)學(xué)院椿访,分別是法學(xué)院和商學(xué)院。新學(xué)期招生虑润,人們懷疑這兩個(gè)學(xué)院有性別歧視成玫。有如下統(tǒng)計(jì):
根據(jù)上面兩個(gè)表格來(lái)看,都是女生的錄取率高。但是將兩學(xué)院的數(shù)據(jù)匯總后:
合并后變成了男生的錄取率高哭当。這個(gè)例子說(shuō)明猪腕,簡(jiǎn)單的將分組數(shù)據(jù)相加匯總,并不能反映真實(shí)情況的荣病。
還有另一個(gè)醫(yī)療方面的例子(來(lái)自https://teahouse.fifty-five.com/zh-hans/simpson-paradox-or-how-to-make-numbers-lie/):
假設(shè)我從醫(yī)生處得知自己得了腎結(jié)石,該醫(yī)生向我展示了兩種療法效果的對(duì)比數(shù)據(jù)渗柿。療法A為開(kāi)刀手術(shù)个盆,療法B為微創(chuàng)手術(shù)。兩種療法效果對(duì)比如下:
看樣子療法B成功率高朵栖。但為了謹(jǐn)慎起見(jiàn)颊亮,又咨詢了一位醫(yī)生。第二位醫(yī)生展示了從同一個(gè)療法實(shí)驗(yàn)中得出的另一種數(shù)據(jù)對(duì)比結(jié)果:
根據(jù)以上數(shù)據(jù)對(duì)比結(jié)果陨溅,他推薦使用療法A终惑,因?yàn)闊o(wú)論是治療小結(jié)石還是大結(jié)石,療法A的成功率都更高门扇。
仔細(xì)想一下雹有,如果單看大結(jié)石的話,會(huì)發(fā)現(xiàn)AB兩種療法的效果都弱于小結(jié)石的治療效果臼寄,即大結(jié)石更難治療霸奕。而療法A更常用于治療大結(jié)石, 更少用于治療小結(jié)石吉拳;而療法B的治療情況卻恰恰相反质帅。因此,療法A的整體療效數(shù)據(jù)被拉低了留攒,而療法B的整體療效數(shù)據(jù)反而被抬高了煤惩。