辛普森悖論(Simpson Paradox)定義:
辛普森悖論為英國統(tǒng)計(jì)學(xué)家E.H.辛普森(E.H.Simpson)于1951年提出的悖論泞遗,即在某個(gè)條件下的兩組數(shù)據(jù),分別討論時(shí)都會滿足某種性質(zhì)充包,可是一旦合并考慮挑格,卻可能導(dǎo)致相反的結(jié)論斤蔓。
例子說明
- 比賽100場球賽以總勝率評價(jià)好壞令花。取巧的人專找高手挑戰(zhàn)20場而勝1場,另外80場找平手挑戰(zhàn)而勝40場俭识,結(jié)果勝率41%慨削;認(rèn)真的人則專挑高手挑戰(zhàn)80場而勝8場,而剩下20場平手打個(gè)全勝套媚,結(jié)果勝率為28%缚态,比41%小很多。但仔細(xì)觀察挑戰(zhàn)對象堤瘤,后者明顯更有實(shí)力
2.詳見 數(shù)據(jù)分析必須警惕的坑:辛普森悖論 中的IOS/Andrioid設(shè)備的轉(zhuǎn)化率
其他
- A/B Test 實(shí)驗(yàn)時(shí)需注意
避免方法
- 樣本選取要隨機(jī)玫芦、均衡
- 加權(quán)重參數(shù)計(jì)算各項(xiàng)的總和