? ? ? 【導(dǎo)讀】 悖論是表面上同一命題或推理中隱含著兩個(gè)對(duì)立的結(jié)論鞋真,而這兩個(gè)結(jié)論都能自圓其說。緯度分析是統(tǒng)計(jì)分析中的常用方法海诲,在緯度拆解分析過程中可能會(huì)出現(xiàn)整體趨勢(shì)與分緯度趨勢(shì)看似相矛盾的地方:辛普森悖論檩互。辛普森悖論在分析問題時(shí)需要加以警惕,但在某些場(chǎng)景卻也可以加以利用闸昨。
? ? ? ? 首先看看緯度分析什么情況下會(huì)出現(xiàn)辛普森悖論。在數(shù)據(jù)驅(qū)動(dòng)增長(zhǎng)的分析中拍嵌,我們會(huì)需要從宏觀上了解大盤的數(shù)字和趨勢(shì),也會(huì)需要對(duì)數(shù)據(jù)進(jìn)行不同維度分解嵌牺,以獲取更加精細(xì)的數(shù)據(jù)洞察龄糊,思考維度對(duì)于大盤的影響。如做增長(zhǎng)留存分析時(shí)僻弹,會(huì)拆分渠道進(jìn)行分析他嚷,如下圖:
? ? ? 假設(shè)場(chǎng)景:通過數(shù)據(jù)和趨勢(shì)某天發(fā)現(xiàn)大盤的留存率下跌筋蓖,為了分析下跌是由于哪個(gè)渠道導(dǎo)致的,于是通過維度分解分析方法對(duì)維度進(jìn)行拆解粘咖,發(fā)現(xiàn)每個(gè)渠道的留存率都是增長(zhǎng)的,數(shù)據(jù)如下表所示:
? ? ? ? 于是三連問:每個(gè)渠道留存率都在增長(zhǎng),為什么整體大盤反而下跌呢讽坏?數(shù)據(jù)是不是有問題?還是我眼睛有問題路呜?不,都沒有問題党涕,是思路有問題巡社,當(dāng)直觀現(xiàn)象與經(jīng)驗(yàn)出現(xiàn)矛盾的時(shí)候手趣,那一定是數(shù)據(jù)分析中忽視了某個(gè)變量肥荔。
? ? ? 當(dāng)數(shù)據(jù)分析忽略了某個(gè)重要變量時(shí)可能會(huì)導(dǎo)致出現(xiàn)辛普森悖論:數(shù)據(jù)集分組呈現(xiàn)的趨勢(shì)與數(shù)據(jù)集聚合呈現(xiàn)的趨勢(shì)相反的現(xiàn)象朝群。
? ? ? ? 其實(shí)姜胖,仔細(xì)想想便能發(fā)現(xiàn)是由于渠道1拖了整條街的大腿。上述數(shù)據(jù)中直觀上可能忽視的變量就是權(quán)重右莱。不同渠道的權(quán)重不一樣,值小量大亚再,雖然留存率也在漲晨抡,但是量占比也在漲。雖然一個(gè)臭皮匠努力不拖后腿了如捅,但是多了兩個(gè)臭皮匠调煎,那也能拖垮諸葛亮。為了打破這種悖論需要引入新的規(guī)則烈涮,如渠道權(quán)重窖剑。在做留存時(shí)往往會(huì)增加對(duì)優(yōu)質(zhì)渠道的投放以提高整體留存,但優(yōu)質(zhì)渠道價(jià)格也會(huì)相對(duì)越貴西土,也需要權(quán)衡利弊需了。
? ? ? ? 辛普森悖論的例子很多,在出現(xiàn)這種現(xiàn)象時(shí)我們需要分析其出現(xiàn)的原因肋乍,避免做成錯(cuò)誤的分析結(jié)論或被其現(xiàn)象困擾。辛普森悖論出現(xiàn)時(shí)容易給人帶來分析上的困擾是因?yàn)閺目傮w上和分維度看效果不一堪伍,但也正因?yàn)榇嬖谡w和分組趨勢(shì)相反,可以強(qiáng)調(diào)其中的一方面忽視另一方面涮俄,引導(dǎo)對(duì)方接受對(duì)自己有利的觀點(diǎn)尸闸,在某文章看到這么一個(gè)栗子,在福特總統(tǒng)的1974~1978年的任期中苞尝,他對(duì)每個(gè)收入人群都進(jìn)行了減稅茧痕,但此期間全國(guó)性的稅收額有明顯上漲(表2)。如果是支持的政黨可以宣稱對(duì)每個(gè)收入人群都實(shí)施了很大程度的減稅曼氛,但是反對(duì)的政黨可以堅(jiān)持說整體增收了多少稅收令野,只要能調(diào)動(dòng)群眾的情緒就達(dá)到了他們的目的。但我們需要有批判性思維聊浅,辨析其中的原因现使,如果你的工資漲了使你成為高一級(jí)的稅收梯隊(duì),這應(yīng)該也是件高興的事碳锈,但如果物價(jià)上漲你多出的收入可能對(duì)你也沒有什么幫助,或許你并沒有過的更好强重,所以你的持方是什么贸人?