——讀《統(tǒng)計陷阱》有感
一拿到這本書蹬挤,給我的感覺就一個字——薄缚窿,確實如此一共才70頁,分為10章焰扳,為總分式結(jié)構(gòu)倦零,前九章具體分析,最后一章總結(jié)吨悍。大體來說扫茅,書中舉了很多事例也有很多形象的插畫,所以我讀起來覺得沒有什么難以理解的地方育瓜。下面具體說說我對《統(tǒng)計陷阱》的理解诞帐。
整本書所說的陷阱其實就是圍繞“樣本”來講的,分為兩個方面爆雹,“樣本的來源”(也稱抽樣)與“樣本的表現(xiàn)”。
樣本的來源
先說樣本的來源愕鼓。確實钙态,大部分統(tǒng)計的核心就是抽樣。一個以抽樣為基礎的報告如果要有價值菇晃,就必須使用具有代表性的樣本册倒,這種樣本排除了各種誤差。忽視抽樣所隱含的誤差將導致一些愚蠢的舉動磺送。人們有時會為了一個數(shù)學上可論證卻小得沒有意義的差別費盡力氣驻子。這種行為是對這句古訓的藐視:“只有當差別有意義時才能稱之為差別灿意。”這句古訓也應該辯證的去看待崇呵。
以下的話我覺得可以作為整本書識別“陷阱”的核心——“樣本有偏的趨勢可以自動地操縱結(jié)果,使其變得扭曲缤剧。無形的誤差與有形的誤差一樣容易破壞樣本的可信度。也就是說域慷,即使你找不到任何破壞性的誤差來源荒辕,但只要有產(chǎn)生誤差的可能性,你就有必要對結(jié)果保留一定的懷疑犹褒〉种希”這以后用到辯論中必定也是很有價值的,肯定有很多同學發(fā)現(xiàn)了叠骑。樣本的來源必須提供足夠多的信息才有說服力李皇,比如說“顯著性程度”什么的,對比的對象宙枷,樣本的數(shù)量與區(qū)別掉房,等等。
樣本的表現(xiàn)
再說樣本的表現(xiàn)朦拖,就是各種視覺上有誤導的圖像表現(xiàn)圃阳,不能說是錯誤的,只能說是不恰當?shù)谋憩F(xiàn)形式璧帝。并不是所有的統(tǒng)計都是絕對的捍岳,將“正常的”與“期望的”混為一談導致事情變得更糟。這也是一點需要注意的睬隶。
“如果你想證明某事,卻發(fā)現(xiàn)沒有能力辦到锣夹,那么試著解釋其他事情并假裝它們是一回事。在統(tǒng)計資料與人類思維沖撞所引起的耀眼光芒中苏潜,幾乎沒有人會發(fā)現(xiàn)它們的區(qū)別银萍。不相匹配的數(shù)據(jù)是保證你處在有利位置上的武器,而且通常如此恤左√剑”這也是表現(xiàn)誤區(qū)的一種。
相關關系與因果關系
最后飞袋,也是最重要的戳气,談談我對這本書影響最深刻的部分,也是我認為最有價值的地方——“相關關系與因果關系”巧鸭。先復制書上幾句話來湊湊字數(shù)——“但這是一個古老的謬誤瓶您,然而它仍頻繁地出現(xiàn)在統(tǒng)計資料中,并被大量讓人印象深刻的數(shù)據(jù)所偽裝。這個謬誤是:如果 B 緊跟著 A 出現(xiàn)呀袱,那么 A 一定導致 B贸毕。然而,更大的可能性是兩個周素并不互為因果,而同為第三個因素的產(chǎn)物夜赵∶鞴鳎”之所以說它好,是因為它使我聯(lián)想到了休謨的懷疑論——一個打破了因果關系的思想油吭,曾一度導致建立于因果律之上的科學世界瀕臨破產(chǎn)击蹲。畢竟他揭穿了科學知識的因果關系不過是我們習慣性的聯(lián)想,等于說是抽掉了構(gòu)成知識最重要的因果律婉宰,科學知識不再具有先天普遍性的必然性歌豺。
太陽出來了,地上的石頭發(fā)熱了心包。很多人理所應當(注意类咧,是理所應當)地認為,石頭發(fā)熱是陽光照射所導致的蟹腾。因為太陽出來了痕惋,所以石頭發(fā)熱。很明顯的因果關系娃殖。雖然我們能觀察到一件事物隨著另一件事物而來值戳,我們并不能觀察到任何兩件事物之間的關聯(lián)。
所以休謨說:“我們無從得知因果之間的關系炉爆,只能得知某些事物總是會連結(jié)在一起堕虹,而這些事物在過去的經(jīng)驗里又是從不曾分開過的。我們并不能看透連結(jié)這些事物背后的理性為何芬首,我們只能觀察到這些事物的本身赴捞,并且發(fā)現(xiàn)這些事物總是透過一種經(jīng)常的連結(jié)而被我們在想像中歸類∮羯裕”也因此我們不能說一件事物造就了另一件事物赦政,我們所知道的只是一件事物跟另一件事物可能有所關連。
這里耀怜,我再舉一個例子來解釋一下這段話(例子來自于知乎)恢着,碳酸鈉+鹽酸 = 氯化鈉+二氧化碳
這一因果關系,最初必然來自于經(jīng)驗财破。假設一個人完全沒有關于實驗結(jié)果的經(jīng)驗然评,并且沒有任何相關的化學知識,他必然沒有辦法從 碳酸鈉+鹽酸
這一原因依據(jù)任何先驗法則推論出 氯化鈉+二氧化碳
這一結(jié)果狈究。原因中并不天然地包含著結(jié)果,在沒有經(jīng)驗的情況下,從一個事物中產(chǎn)生任何事物都是可想象的抖锥,并沒有辦法說一定會產(chǎn)生出某一特定事物(無法從作為原因的事物中運用理性推論出作為結(jié)果的事物)亿眠。我們只有依賴經(jīng)驗才能發(fā)見這種事物間的聯(lián)系。
因此磅废,因果關系的基礎是經(jīng)驗纳像。
我們總是經(jīng)驗到 碳酸鈉+鹽酸 = 氯化鈉+二氧化碳
這一事實(它們總是相伴出現(xiàn)),碳酸鈉+鹽酸
在前拯勉,而氯化鈉+二氧化碳
在后竟趾,于是我們就把 碳酸鈉+鹽酸
看作產(chǎn)生 氯化鈉+二氧化碳
的原因。更一般的情況是宫峦,甲和乙總是先后出現(xiàn)岔帽,甲的后面總是伴隨著乙,我們便把甲當作乙的原因导绷。除此之外犀勒,我們無法知道甲和乙具有的更深層次的聯(lián)系(如果我們真的知道些什么,那么在經(jīng)驗之先我們就能判斷將會發(fā)生什么)妥曲。到目前為止則可以說明贾费,我們只是用因果關系來描述相伴出現(xiàn)的經(jīng)驗事實。
因果關系基于經(jīng)驗檐盟,但只是一時一地的經(jīng)驗(只對發(fā)生過的事實有權(quán)發(fā)言)褂萧,而要想對未來做出預測,就要基于歸納原理葵萎。即导犹,過去甲和乙總是先后出現(xiàn),甲的后面總是伴隨著乙陌宿,所以我們判斷未來甲的后面一定有乙(過去總是碳酸鈉+鹽酸 = 氯化鈉+二氧化碳
锡足,未來也一定是這樣)。
但可惜的是壳坪,歸納原理我們無法證成它舶得,即無法說明未來必定與過去相似(可能性之一是,也許有一天爽蝴,自然的法則會改變沐批,沒有任何理由可以說明宇宙以后一定也是這個樣子)。我們沒有絕對的理由證明歸納原理一定是正確的蝎亚。
因為歸納原理可能是錯誤的九孩,導致因果關系無法向未來、類似的事物推廣发框,碳酸鈉+鹽酸 = 氯化鈉+二氧化碳
并不一定總是正確的躺彬。過去是1000億次是這樣,但未來1000億+1次未必還是這樣(試想,應該如何論證宪拥,未來1000億+1次結(jié)果仍相同)仿野。另外,我們沒有掌握任何實質(zhì)性的規(guī)律她君,我們只是對事實進行了描述脚作,把一方設定成原因,一方設定成結(jié)果缔刹。我們不能說它是錯的球涛,但是它一定不是肯定正確的。
人類有依賴因果關系的本能校镐,這種本能則是來自我們神經(jīng)系統(tǒng)中所養(yǎng)成的習慣亿扁,長期下來我們便無法移除這種習慣,但我們并沒有任何論點灭翔、也不能以演繹或歸納來證明這種習慣是正確的魏烫,就好像我們對于世界以外的地方一無所知一樣。就像羅素在《西方哲學史》序言所說——“人為萬物立法”肝箱,中國古代大儒所言——“為天地立心”哄褒,恐怕也是如此吧!
一句句“因為”“所以”說的理所當然煌张,究其根本是沒有關心其聯(lián)結(jié)呐赡,如果硬是要說感官經(jīng)驗使然,習慣期待為之骏融,這套懷疑論是無法辯倒的链嘀。因此,懷疑者頂好是守住自己的范圍档玻,并且發(fā)揮出由較深奧的研究而發(fā)生的那些哲學的反駁怀泊。在這里,他似乎有充分取勝的地方误趴,他可以合理地主張說霹琼,在存在于記憶證據(jù)或感官證據(jù)以外的任何事實方面,我們的全部證明都是由因果關系來的凉当;他可以合理地主張說枣申,我們對于這種關系并沒有別的觀念,我們只是對恒常在一塊會合著的兩個物象有一種觀念看杭;他可以合理地主張說忠藤,我們并沒有什么充分的論證可以使我們相信,我們經(jīng)驗到常在一塊會合著的那些物象模孩,在別的例證下尖阔,也照樣會合在一塊;他還可以合理地主張說榨咐,除了習慣或我們天性中一種本能以外诺祸,并沒有別的情節(jié)可以使我們得到這種推測,這種本能自然是難以反抗的祭芦,不過它也和別的一些本能一樣,也可以是錯誤的憔鬼、騙人的龟劲。一個懷疑家如果堅持這些論點,那他就充分表現(xiàn)出他的力量來轴或,或者可以說昌跌,表現(xiàn)出他自己以及我們?nèi)祟惖娜觞c來,而且他就似乎(至少在當下)消滅了一切信念和確信照雁。
最后康德用先天范疇很巧妙的繞過了這個問題蚕愤,這里就不再說了。但是很多思考方式還是值得我們深思的??