關(guān)于作者
達(dá)萊爾·哈夫是美國(guó)著名的統(tǒng)計(jì)學(xué)專(zhuān)家寝并,并同時(shí)精通心理學(xué),本書(shū)出版于上世紀(jì)50年代寂曹,歷經(jīng)60年暢銷(xiāo)不衰哎迄,可見(jiàn)書(shū)中內(nèi)容對(duì)現(xiàn)實(shí)社會(huì)的指導(dǎo)性有多強(qiáng)。
關(guān)于疑問(wèn)
中國(guó)在互聯(lián)網(wǎng)高速發(fā)展的引導(dǎo)下隆圆,快速進(jìn)入了新的信息時(shí)代芬失,在未來(lái),爆炸式的知識(shí)和信息每天以龐大的數(shù)量充斥著各大網(wǎng)頁(yè)匾灶。文化的普及和前互聯(lián)網(wǎng)的洗禮讓我們不在那么相信任何信息棱烂,而擁有數(shù)據(jù)背景的統(tǒng)計(jì)結(jié)果更容易得到受眾的信賴(lài)。
所謂大數(shù)據(jù)時(shí)代阶女,也是在對(duì)海量的信息做處理之后得出相應(yīng)的結(jié)論颊糜。
作者提出的結(jié)論,統(tǒng)計(jì)數(shù)據(jù)也會(huì)撒謊秃踩,無(wú)疑是在以為掌握了辨別真?zhèn)问侄蔚奈覀儺?dāng)頭一棒衬鱼。然而跟著作者走進(jìn)書(shū)中的各種小案例,你就會(huì)發(fā)現(xiàn)事實(shí)確實(shí)如此憔杨。
關(guān)于本書(shū)
一個(gè)統(tǒng)計(jì)數(shù)據(jù)的產(chǎn)生鸟赫,經(jīng)過(guò)樣本測(cè)試,數(shù)據(jù)整理,和結(jié)果分析三個(gè)階段抛蚤。在每一個(gè)階段中都存在盲點(diǎn)台谢,容易被個(gè)人有目的的人拿來(lái)做文章。
01
樣本的偏差
統(tǒng)計(jì)學(xué)的基礎(chǔ)是建立在樣本上岁经。那取樣的多少和范圍會(huì)直接影響數(shù)據(jù)的結(jié)果朋沮。
先舉個(gè)例子,我們經(jīng)常在廣告里聽(tīng)到缀壤,因?yàn)槭褂媚称放蒲栏喾兀例X美白度增加20-30%,可實(shí)際上塘慕,廣告所給出的數(shù)據(jù)并沒(méi)有告訴我們調(diào)查的細(xì)節(jié)筋夏,經(jīng)過(guò)跟蹤發(fā)展,所謂的數(shù)據(jù)樣本只是針對(duì)12個(gè)人做的調(diào)查图呢,這就有天壤之別了叁丧。即便是我好好用水刷一次牙,美白度也能上升幾個(gè)百分點(diǎn)的岳瞭。
再舉個(gè)例子,美國(guó)有一屆大選蚊锹,候選人分別是羅斯福和蘭登瞳筏,當(dāng)時(shí)的雜志做過(guò)一次民意調(diào)查,調(diào)查結(jié)果顯示牡昆,支持蘭登的民眾達(dá)到90%姚炕。可是等到選舉結(jié)果出來(lái)后丢烘,羅斯福反而贏得多數(shù)的選票柱宦。原來(lái)該雜志調(diào)查民意時(shí),問(wèn)卷是以電話登記為名單發(fā)放的播瞳,而當(dāng)時(shí)擁有電話的大多數(shù)都是共和黨人掸刊,必然支持蘭登。樣本選取的不合適赢乓,結(jié)果將出現(xiàn)嚴(yán)重的偏頗忧侧,該雜志也因?yàn)榇舜问д`得調(diào)查付出倒閉的代價(jià)。
還有的時(shí)候樣本雖然夠多牌芋,范圍也夠廣蚓炬,但數(shù)據(jù)結(jié)果卻并不真實(shí),因?yàn)樵诨卮鹫{(diào)查問(wèn)卷時(shí)躺屁,出于面子等問(wèn)題肯夏,受眾并沒(méi)有給出真實(shí)答案。
02
數(shù)據(jù)的處理
樣本問(wèn)題過(guò)關(guān)了,那是不是結(jié)果就可信了呢驯击?
答案并非如此烁兰。同樣的數(shù)據(jù),處理方式不一樣余耽,得到的效果也就不一樣缚柏。
比如一個(gè)常見(jiàn)現(xiàn)象,購(gòu)買(mǎi)基金時(shí)我們看到的收益都是年化收益碟贾,因?yàn)槟昀时热绽识喑?65,得到的結(jié)果肯定更振奮人心币喧,也更容易提高購(gòu)買(mǎi)吸引力。而打算貸款時(shí)袱耽,再看貸款利率杀餐,則統(tǒng)統(tǒng)都用日利率來(lái)表示,因?yàn)檫@樣的數(shù)字看起來(lái)才更容易讓大家相信朱巨,利率很低史翘。你看,同樣一個(gè)數(shù)據(jù)冀续,換算一個(gè)概念琼讽,就立馬起到不同的作用。
還有一個(gè)常見(jiàn)的手段洪唐,就是賣(mài)弄平均數(shù)概念钻蹬。比如最近常見(jiàn)的平均收入,平均住房面積凭需,平均壽命问欠。經(jīng)常在朋友圈里看到,一邊轉(zhuǎn)發(fā)一個(gè)統(tǒng)計(jì)結(jié)果粒蜈,一邊自嘲自己拖了人民后腿的信息顺献。事實(shí)上,我們已經(jīng)開(kāi)始質(zhì)疑統(tǒng)計(jì)數(shù)據(jù)的真實(shí)性枯怖,怎么從自己身邊的人觀察來(lái)看注整,跟統(tǒng)計(jì)結(jié)果相去甚遠(yuǎn)呢?
平均數(shù)有三個(gè)不同的計(jì)算方法:算數(shù)平均數(shù)度硝,中數(shù)设捐,和眾數(shù)。
舉個(gè)例子說(shuō)明一下塘淑。年收入王總100萬(wàn)萝招,李經(jīng)理50萬(wàn),張工10萬(wàn)存捺,小趙7萬(wàn)槐沼,小明5萬(wàn)曙蒸,小紅5萬(wàn),小青5萬(wàn)岗钩。那我們來(lái)看纽窟,三個(gè)平均數(shù)得出的結(jié)果是什么。算數(shù)平均數(shù)(總工資數(shù)/人數(shù))=26萬(wàn)兼吓,中數(shù)(位于數(shù)字順序排列的中間)=7萬(wàn)臂港,眾數(shù)(出現(xiàn)次數(shù)最多的數(shù)據(jù))=5萬(wàn)。來(lái)视搏,自行感受一下這里的差距审孽。
客觀上來(lái)講,數(shù)據(jù)結(jié)果其實(shí)是真實(shí)的浑娜,但在操作數(shù)據(jù)的人手里佑力,通過(guò)技術(shù)手段或者理論概念,將數(shù)據(jù)結(jié)果有意識(shí)的導(dǎo)向到對(duì)自己有理的一面筋遭。不經(jīng)過(guò)認(rèn)真的分析和片段就很容易被他們牽著鼻子走打颤。
03
結(jié)果的分析
樣本沒(méi)問(wèn)題,處理過(guò)程沒(méi)問(wèn)題漓滔,那是不是結(jié)論也就沒(méi)問(wèn)題呢编饺?
答案依然并非如此。
曾經(jīng)有一本雜志調(diào)查過(guò)不同品牌香煙中响驴,含有的有害成分劑量調(diào)查透且。該雜志用這些統(tǒng)計(jì)結(jié)果,分析得出的結(jié)論是香煙中含有的有害成分劑量在不同的品牌中踏施,差異并不明顯。也就是說(shuō)罕邀,其實(shí)每個(gè)牌子都差不多畅形。但這份數(shù)據(jù)后來(lái)被某香煙品牌利用,借由自己在成分排名靠后的優(yōu)勢(shì)大力宣傳诉探,聲稱(chēng)自己的香煙品牌含有有害物質(zhì)最少日熬。
數(shù)據(jù)相同,分析后得出的結(jié)論卻不同肾胯。在這個(gè)案例中竖席,調(diào)查結(jié)果顯示有差異,但差異并不大敬肚。經(jīng)過(guò)雜志分析毕荐,重點(diǎn)落在“差異不大”,而經(jīng)過(guò)香煙公司分析艳馒,重點(diǎn)落在“有差異”憎亚≡笨埽可見(jiàn),分析數(shù)據(jù)不僅存在傾向性第美,且會(huì)導(dǎo)致結(jié)果分走兩端蝶锋。另外,結(jié)果分析中常用的手段還有混淆相關(guān)關(guān)系和因果關(guān)系什往。
04
如何識(shí)破統(tǒng)計(jì)騙局
綜上所述扳缕,在統(tǒng)計(jì)數(shù)據(jù)滿天飛的今天,想要不被騙别威,就要多問(wèn)自己一些問(wèn)題躯舔。
針對(duì)樣本:
樣本總量是多少?
涵蓋的范圍有哪些兔港?
數(shù)據(jù)是否真實(shí)庸毫?
針對(duì)數(shù)據(jù)處理:
平均數(shù)是哪種?
圖表衫樊,數(shù)據(jù)中比例關(guān)系飒赃?
是否忽略一些重要問(wèn)題?
針對(duì)結(jié)果分析:
統(tǒng)觀數(shù)據(jù)全局科侈,結(jié)論是否片面载佳?
數(shù)據(jù)與結(jié)論是否毫無(wú)關(guān)系?
關(guān)于感受
不看不知道臀栈,一看嚇一跳蔫慧,之前一直盲目的相信各種帶有統(tǒng)計(jì)數(shù)據(jù)背景的分析結(jié)論,現(xiàn)在才知道权薯,同樣的數(shù)據(jù)在不同人手里姑躲,可以玩出各種花樣∶蓑迹總得來(lái)說(shuō)黍析,統(tǒng)計(jì)數(shù)據(jù)只是一種工具,工具是由人來(lái)使用的屎开,但凡涉及到人阐枣,事實(shí)就會(huì)不以理性為前提,而容易參雜各種利益導(dǎo)向奄抽。
凡事多問(wèn)幾個(gè)為什么蔼两?多探究,多學(xué)習(xí)逞度,才能更容易辨別真?zhèn)巍?/p>