英國(guó)科幻小說(shuō)作家H·G·威爾斯的預(yù)言:“統(tǒng)計(jì)思維總有一天會(huì)像讀寫一樣,成為一個(gè)有效率公民的必備能力。”
中國(guó)當(dāng)代著名經(jīng)濟(jì)學(xué)家价说、教育家馬寅初曾說(shuō):“學(xué)者不能離開統(tǒng)計(jì)而究學(xué),實(shí)業(yè)家不能離開統(tǒng)計(jì)而執(zhí)業(yè)风秤,政治家不能離開統(tǒng)計(jì)而施政鳖目。”
統(tǒng)計(jì)缤弦,是了解真實(shí)存在的一種辦法领迈。大到一個(gè)國(guó)家,小到一個(gè)企業(yè)甚至個(gè)人碍沐,都會(huì)用到狸捅。誰(shuí)能獲得準(zhǔn)確的統(tǒng)計(jì)信息,就能把握真實(shí)的現(xiàn)在累提,為后續(xù)決策提供依據(jù)尘喝。但是學(xué)號(hào)統(tǒng)計(jì)學(xué)并不容易,各種數(shù)字斋陪、公式朽褪、函數(shù)、曲線對(duì)于大多數(shù)人來(lái)說(shuō)都太難了无虚,學(xué)了一點(diǎn)統(tǒng)計(jì)也不知道能對(duì)自己有什么助益缔赠。
日本人西內(nèi)啟一直想寫出一本通俗簡(jiǎn)單的統(tǒng)計(jì)學(xué)書籍,幫助普通人了解統(tǒng)計(jì)學(xué)友题,掌握統(tǒng)計(jì)學(xué)基礎(chǔ)工具橡淑,培養(yǎng)出統(tǒng)計(jì)思維。西內(nèi)啟畢業(yè)于東京大學(xué)生物統(tǒng)計(jì)學(xué)專業(yè)咆爽,主要從事xxx的工作,在統(tǒng)計(jì)學(xué)的實(shí)踐應(yīng)用上擁有豐富的經(jīng)驗(yàn)置森,他的豐富經(jīng)驗(yàn)濃縮在《看穿一切的數(shù)字統(tǒng)計(jì)學(xué)》和《統(tǒng)計(jì)思維》中斗埂。前者更專業(yè)更有深度,后者更通俗更有實(shí)操性凫海。
統(tǒng)計(jì)思維呛凶,是在獲取數(shù)據(jù)、從數(shù)據(jù)中提取信息行贪、論證結(jié)論可靠性等過(guò)程中表現(xiàn)出來(lái)的一種思維模式漾稀,對(duì)于人類提高認(rèn)知有巨大的作用模闲。全書為了讓讀者理解統(tǒng)計(jì)思維,主要分為兩個(gè)大部分崭捍,一是書的主體尸折,各種統(tǒng)計(jì)方法、概念與實(shí)用案例間的關(guān)系殷蛇,二是“數(shù)學(xué)附錄”對(duì)各種統(tǒng)計(jì)概念实夹、公式的數(shù)學(xué)講解。
全書主要講了幾個(gè)數(shù)學(xué)概念:平均粒梦、標(biāo)準(zhǔn)差亮航、假設(shè)檢驗(yàn)、回歸分析等匀们。前面還好缴淋,后面的難度已經(jīng)超過(guò)了中國(guó)高中數(shù)學(xué)的知識(shí)范圍,對(duì)于一些大學(xué)不學(xué)高數(shù)的人來(lái)說(shuō)泄朴,讀起來(lái)還是挺有難度的重抖。
在大巖俊之在《實(shí)用性閱讀指南》里說(shuō),一本書里對(duì)我們真正有價(jià)值的內(nèi)容大約只有20%叼旋。如果你的數(shù)學(xué)基礎(chǔ)并不好仇哆,那么書里的思維方式可能相對(duì)更有用的。
均值和中位數(shù)夫植。在統(tǒng)計(jì)學(xué)上讹剔,均值和中位數(shù)都是描述幾種趨勢(shì)的概念。但是均值依賴于分布详民,往往在正態(tài)分布的數(shù)據(jù)時(shí)候有效性最大延欠。而中位數(shù)更多的是非參數(shù)的概念,中位數(shù)是將數(shù)據(jù)從小到大排列之后沈跨,能夠?qū)?shù)據(jù)分為兩半的數(shù)由捎。如果一個(gè)分布不是近似于正太分布,那么中位數(shù)要比均值有效果一些饿凛。所以在正確場(chǎng)景下正確的運(yùn)用這些概念去解釋生活中的事物就比較重要狞玛。當(dāng)數(shù)據(jù)服從一個(gè)正態(tài)分布的時(shí)候,均值等于中位數(shù)涧窒。
經(jīng)濟(jì)中有“二八法則”心肪,世界上百分之80%的財(cái)富掌握在20%的人手中,如果僅僅計(jì)算個(gè)人收入的平均值纠吴,很多人的收入都被“平均高”了硬鞍。如果這時(shí)候計(jì)算中位數(shù),我們個(gè)人收入與中位數(shù)比較,大致就可以知道自己的收入在全國(guó)是個(gè)什么水平固该。這個(gè)技巧也可以用來(lái)計(jì)算锅减,求職時(shí)在在哪一個(gè)公司可以預(yù)期獲得更高的收入。如果A公司平均工資很高有8000伐坏,但是中位數(shù)只有3000怔匣,而B公司人均工資有6000,但中位數(shù)有4000著淆,你該怎樣抉擇呢劫狠?
統(tǒng)計(jì)推斷有局限。在做決定的時(shí)候永部,大多數(shù)人都是根據(jù)自身的相關(guān)經(jīng)驗(yàn)也就是樣本來(lái)進(jìn)行推斷独泞。人們常說(shuō),每個(gè)人都有自身的局限性苔埋,換一句話說(shuō)懦砂,人不可能了解事物的總體。那么在用樣本進(jìn)行推斷的時(shí)候组橄,一定要選擇合適的樣本荞膘,不能以偏概全。
1936年美國(guó)大選玉工,《文學(xué)文摘》雜志推測(cè)阿爾弗雷德?蘭登將會(huì)獲得531張選舉人票中的370張羽资。從這個(gè)結(jié)果來(lái)看,擊敗羅斯福完全無(wú)壓力遵班。在這個(gè)調(diào)查中屠升,《文學(xué)文摘》一共發(fā)放了1000萬(wàn)份問(wèn)卷,回收了230萬(wàn)份狭郑「古《文學(xué)文摘》的做法沒(méi)錯(cuò),大的樣本量肯定會(huì)提高估計(jì)的精度翰萨,沒(méi)毛病脏答。但是結(jié)果錯(cuò)了,羅斯福當(dāng)選亩鬼。為什么殖告?因?yàn)樵凇段膶W(xué)文摘》雜志的讀者中,共和黨人所占比例遠(yuǎn)比美國(guó)總?cè)丝谥械墓埠忘h支持者比例要高雳锋。換句話說(shuō)黄绩,這個(gè)樣本完全無(wú)法擴(kuò)大到全美國(guó)。那么相應(yīng)的結(jié)論肯定也是站不住腳的了魄缚。
統(tǒng)計(jì)中允許誤差下保證一定概率。在統(tǒng)計(jì)學(xué)里面,處處存在隨機(jī)性問(wèn)題冶匹。它允許有誤差习劫,沒(méi)有誤差反令人懷疑其中有假。統(tǒng)計(jì)也會(huì)對(duì)一個(gè)問(wèn)題拍胸脯保證嚼隘,但它的保證都是基于概率形式的诽里。而且所能保證的概率,不但不是百分之百飞蛹,而且還附有誤差谤狡。在統(tǒng)計(jì)學(xué)中的p值為5%,這本身就沒(méi)有太多數(shù)學(xué)根據(jù)卧檐,而是沿用數(shù)學(xué)家費(fèi)希爾的習(xí)慣墓懂,認(rèn)為用5%判斷p值很方便。當(dāng)標(biāo)準(zhǔn)差se小于p值時(shí)霉囚,就這人某種推論或結(jié)果是可信的捕仔。
統(tǒng)計(jì)學(xué)有固定的規(guī)律,但是在實(shí)際應(yīng)用中盈罐,并不一定完全遵守這種規(guī)律榜跌。有時(shí)候守條件閑置,也并不完全遵循雙側(cè)5%的檢驗(yàn)標(biāo)準(zhǔn)盅粪。比如在醫(yī)學(xué)領(lǐng)域钓葫,有一些成功率不高的手術(shù),只要一生和患者達(dá)成一致票顾,患者仍可能會(huì)選擇嘗試础浮。在商務(wù)推廣中,也有可能做一些p值較大的高風(fēng)險(xiǎn)決定库物,決策者可能會(huì)選擇搏一搏霸旗。在這時(shí)就要做好“承擔(dān)風(fēng)險(xiǎn)的準(zhǔn)備”。
陳希孺先生在其《數(shù)理統(tǒng)計(jì)學(xué)簡(jiǎn)史》的序中說(shuō)道:統(tǒng)計(jì)學(xué)不止是一種方法或技術(shù)戚揭,還含有世界觀的成分——它是看待世界上萬(wàn)事萬(wàn)物的一種方法诱告。我們常講某事從統(tǒng)計(jì)觀點(diǎn)看如何如何,指的就是這個(gè)意思民晒。但統(tǒng)計(jì)思想也有一個(gè)發(fā)展過(guò)程精居。因此統(tǒng)計(jì)思想(或觀點(diǎn))的養(yǎng)成,不單需要學(xué)習(xí)一些具體的知識(shí)潜必,還有能夠從發(fā)展的眼光靴姿,把這些知識(shí)連綴成一個(gè)有機(jī)的、清晰的途徑磁滚,獲得一種歷史的厚重感佛吓。