統(tǒng)計學(xué)是什么?如果不是專業(yè)人士暮现,是不是可以一輩子避而不見?
最近因為要寫論文楚昭,開始啃各種大數(shù)據(jù)的書與論文栖袋,各路大牛競相爭論大數(shù)據(jù)究竟是統(tǒng)計學(xué)的發(fā)展,還是站在了其對立面抚太,開啟了全新的數(shù)據(jù)處理方式塘幅?而身為一個沒有學(xué)過高數(shù)的文科生,對于統(tǒng)計學(xué)的知識同樣匱乏尿贫,還停留在劃正字統(tǒng)計的初級階段电媳,面對數(shù)字公式與符號更是迅速陣亡。作為一個文科生庆亡,在與統(tǒng)計學(xué)狹路相逢時匾乓,最初是抗拒的,十分期待遇到一本界面友好的入門書又谋。
在戴維·薩爾斯伯格的《女士品茶》的開篇拼缝,作者便表達(dá)了對妻子的感謝:“她一直督促我將這些故事整理成一部不涉及數(shù)學(xué)符號的書籍”。這本由一位同樣不擅數(shù)字的婦女監(jiān)督而寫成的統(tǒng)計學(xué)科普書彰亥,給文科生靠近統(tǒng)計學(xué)帶來了一線生機珍促。
統(tǒng)計學(xué)中最為核心的概念無疑是“概率”。在現(xiàn)實生活中剩愧,概率意味著什么?薩爾斯伯格同樣在書中提出了這樣的問題并試圖解答娇斩。
在我們并不知道“概率”為何方神圣時其實早已在不自知時使用了它仁卷,可更為通俗地表達(dá)為可能性,比如我們覺得下雨的可能性超過一半(概率大于50%)犬第,便會備上雨傘锦积,如果更為謹(jǐn)慎,大約會先聽一下天氣預(yù)報歉嗓,如果聽到降水概率為75%丰介,自然而然會想到帶傘出行。這很日常,也很統(tǒng)計學(xué)哮幢。在《女士品茶》中带膀,薩爾斯伯格同樣援引了薩維奇在《統(tǒng)計學(xué)基礎(chǔ)》中的觀點:“人們天生就知道用概率來管理自己的生活。在從事一項冒險之前橙垢,人們憑借直覺判斷各種結(jié)果出現(xiàn)的概率垛叨。如果一個人認(rèn)為遇到危險的概率非常大,那么他就不會采取這種行動柜某∷栽”
然而,盡管早已不知不覺使用了概率喂击,但我們未必真的理解概率剂癌。薩爾斯伯格對于“個人概率”概念的一致性假設(shè)進(jìn)行開炮,引經(jīng)據(jù)典翰绊,形象犀利佩谷。所謂一致性假設(shè),需要保證人們對各種事件的概率做出一樣的判斷辞做,即“保持內(nèi)在一致性”琳要,在數(shù)據(jù)足夠多時,有理性的人將最終達(dá)成一致秤茅。
舉例而言稚补,不同的人對于同一個地方的降雨概率應(yīng)該有一樣的判斷,面對相同的數(shù)據(jù)框喳,不會導(dǎo)致兩個人分別估計此地下雨的概率為70%與90%课幕。從凱恩斯開始,便對這一假設(shè)進(jìn)行了反駁五垮,個人概率受到文化環(huán)境的影響乍惊,而非由內(nèi)心直覺直接決定,同樣放仗,更多時候润绎,作為普通人,我們無暇分辨68%與70%之間區(qū)別所帶來的巨大差異诞挨,在我們的想法與實際運用中莉撇,概率的排序比精確的數(shù)據(jù)更為實用,“在制定決策時惶傻,我們很少需要知道某一事件的精確概率數(shù)值棍郎,能夠為事件的概率排序通常就已經(jīng)足夠了”。在絕大多數(shù)場合银室,我們無法獲知足夠的數(shù)據(jù)涂佃,所謂概率的判斷不過反映了人類量化不確定性的模式励翼,其中反映出了粗略的特點。最終辜荠,統(tǒng)計學(xué)家略帶沮喪地發(fā)現(xiàn):“沒有一個人的表現(xiàn)符合薩維奇的一致性標(biāo)準(zhǔn)”汽抚,“只能對50%的概率和‘幾乎一定’的含義保持一致的感覺∏壤梗”概率似乎因此被拉下了神壇殊橙。
那么,概率究竟有沒有用狱从?
即使粗略膨蛮,概率中所反映的數(shù)據(jù)的分布即使在統(tǒng)計學(xué)與社會發(fā)展到今天,依然被我們所研究所看重季研。隨著大數(shù)據(jù)時代的到來敞葛,傳統(tǒng)統(tǒng)計學(xué)中的抽樣概率也許會漸漸失去其壟斷地位,但統(tǒng)計學(xué)仍然是我們遭逢數(shù)據(jù)的法寶与涡。無論在哪個領(lǐng)域惹谐,大數(shù)據(jù)均以將我們裹脅,作為決策的基礎(chǔ)驼卖,概率乃生存之道氨肌。
也許,就如書封所言:“了解統(tǒng)計學(xué)的人酌畜,運氣都不會太差怎囚。”