2003年英國政府針對全民的數(shù)學(xué)水平做了一項(xiàng)調(diào)查,結(jié)果讓人大跌眼鏡绿店。工作人群中有47%的人數(shù)學(xué)水平不及初中一年級拙寡。初中一年級是什么水平,也就是掌握有理數(shù)分?jǐn)?shù)和小數(shù)鳞上。白宮因此非常焦慮这吻,制定了很多新的政策,然后在2011年又做了一次調(diào)查篙议,結(jié)果這個數(shù)值上升到了49%唾糯。
當(dāng)我在《金融時報》上提到這個數(shù)字的時候怠硼,一位讀者開玩笑說,那51%的人該感到震驚了移怯。
但我更偏愛另一人的反應(yīng)香璃,那是當(dāng)我在學(xué)校做演講的時候,一個學(xué)生提問說舟误,你怎么知道做統(tǒng)計的人不也屬于那49%呢葡秒?
事實(shí)已經(jīng)很清楚的證明了,數(shù)學(xué)對我們來說是個大問題嵌溢,其實(shí)數(shù)學(xué)是生活中一項(xiàng)很實(shí)用的技能眯牧,而且將來時代的很多變化都要求我們要對數(shù)字敏感些。
同時這不僅是英國人的問題赖草,經(jīng)合組織今年發(fā)表了針對全球年輕人的數(shù)學(xué)水平調(diào)查学少,美國首當(dāng)其沖是40%,除了美國和英國外還有其他七個國家的數(shù)值都超過了20%疚顷。這顯然是個很嚴(yán)重的問題了旱易,但情況卻并不是該如此禁偎。從這張圖表你會發(fā)現(xiàn)腿堤,荷蘭和韓國的數(shù)值都是個位數(shù)。所以今天我們來談?wù)勥@個問題如暖。
諸如此類的研究顯示笆檀,我們?nèi)藶榈陌讶藗兎殖闪藘深悾瑢?shù)字敏感的和不擅長的盒至。我今天想說的是這個分類是不必要的酗洒,事實(shí)并非如此。你不必有非常好的數(shù)學(xué)水平枷遂,但對數(shù)字還是要有一定的敏感度的樱衷,那從何入手呢?
對我來說酒唉,端口就是統(tǒng)計學(xué)矩桂。一提到統(tǒng)計學(xué)很多人都覺得頭疼,因?yàn)榧词购芏鄶?shù)學(xué)家也不喜歡統(tǒng)計學(xué)痪伦,數(shù)學(xué)本該是關(guān)于精確性和確定的科學(xué)侄榴,而統(tǒng)計學(xué)卻恰恰相反。其實(shí)我自己也是很晚才接觸統(tǒng)計學(xué)的网沾,即使我的大學(xué)老師也一直認(rèn)為我最不擅長的兩門學(xué)科癞蚕,一是計算機(jī)編程,二就是統(tǒng)計學(xué)辉哥,而現(xiàn)在的我卻都掌握了這兩門桦山,后面我還會展示我用計算機(jī)編程的統(tǒng)計學(xué)圖表。
那什么改變了我對統(tǒng)計學(xué)的態(tài)度呢?我的興趣從何而來度苔?因?yàn)槲乙庾R到統(tǒng)計學(xué)是關(guān)于人類團(tuán)體性的科學(xué)匆篓,如果你查詞典的話會看到統(tǒng)計學(xué)的定義,是針對群體而非個體的科學(xué)寇窑。作為社會的一員鸦概,我們都很有興趣知道個人是如何影響群體的,而統(tǒng)計學(xué)在這方面的作用會讓你大吃一驚甩骏。
英國的伊普索斯莫里民意調(diào)查機(jī)構(gòu)近些年做了一些很棒的調(diào)查窗市。比如其中一個針對1000名英國成年人的調(diào)查,即他們認(rèn)為每100個英國人中有多少人信仰穆斯林饮笛,調(diào)查的結(jié)果是24咨察,也就是人們認(rèn)為每100個英國人中有24人信仰穆斯林。而官方統(tǒng)計是5福青。所以你可以看到淤毛,我們的認(rèn)知和現(xiàn)實(shí)之間還是有很大差距的。那是什么導(dǎo)致了認(rèn)知偏差呢烟零?
基于對這項(xiàng)研究濃厚的興趣仪际,我自己也開始了調(diào)查。當(dāng)我在哈默史密斯的圣保羅中學(xué)為六年級的女學(xué)生做演講的時候宪迟,我問她們“你們覺得人們認(rèn)為每年有多少個年輕女孩子懷孕呢酣衷?”。當(dāng)我說這個數(shù)字是15%的時候她們表現(xiàn)的很生氣次泽,因?yàn)槭聦?shí)是僅有0.5%穿仪。
數(shù)學(xué)問題不僅僅是英國人的問題,伊普索斯莫里民意調(diào)查機(jī)構(gòu)近些年在全世界范圍內(nèi)做了類似的調(diào)查意荤。比如他們問阿拉伯人啊片,你認(rèn)為每一百個人中有多少人有肥胖問題。人們的回答是1/4多一點(diǎn)玖像,但官方數(shù)據(jù)顯示是差不多3/4.這是很大的偏差了紫谷。
還有個針對日本人的調(diào)查,“你認(rèn)為每100個日本人中有多少人住在鄉(xiāng)下”御铃。統(tǒng)計結(jié)果是差不多50%碴里,他們認(rèn)為每100個日本人中有56個人在鄉(xiāng)下生活,而官方數(shù)據(jù)是7%上真。
這種很嚴(yán)重的認(rèn)知偏差讓人們震驚咬腋,但如果你讀過諾貝爾經(jīng)濟(jì)學(xué)家Daniel Kahneman的著作的話,你就會更加冷靜的接受這個事實(shí)了睡互。Daniel和他的同事Amos Tversky花了很多年研究認(rèn)知和現(xiàn)實(shí)之間的差距根竿,他們發(fā)現(xiàn)人類的估計能力較弱陵像,這有很多的原因。
除了個人經(jīng)歷外寇壳,媒體也有一定的責(zé)任醒颖。媒體在報道時為了吸引眼球經(jīng)常報道那些個例。對此Kahneman有很好的表述壳炎,我們不但會選擇視而不見泞歉,而且對我們的視而不見也選擇視而不見。而這對我們做決定時有很嚴(yán)重的影響匿辩。
我覺得這個事情很有意思腰耙。但我也覺得,可能調(diào)查范圍太大了铲球,可能一個人更熟悉生活的城市而不是整個國家挺庞,你怎么可能對全國的人都了解呢。所以也許把范圍縮小結(jié)果會不一樣呢稼病?所以我重新構(gòu)建了問題选侨,改為針對你自己生活的地方。答案會不會更準(zhǔn)確呢然走?
后來我做了個網(wǎng)絡(luò)app援制,針對你生活的地區(qū)。輸入你所在區(qū)的郵編丰刊,然后會跳出一些根據(jù)官網(wǎng)統(tǒng)計數(shù)據(jù)制定的問題隘谣。我在設(shè)計這個產(chǎn)品的時候非常細(xì)心增拥,盡量保證所有的人都能方便的參與啄巧。我參考了經(jīng)濟(jì)學(xué)家奧圖紐拉特Isotype 圖像符號,即用圖像來取代諸如百分比掌栅,分?jǐn)?shù)和小數(shù)之類的文字秩仆。
如下圖所示,左邊是一個個的圓圈猾封,右邊的地圖顯示了你所處的區(qū)域澄耍。一共有七個問題,每個問題的得分都是在0到100之間晌缘,測試結(jié)束會有一個平均值齐莲。鑒于今天演講的城市是埃克塞特磷箕,我們把區(qū)域設(shè)置為把⌒铮克塞特。
第一個問題是岳枷,你覺得每一百個人中有多少人小于16歲芒填?你選好點(diǎn)提交呜叫,然后會得到官方數(shù)據(jù)是多少,就能看到你的猜測跟現(xiàn)實(shí)之間的差距殿衰。
第二個問題是朱庆,你覺得平均年齡是多少,即一半人的年齡低于這個值闷祥,一半人的年齡高于這個值娱颊,我覺得是35。但我估計錯了凯砍,因?yàn)槲液雎粤税维蒙?巳赜写髮W(xué),所以這個年齡值要年輕許多果覆。
問題會越來越難颅痊。第三個問題是,你覺得你所生活的地區(qū)局待,每一百個家庭中有多少人貸款買房了斑响?
你看,問題會越來越難钳榨。當(dāng)你處于一個城市的時候舰罚,像年齡這種問題你可以通過觀察得到,但像購房比例這個問題就不難容易估計了薛耻,這就要求我們要思考营罢,有時難免也帶有偏見。
還有就是饼齿,當(dāng)我發(fā)布這項(xiàng)測試的時候饲漾,很多官方的數(shù)據(jù)并不是最新的,可能是幾年之前的缕溉,但其實(shí)這也沒關(guān)系考传。我只是想讓人們意識到,自己的認(rèn)知和現(xiàn)實(shí)還是有差距的证鸥,以及人們的反應(yīng)僚楞。
事實(shí)證明人們的反應(yīng)比我預(yù)想的要激烈,盡管我有意的進(jìn)行了一些設(shè)置枉层,比如網(wǎng)址中含有統(tǒng)計學(xué)泉褐,政府和英國這類人們不喜歡在網(wǎng)址在出現(xiàn)的詞語。這個網(wǎng)站是晚上九點(diǎn)四十五上線的鸟蜡,因?yàn)闆]有規(guī)定人們什么時間要完成這個測試膜赃,全憑自愿的,但在開始的兩天內(nèi)矩欠,還是突破了四十萬的訪問量财剖,人們在網(wǎng)上和社交媒體上展開了激烈的討論悠夯。
很多人都發(fā)現(xiàn)了自己的認(rèn)知偏差。而且有些人開始把網(wǎng)址發(fā)給政府部門的領(lǐng)導(dǎo)躺坟,看他們對自己城市的了解程度沦补。
回到剛開始提到的兩種人,即對數(shù)字擅長和不擅長的咪橙。英國知名的統(tǒng)計學(xué)家John Pullinger的得分是44夕膀,其實(shí)很多人原來認(rèn)為他應(yīng)該有很高得分的。Jeremy Paxman也在酒后承認(rèn)美侦,他的得分是36产舞,這個數(shù)字讓人太大跌眼鏡了。
就像我們之前的認(rèn)知一樣菠剩,統(tǒng)計學(xué)是關(guān)于不確定的科學(xué)易猫,但今天我想加一點(diǎn)點(diǎn),統(tǒng)計學(xué)也是關(guān)于我們自身的科學(xué)具壮,所以請我們對它多一點(diǎn)點(diǎn)興趣准颓。
本文來源于ted演講:Alan Smith: why you should love statistics