緣起:李笑來老師在寫作課上提到,統(tǒng)計學(xué)這門大學(xué)的必修課亿虽,應(yīng)該學(xué)會并在日常生活中能夠運用菱涤。據(jù)說能夠在生活中運用統(tǒng)計學(xué)的人百不存一。為了避免自己也繼續(xù)在生活中做那么一個傻瓜洛勉,因此我打算學(xué)習(xí)下統(tǒng)計學(xué)狸窘,找下書籍,找下材料坯认,想方設(shè)法找到統(tǒng)計學(xué)如何在生活中使用的例子,通過這些例子氓涣,或者方法牛哺,指導(dǎo)自己走上運用統(tǒng)計學(xué)的道路。
既然要學(xué)習(xí)統(tǒng)計學(xué)劳吠,那么第一步引润,肯定要先學(xué)習(xí)正態(tài)分布,因為正態(tài)分布應(yīng)該是在統(tǒng)計學(xué)里面最重要的概念了痒玩。
那么什么是正態(tài)分布呢淳附?也許這里直接告訴大家一個定義,一個公式蠢古,直接會讓人望而卻步了吧奴曙,因此我打算用一個小故事來告訴大家什么是正態(tài)分布。
由于戰(zhàn)爭草讶,德國有一個時期物資特別緊缺洽糟,對面包實行配給制:政府把面粉發(fā)給指定的面包房,面包師傅烤好了面包再發(fā)給居民堕战。有一個統(tǒng)計學(xué)家坤溃,懷疑他所在區(qū)域的面包師傅私扣面粉,于是就天天稱自己的面包嘱丢。幾個月以后薪介,他去找面包師傅,說:“政府規(guī)定配給的面包是400克越驻,因為模具和其他因素汁政,你做的面包可能是398道偷、399克,也可能是401烂完、402克试疙,但是按照統(tǒng)計學(xué)的正態(tài)分布原理,這么多天的面包重量平均應(yīng)該等于400克抠蚣,可是你給我的面包平均重量是398克祝旷。我有理由懷疑是你使用較小的模具,私吞了面粉嘶窄』初耍”面包師傅承認確實私吞了面粉,并再三道歉保證馬上更換正常的模具柄冲。又過了幾個月吻谋,統(tǒng)計學(xué)家又去找這個面包師傅,說:“雖然這幾個月你給我的面包都在400克以上现横,但是這可能是因為你沒有私吞面粉漓拾,也可能是因為你從面包里特意挑大的給我。同樣根據(jù)正態(tài)分布原理戒祠,這么多天不可能沒有低于400克的面包骇两,所以我認為你只是特意給了我比較大的面包,而不是更換了正常的模具姜盈。我會立刻要求政府檢查你的模具低千。”面包師傅只好當眾認錯道歉馏颂,接受處罰示血。
通過這個故事,我像大家應(yīng)該初步懂了正態(tài)分布是什么了吧救拉?接下來就到了枯燥的內(nèi)容了难审,不過也不用怕,我會嘗試著說得簡單一些的亿絮。
正態(tài)分布剔宪,也可以解釋成“常態(tài)分布”,簡單的解釋壹无,就是大量獨立同分布的隨機事件葱绒,整體上服從正態(tài)分布。
而正態(tài)分布斗锭,就是如下圖中間大地淀,兩邊小的分布情況。
舉個例子吧岖是,比如中國人2016年的平均身高是167cm帮毁,這個167就相當于正態(tài)分布中的μ实苞,也就是上圖中的的均數(shù),那么在現(xiàn)實中烈疚,意味著167cm的人是最多的黔牵,然后越往兩邊,這種身高的人就開始變小爷肝。就好比200cm以上的人猾浦,在中國人里面是占了很少的比例的,這個就是正態(tài)分布灯抛。
一個班或者一個年級的學(xué)生金赦,考試成績有高有低,高的考到了90多甚至100对嚼,低的只考了20夹抗、30分。這看起來差異太大纵竖,參差不齊漠烧。但實際上,這個班的成績一定是符合正態(tài)分布的靡砌!高分段和低分段占少數(shù)已脓,而大部分學(xué)生的成績都集中在中間分數(shù)段,也就是大部分學(xué)生的成績都集中在平均分(比如75)左右乏奥,并且高于平均分的分布和低于平均分的分布應(yīng)當是基本一致的(對稱)。大量獨立的學(xué)生亥曹,他們整體的成績服從正態(tài)分布邓了。
那么說了正態(tài)分布的定義,接下來扒一扒正態(tài)分布在生活中的應(yīng)用媳瞪。
比如骗炉,當年我讀高中的時候,各個高中都喜歡做這么一件事情蛇受,就是將成績最好的學(xué)生句葵,集中起來,組成一個或者兩個班級兢仰,也就是常說的重點班乍丈,然后向重點班傾斜各種資源,試圖通過這種方式提高整體的成績把将。而我在的高中轻专,卻沒有做這種事情,他們并沒有劃分所謂的重點班察蹲,而是每個班級的學(xué)生都比較隨機的組成请垛。高考以后催训,結(jié)果誰勝誰負?結(jié)果事實證明我所在的高中在高考勝出了宗收,上清華北大漫拭,上一本線的,均超過了其他學(xué)校混稽?
為什么采驻?就是因為我所在的高中考慮到了正態(tài)分布的客觀規(guī)律。因為其他高中就算將成績最好的學(xué)生集中起來在一個班荚坞,也還是會出現(xiàn)正態(tài)分布的現(xiàn)象挑宠,也就是拔尖的永遠是那么幾位虏劲,差的也會有這么幾位脏嚷,結(jié)果就是導(dǎo)致整體發(fā)展不平衡,進而影響了個體發(fā)展犬性。而我所在的高中诡挂,并沒有強制將成績好的學(xué)生集中起來碎浇,放到一個班級,而是隨機組成班級璃俗,而這些班級里面總會有幾個成績拔尖的學(xué)生奴璃,而這些拔尖的學(xué)生集中起來的時候,是超過那些重點班的學(xué)生的城豁。
(未完待續(xù))