經過一系列枯燥概念的輸入(簡單概率的計算忽略),終于走到了綜合應用階段懈叹」愿埽看看這個不起眼的曲線圖包含著一種解釋工作、生活中很大一部分的現象澄成。
再次重復下圖中所示數據意義:X軸:事件胧洒;Y軸單個事件的頻次(比例);曲線下面積是范圍內事件發(fā)生的概率墨状;μ是平均值卫漫;σ標準差(數據與平均值差值的平均值)。
如果有批量數據肾砂,那么我們可以將數據計算得到以上常數確定的值列赎,形成一個個體屬性及群個體分布的概率發(fā)生曲線圖。減少定語用人話說“個人屬性在人群中的不同位置或一種屬性可能性的概率”镐确。
舉幾個例子:
例子一包吝、個人身高作為變項,有很多種可能源葫。吉尼斯紀錄中記載成年男子身高诗越,最矮55厘米,最高240厘米息堂。160厘米為平均值μ嚷狞,σ標準差是15厘米。那么我身高178厘米荣堰,2σ>178-160=18厘米>1σ所處概率范圍13.6%范圍內床未。姚明身高224厘米,224-160=64厘米>3σ所處概率范圍0.1%范圍外持隧。同樣如果一個小孩子出生預測他的身高即硼,首先要以社會平均身高估計68.2%出現在2σ>X>1σ即160+-15cm范圍內,其次才是通常認為的父母身高的基因遺傳效果屡拨。
例子二只酥、考試剛剛結束,父母看到孩子的成績98分呀狼,雖然嘴上說:“看看多粗心裂允,做對不就100分了嗎「缤В”其實心里滿意的很绝编。那么我們看看這個98分的屬性到底怎么樣?設想μ平均值=99分,標準差0.5分十饥,其實孩子成績在平均線以下窟勃,而且98-99=-1=2σ,已經處于整個班級(統(tǒng)計樣本)低于97.8%的同學逗堵,成績很差秉氧。再說說另一個極端考了72分,設想μ平均值=50分蜒秤,標準差10分汁咏,而且72-50=22>2,成績高于其他同學97.8%作媚,這次題難攘滩,但孩子發(fā)揮的還是不錯的。別因為72分苛責孩子纸泡,他學習很努力漂问。
例子三、世事難料女揭、福禍無常级解。千年一遇的洪水來臨,讓人們惴惴不安田绑,家里儲存食物、藥品抡爹、甚至買個沖鋒舟掩驱。0.1%的發(fā)生概率相當于X>3σ的區(qū)域《梗回過頭看看目前交通事故死亡率欧穴,走路請不要亂穿馬路、坐車系好安全帶泵殴。家里放倒放酒瓶操的心涮帘,來學學概率統(tǒng)計吧。
強調下統(tǒng)計學的意義在于此笑诅,認識自己現在所處位置调缨、將來可能發(fā)生區(qū)域。如果買彩票去賭1/500分之一的頭獎吆你,不如賭賭4%的大學畢業(yè)生創(chuàng)業(yè)成功率弦叶。計算好平均值、標準差多關心絕對值在2σ與3σ之間的事件它的概率占到了4.2%有本書叫暢銷書《灰犀鸥径啵》伤哺;了解一下《黑天鵝》但別讓它把自己壓趴下,它的范圍在X>3σ的絕對值,概率只占0.2%立莉。數量級高一個等級绢彤,可以簡單指導我們那個更重要。
以上我們通過個體(單一)到特殊(類別)蜓耻,又從特殊(類別)到一般(總體)做出了正態(tài)分布圖茫舶,簡單認識了正態(tài)分布。隔壁老王出門撿了錢包媒熊,我就要天天守株待兔嗎奇适。摒棄這種個體直接推斷整體簡單而又盲目的草率方式,把事件放置到大樣本中考慮芦鳍。