最近在學(xué)習(xí)統(tǒng)計(jì)學(xué)相關(guān)的知識(shí)个唧,在閱讀《Head First 統(tǒng)計(jì)學(xué)》的過程中惕虑,遇到了標(biāo)準(zhǔn)差這個(gè)概念,當(dāng)時(shí)理解的不是很透徹舞箍,就這樣略過閱讀下面的章節(jié)。
直到最近在學(xué)習(xí)PMP過程中看到了楊述老師對標(biāo)準(zhǔn)差概念的講解皆疹,雖然簡單疏橄,但是使我對標(biāo)準(zhǔn)差的理解一下子就提升了一大半,因此在這里我試著記錄下來略就,一來鞏固理解捎迫,二來測試一下自己是否真的理解到位了,畢竟表牢,只有說的明白窄绒,才算是真的理解。
1. 標(biāo)準(zhǔn)差對實(shí)際生活有什么作用崔兴?
籃球教練在招收球員入隊(duì)的時(shí)候彰导,需要有一系列的指標(biāo)作為入隊(duì)標(biāo)準(zhǔn);當(dāng)兩個(gè)球員的身體素質(zhì)等都差不多的時(shí)候敲茄,就很難抉擇該選擇誰入隊(duì)位谋,這時(shí)候標(biāo)準(zhǔn)差就是一個(gè)非常好的參考;
同樣折汞,我們在做兩個(gè)球星的差距的時(shí)候倔幼,標(biāo)準(zhǔn)差就能非常有效的描述差距的大小。
1.1 科比 v.s 易建聯(lián)
西格瑪標(biāo)準(zhǔn)差其實(shí)是衡量數(shù)據(jù)或概率分布的曲線的胖瘦爽待。
西格瑪小的表示概率穩(wěn)定损同。例如這里科比的表示他每場得30分的概率非常穩(wěn)定翩腐,換句換說,無論觀眾和隊(duì)友膏燃,只要科比一上場茂卦,大家心里都有數(shù),這30分是基本到手了组哩。
但是如果同樣在NBA打球的易建聯(lián) 的上車等龙,情況就不那么穩(wěn)定了,運(yùn)氣好也能拿30分伶贰,運(yùn)氣不好可能拿幾分都有蛛砰。所以水平高低從標(biāo)準(zhǔn)差上一目了然。
2. 因此黍衙,標(biāo)準(zhǔn)差是什么
標(biāo)準(zhǔn)差是描述數(shù)據(jù)或概率分布的集中程度泥畅。標(biāo)準(zhǔn)差大小,數(shù)據(jù)/概率都離這個(gè)期望值不遠(yuǎn)琅翻;反之位仁,如果標(biāo)準(zhǔn)差大則表示數(shù)據(jù)/概率離期望值很遠(yuǎn),什么都有可能發(fā)生方椎。
3. Q&A 問答環(huán)節(jié)
3.1 那么聂抢,用均值不也能體現(xiàn)兩個(gè)球員的差距嗎?
舉一個(gè)極端不穩(wěn)定的情況棠众,一個(gè)球員上場要么得60分琳疏,要么得0分,那么均值看起來是30分摄欲,和科比一樣高呢轿亮。但是這樣的球員你敢在總決賽那天送他上場嗎?你送他上場胸墙,他送你上天我注。
因此均值顯然沒有體現(xiàn)事情的全部真像,你正在需要知道的是變化幅度(Variance)迟隅。均值給出了平均數(shù)但骨,而標(biāo)準(zhǔn)差給出了分散程度。
3.2 那么智袭,標(biāo)準(zhǔn)差總是越小越好嗎奔缠?
不一定,如果你是找出每場發(fā)揮穩(wěn)定的球員吼野,標(biāo)準(zhǔn)差小就是你要找的人校哎;或者是你正在生存機(jī)器零件,標(biāo)準(zhǔn)差小那么零件越一致。
如果你準(zhǔn)備入職一家新公司準(zhǔn)備大干一場闷哆,如果這家公司工資的標(biāo)準(zhǔn)差很小腰奋,表示你大干一場或者不干都差不多,你也許應(yīng)該找一家標(biāo)準(zhǔn)差大的公司大干一場抱怔。
3.3 標(biāo)準(zhǔn)差和方差是什么關(guān)系
標(biāo)準(zhǔn)差的平方就是方差劣坊。由于在統(tǒng)計(jì)帶有負(fù)號(hào)的數(shù)據(jù)的時(shí)候,如果不用平方最后求出來的標(biāo)準(zhǔn)差可能為0,因此才產(chǎn)生了方差屈留。具體兩者關(guān)系可以參考《Head First 統(tǒng)計(jì)》
3.4 最后局冰,標(biāo)準(zhǔn)差的公式
就是方差的根號(hào):
其中:x表示一組數(shù)據(jù)集內(nèi)的每一個(gè)數(shù)據(jù),u表示這組數(shù)據(jù)集的均值灌危, n表示數(shù)據(jù)集內(nèi)的個(gè)數(shù)康二。
又可以簡化成: