故事背景是這樣的:話說有一天在看通信工程師必學(xué)的一些算法(恩,說的很牛逼哄哄的),突然看到方差計(jì)算式是
這個(gè)時(shí)候上百度找谷歌是少不了的,但是除了一堆沒見過的數(shù)學(xué)名詞和公式外,還是沒有答案.(還有一個(gè)老教師蜓陌,他也糾結(jié)這公式怎么交代給學(xué)生).
故事轉(zhuǎn)擇點(diǎn)這樣的:一不小心看了<<深入淺出統(tǒng)計(jì)學(xué)>>(強(qiáng)烈推薦下 ,深入淺出系列,英文名 head first ).答案就是一個(gè)字:簡(jiǎn)單7悦铩钮热!
首先
說下概率學(xué)中的方差計(jì)算,就是剛才那個(gè)公式烛芬,但是除的n(當(dāng)然均值符號(hào)也是有點(diǎn)不同的).
然后
統(tǒng)計(jì)學(xué)中的方差計(jì)算隧期,這里面有兩種方差飒责,總體方差和樣本方差. (大家都是文明人,總體和樣本的概念就不多說了)
總體方差的計(jì)算公式是什么呢仆潮?跟概率學(xué)中方差的計(jì)算是一樣的宏蛉。
樣本方差的計(jì)算公式是什么呢?ok性置,就是故事開頭的那個(gè)坑爹公式了拾并。
之后
說明下方差這玩意的意義,就是用來度量一組數(shù)據(jù)的分布情況.方差越小,數(shù)據(jù)越一致.(如果概念不熟鹏浅,網(wǎng)上搜搜)
最后
一張直接說明問題的圖:
可以把方差認(rèn)為上圖中兩條曲線的x軸寬度嗅义,越寬的話,數(shù)據(jù)越分散
原因就是這樣的:我們想要獲取總體的方差篡石,通常要用樣本的方差來做替代,但是從方差這貨的性質(zhì)上來說呢西采,樣本計(jì)算出的方差很有可能是偏小的(我也是出于數(shù)學(xué)嚴(yán)謹(jǐn)性這樣說的凰萨,真實(shí)想法是把"很有可能"去掉 ),所以搞統(tǒng)計(jì)學(xué)那幫歐巴們,就用n-1來彌補(bǔ)下,專業(yè)點(diǎn)就是校正了.至于為什么是n-1,不是-2械馆,-3等等.有幾種可能:
1.實(shí)踐中檢驗(yàn)出來的
2.有數(shù)學(xué)證明胖眷,網(wǎng)上是有一大堆公式,可惜數(shù)學(xué)沒學(xué)好霹崎,看不懂.感覺 這貨應(yīng)該是人為設(shè)的.