學(xué)過的知識(shí)要時(shí)撑鄱疲總結(jié)默蚌,把知識(shí)變成知識(shí)點(diǎn),借簡書之便苇羡,想來想去绸吸,就從最基礎(chǔ)的Excel函數(shù)開始吧。
自己做了一個(gè)小case设江,有一個(gè)數(shù)列锦茁,包含10個(gè)隨機(jī)整數(shù),相關(guān)的描述統(tǒng)計(jì)如下:
選中一個(gè)單元格叉存,把公式敲進(jìn)去码俩,就可以得出相應(yīng)的結(jié)果,在右側(cè)列出了相關(guān)的公式鹉胖,大多數(shù)可一目了然握玛,不必多言。筆記的重點(diǎn)應(yīng)該放在非常規(guī)現(xiàn)象上:
標(biāo)準(zhǔn)差 ?? 是 STDEV.S 還是 STDEV.P
輸入方差公式時(shí)甫菠,會(huì)發(fā)現(xiàn)有STDEV.S和STDEV.P挠铲。
“STDEV”表示“標(biāo)準(zhǔn)差”,Stand Deviation
“S”表示“樣本”寂诱,即 Sample
“P”表示“全體”拂苹,即 Population
選擇S還是P,其實(shí)就是標(biāo)準(zhǔn)差公式中分母是"n-1"還是"n"的問題痰洒,為什么是“n-1”涉及到無偏估計(jì)和有偏估計(jì)瓢棒,這里不展開,改天專寫一篇丘喻,單獨(dú)討論脯宿。
簡單說,S用于小型樣本泉粉,P用于大型樣本或者全體连霉。
那么樣本量到底是多少的時(shí)候用S榴芳,多少時(shí)候用P呢
設(shè)想了這個(gè)“極端”的例子,假設(shè)現(xiàn)在樣本里面只有2個(gè)值:
很輕易就能計(jì)算出2種標(biāo)準(zhǔn)差跺撼,但是誤差很大……(這個(gè)時(shí)候傾向于使用無偏估計(jì)窟感,即STDEV.S)
然后固定均值,把這個(gè)樣本“放大”:
現(xiàn)在有5個(gè)“1”和5個(gè)“3”歉井,樣本量為10柿祈,均值不變還是2。而標(biāo)準(zhǔn)差S已經(jīng)接近標(biāo)準(zhǔn)差P了哩至,于是發(fā)現(xiàn)一個(gè)規(guī)律: 樣本量越大躏嚎,標(biāo)準(zhǔn)差S就越接近標(biāo)準(zhǔn)差P。
根據(jù)這個(gè)規(guī)律憨募,總結(jié)出了一張表:
以及線型圖:
可以發(fā)現(xiàn):樣本量小于20個(gè)比較傾向于使用STDEV.S紧索。
方差Var.S & Var.P 也同樣分為樣本和整體,方法一樣菜谣。
計(jì)數(shù) ?? COUNT & COUNTA
這里也有一個(gè)例子珠漂,5個(gè)樣本,2種方法計(jì)數(shù):
可以發(fā)現(xiàn):“COUNT”只統(tǒng)計(jì)數(shù)值型的樣本尾膊,而COUNTA可以統(tǒng)計(jì)全部樣本媳危。
第一次寫,感覺亂糟糟的冈敛,慢慢改進(jìn)吧待笑。愿與諸君一起成長!