我對(duì)統(tǒng)計(jì)學(xué)的認(rèn)識(shí)還很淺顯,正因?yàn)槿绱宋抑雷鰹橐粋€(gè)普通人需要怎樣的類比講解,才能將高高在上的統(tǒng)計(jì)學(xué)落入尋常家偶器。
這篇內(nèi)容并不容易懂憋飞,需要有一定的統(tǒng)計(jì)學(xué)基礎(chǔ)才能看懂唁盏,未來我會(huì)寫出活生生的統(tǒng)計(jì)學(xué)應(yīng)用栗子。
在假設(shè)檢驗(yàn)檢驗(yàn)中最常見到z值和t值,也可以叫做z統(tǒng)計(jì)量和t統(tǒng)計(jì)量。那什么時(shí)候用z值鹏氧,什么時(shí)候用t值呢?這個(gè)問題也困擾了我很久,最近在可汗學(xué)院聽統(tǒng)計(jì)學(xué)的課才搞明白原來z值與t值本就是一家酌伊。
z值指樣本均值距離總體均值有多少個(gè)標(biāo)準(zhǔn)偏差驴娃,距離越遠(yuǎn)鼻由,P值越小蕉世,越有可能拒絕零假設(shè)彬犯。
z值的計(jì)算公式如下
z = (樣本均值 - 零假設(shè)總體均值)/(總體標(biāo)準(zhǔn)偏差/樣本量的平方根)
但總體標(biāo)準(zhǔn)偏差不容易知道,我們能做的就是使用樣本標(biāo)準(zhǔn)偏差來推斷。
則,s代表樣本標(biāo)準(zhǔn)偏差邮弹。
當(dāng)樣本量足夠大的時(shí)候,如n>=30氯材,z值這么計(jì)算完全沒有問題,之后使用z表查詢z值所對(duì)應(yīng)的p值冗尤,來推斷是否是拒絕零假設(shè)背零。
然而當(dāng)樣本量太小嫉称,小到并不足以代表總體水平時(shí)結(jié)果偏差就會(huì)很大壳繁。比如說你想評(píng)估全校1000名學(xué)生的智商江耀,只隨機(jī)找了10個(gè)學(xué)生做樣本晾腔,10個(gè)學(xué)生能代表1000名學(xué)生的整體水平嗎灼擂?不一定,但手中只有這10名學(xué)生的數(shù)據(jù)該怎么辦觉至?此時(shí)就可以使用t分布。
多小才算小呢峻贮?當(dāng)樣本量<30時(shí)碉纺,就應(yīng)該用t表和df(n-1)來查詢所對(duì)應(yīng)的p值。