為了理解為什么除以n會(huì)低估總體方差(population mean),我們會(huì)從幾個(gè)簡(jiǎn)單的例子開(kāi)始贡羔,然后用數(shù)學(xué)證明孤澎,一勞永逸地纯露。
在第一個(gè)簡(jiǎn)單的例子中,我想用0替換樣本均值(sample mean)x,看看會(huì)發(fā)生什么〔咧荩現(xiàn)在我們把測(cè)量值和0之間的差值平方瘸味,然后計(jì)算平均。現(xiàn)在我們把這個(gè)值畫出來(lái)够挂。
當(dāng)x為樣本均值時(shí)方差最小旁仿,當(dāng)x為總體均值時(shí),方差要大于當(dāng)x為樣本均值時(shí)孽糖。也就是說(shuō)丁逝,使用樣本均值時(shí),低估了總體均值的方差梭姓。
現(xiàn)在霜幼,我們可以對(duì)公式求導(dǎo),用它來(lái)確定v在不同值處曲線的斜率誉尖。當(dāng)斜率為0時(shí)罪既,我們就能求出方差最小的v值。提醒大家一下铡恕,導(dǎo)數(shù)對(duì)應(yīng)的是紫色直線的斜率琢感。我們想求出v的值,使紫色線的斜率為0探熔,因?yàn)檫@是我們能求出的最小方差驹针。為了使這個(gè)問(wèn)題更清楚,我們將用三種不同的方法來(lái)求導(dǎo)數(shù)為零和方差最小的地方诀艰。
第1種柬甥,我們將使用觀測(cè)數(shù)據(jù),找到方差最小的地方其垄。
我們做的第一件事是把n代入5苛蒲,因?yàn)槲覀冇?個(gè)測(cè)量值。然后計(jì)算當(dāng)斜率為0時(shí)绿满,v的值臂外。
當(dāng)v=17.6,方差最小。我們發(fā)現(xiàn)當(dāng)v為樣本平均值時(shí)方差小于當(dāng)v為總體均值的方差喇颁。
第2種漏健,我們就會(huì)找到任何5個(gè)測(cè)量值,方差最小的地方橘霎。
把n代入5蔫浆,因?yàn)槲覀冇?個(gè)未知測(cè)量值。然后計(jì)算當(dāng)斜率為0時(shí)茎毁,v的值克懊。
我們發(fā)現(xiàn)不管我們5個(gè)測(cè)量值是多少忱辅,當(dāng)v為樣本均值時(shí),方差最小谭溉。
第3種墙懂,我們會(huì)講如何求出任意樣本的最小方差,不管樣本大小如何扮念。
當(dāng)我們有n個(gè)測(cè)量值的樣本损搬。然后計(jì)算當(dāng)斜率為0時(shí),v的值柜与。
我們發(fā)現(xiàn)不管有多少個(gè)測(cè)量值巧勤,當(dāng)v為樣本均值時(shí),方差最小弄匕。
結(jié)論:因此颅悉,當(dāng)我們除以n時(shí),樣本均值的方差總是小于總體均值的方差迁匠。除非樣本均值和總體均值完全相同剩瓶,這幾乎不會(huì)發(fā)生。