今天學(xué)習(xí)到一個(gè)名詞班缰,無偏估計(jì)法梯。
如何理解“不論總體服從什么分布勋磕,樣本均值是總體均值的無偏估計(jì)量”這句話妈候,什么是無偏估計(jì)呢?
均值的無偏估計(jì)
比如我們想知道一個(gè)群體的平均身高挂滓,但是沒有辦法把每個(gè)人都進(jìn)行測(cè)量苦银,只有抽樣一部分來估計(jì)整體的身高。
那么赶站,可以用下面式子來進(jìn)行平均值的無偏估計(jì):
為什么說是無偏估計(jì)墓毒,因?yàn)椴煌蓸拥玫降钠骄凳菄@整體均值(u)左右波動(dòng)的,這種估算方法沒有系統(tǒng)上的偏差亲怠,而產(chǎn)生誤差的原因只有一個(gè):隨機(jī)因素(也就是抽樣的區(qū)別造成的)所计。
方差的無偏估計(jì)
我們用下面的式子來進(jìn)行方差的無偏估計(jì):
或者是
這里會(huì)有幾個(gè)問題,為什么可以用S2來近似整體方差团秽,如果用樣本均值的期望代替整體均值主胧,為什么要用n-1代替n。
已知整體均值(u)习勤,采樣具有隨機(jī)性踪栋,我們多采樣幾次,S2會(huì)在整體方差的上下波動(dòng)图毕。
根據(jù)中心極限定理夷都,S2的采樣均值會(huì)服從整體均值(u)=整體方差的正態(tài)分布,因此S2可以作為整體方差的無偏估計(jì)予颤。
但是如果我們不知道整體均值囤官,只能計(jì)算出不同采樣的樣本均值。當(dāng)整體均值等于樣本均值時(shí)蛤虐,下式最械骋:
只要整體均值偏離樣本均值,該值就會(huì)增大驳庭。
所以:
如果用下面式子來估計(jì):
那么S2采樣均值會(huì)服從一個(gè)偏離整體方差的正態(tài)分布刑顺,傾向于低估,具體低估了
因此
而下式得到的就是方差的無偏估計(jì)
估計(jì)的有效性
另外估計(jì)值還有另外一個(gè)概念就是有效性饲常,估計(jì)量越靠近目標(biāo)蹲堂,效果越“好”。這個(gè)“靠近”可以用方差來衡量贝淤。有效性和無偏性是不相關(guān)的兩個(gè)概念:
有時(shí)候不一定追求估計(jì)的無偏性柒竞,如果系統(tǒng)誤差在可接受的范圍內(nèi),有效性高也是不錯(cuò)的選擇霹娄。