討論參數(shù)估計(jì)之前再沧,先對(duì)參數(shù)這事情是什么(參數(shù)的定義)做個(gè)說明饶囚。
我們之前講過军援,統(tǒng)計(jì)學(xué)研究的一大主題就是“用樣本來科學(xué)地推斷整體”腿短。通常來講呢屏箍,整體大部分由于種種原因無法做到普查,我們只能(無奈地)選擇觀察樣本橘忱,也就是“抽樣”赴魁。抽完樣,我們就有了一份“樣本”钝诚。注意颖御,這里的樣本一是要保證隨機(jī)性,一是要能力上可以處理凝颇。隨機(jī)性需要花時(shí)間解釋潘拱,這里先按下不表∨÷裕可以籠統(tǒng)地認(rèn)為“無任何特定目的”地抽取樣本芦岂,有目的就有人為因素,結(jié)果就可能被這個(gè)特定目的帶到坑里了垫蛆。能力上可以處理就應(yīng)該比較容易理解禽最,不能處理的樣本沒有什么現(xiàn)實(shí)意義。
好袱饭,有了一份(或者多份川无,看玩家有沒有充值648,錢多就能多份虑乖,錢少只能一份懦趋,呵呵)“能夠處理”且“隨機(jī)抽樣”的樣本。那么决左,就可以用統(tǒng)計(jì)的方式來計(jì)算樣本統(tǒng)計(jì)量了愕够。什么是統(tǒng)計(jì)量走贪?針對(duì)這個(gè)樣本,平均數(shù)是統(tǒng)計(jì)量惑芭,中位數(shù)是統(tǒng)計(jì)量坠狡,方差是統(tǒng)計(jì)量。有點(diǎn)明白了么遂跟?現(xiàn)實(shí)中逃沿,我們可以拿到的真實(shí)數(shù)據(jù),往往就是樣本的幻锁,然后計(jì)算這個(gè)樣本統(tǒng)計(jì)量凯亮。為啥叫統(tǒng)計(jì)量?當(dāng)然因?yàn)椤澳軌蛱幚怼钡臉颖静拍鼙唤y(tǒng)計(jì)哄尔,而“無法直接處理”的整體假消,我們根本抓不到、摸不著啊~
所以岭接,我們把整體對(duì)應(yīng)樣本的統(tǒng)計(jì)量叫做參數(shù)富拗。簡(jiǎn)單點(diǎn)講,樣本的平均數(shù)是一個(gè)統(tǒng)計(jì)量鸣戴;此樣本對(duì)應(yīng)的整體的平均數(shù)啃沪,則是一個(gè)參數(shù)。參數(shù)的集合就是這個(gè)整體的統(tǒng)計(jì)特征集窄锅,或者可以認(rèn)為我們用參數(shù)集合描述了這個(gè)整體创千。就好像相親,我們用 [身高入偷,年齡追驴,體重,性別盯串,年收入氯檐,家里有沒有礦] 描述了某個(gè)潛在對(duì)象。
樣本的平均數(shù)是不是就等于整體的平均數(shù)呢体捏?當(dāng)然不會(huì)絕對(duì)的等于。但是糯崎,我們認(rèn)為這個(gè)統(tǒng)計(jì)量“在一定的條件下”會(huì)“基本上”等于整體的參數(shù)几缭,也就是樣本的平均數(shù)可以被認(rèn)為是整體的平均數(shù)。這樣衛(wèi)健委調(diào)查某幾所小學(xué)的男孩平均身高和標(biāo)準(zhǔn)差沃呢,就可以推斷全市年栓,甚至全國(guó)的同等年齡段的男孩的平均身高和標(biāo)準(zhǔn)差了。
這里要多提一個(gè)概念薄霜,自由度某抓。我們上次講的方差公式還記得不纸兔?
可以看到分母是n,但這個(gè)公式是計(jì)算整體的方差的(有時(shí)候否副,整體不大汉矿,也能處理,我們就直接算了备禀,不需要抽樣在統(tǒng)計(jì)推斷了)洲拇。樣本方差的計(jì)算稍有不同,分母變成了n-1曲尸。
最大的變化就是分母不再是除以n而是n-1赋续,為什么?這里就有自由度的概念另患。統(tǒng)計(jì)學(xué)中纽乱,幾乎所有的方法和指標(biāo)都會(huì)涉及自由度的概念,因?yàn)樗屠龜?shù)有關(guān)昆箕。自由度的字面概念就是:可以自由取值的數(shù)值的個(gè)數(shù)(df)鸦列。舉個(gè)簡(jiǎn)單的例子,a+b+c=10为严。這個(gè)公式中敛熬,如果a和b都自由取值,那么一旦a和b確定了第股,c就不能再自由了应民,c=10-a-b。所以夕吻,c是“不自由”的诲锹。這個(gè)式子的自由度,不是3(雖然有三個(gè)自變量)涉馅,而是2归园。
要站在巨人的肩膀上么!前代的統(tǒng)計(jì)學(xué)家已經(jīng)證明稚矿,如果樣本的統(tǒng)計(jì)量要對(duì)整體做“無偏估計(jì)”庸诱,那么自由度必須減1。
順便提一句t檢驗(yàn)中的理論基礎(chǔ)t分布就是一組按自由度排列的類鐘形曲線晤揣,當(dāng)自由度超過“30”的時(shí)候就可以認(rèn)為近似正態(tài)分布桥爽。30這個(gè)數(shù)字是不是對(duì)很多人很熟悉啊昧识?哈哈哈钠四。今天到此。下次繼續(xù)參數(shù)估計(jì)跪楞。至于30缀去,這個(gè)和中心極限有關(guān)侣灶,慢慢來。