課前導(dǎo)讀
統(tǒng)計(jì)推斷的另一類重要問題是假設(shè)檢驗(yàn)問題迈着。
參數(shù)估計(jì)的主要任務(wù)是找參數(shù)值等于多少,或在哪個(gè)范圍內(nèi)取值。而假設(shè)檢驗(yàn)則主要是看參數(shù)的值是否等于某個(gè)特定的值潘靖。
通常進(jìn)行假設(shè)檢驗(yàn)即選定一個(gè)假設(shè)芒划,確定用以決策的拒絕域的形式冬竟,構(gòu)造一個(gè)檢驗(yàn)統(tǒng)計(jì)量欧穴,求出拒絕域或檢驗(yàn)統(tǒng)計(jì)量的p值,查看結(jié)果是否落在拒絕域內(nèi)或p值是否小于顯著性水平泵殴,做出決策的一個(gè)過程涮帘。
第一節(jié) 檢驗(yàn)的基本原理
舉個(gè)例子,體現(xiàn)假設(shè)檢驗(yàn)的思想:
假設(shè)檢驗(yàn)的統(tǒng)計(jì)思想:類似"反證法"笑诅,不妨先認(rèn)為某一假設(shè)(記為
一妇多、建立假設(shè)
對(duì)要檢驗(yàn)的問題提出一個(gè)原假設(shè)和備擇假設(shè)
伤哺。
二、給出拒絕域的形式
根據(jù)樣本提供的信息者祖,由樣本給出未知參數(shù)的點(diǎn)估計(jì)量
立莉。比較
的觀測值與
的距離。距離很近咸包,則不拒絕原假設(shè)
桃序;如果距離遠(yuǎn)了,就拒絕原假設(shè)烂瘫。
度量距離“遠(yuǎn)近”的方法:拒絕域
說明:拒絕域從備擇假設(shè)開始
三媒熊、確定顯著性水平
一個(gè)假設(shè)檢驗(yàn)通過拒絕域的方式將樣本數(shù)據(jù)進(jìn)行了劃分,通過這種劃分做出一個(gè)決策:接受或拒絕
坟比。但這一決策是基于樣本提供的不完全信息對(duì)未知的總體參數(shù)做出的判斷芦鳍。因此總會(huì)存在不正確決策的風(fēng)險(xiǎn)。
所以借助于樣本來進(jìn)行的假設(shè)檢驗(yàn)可能有四種結(jié)果:(第一類錯(cuò)誤:棄真葛账、第二類錯(cuò)誤:采偽)
一般來說柠衅,當(dāng)?shù)谝活愬e(cuò)誤概率小時(shí),第二類錯(cuò)誤概率就顯得大籍琳。
從上面兩類錯(cuò)誤的分析我們知道菲宴,在樣本量一定的條件下,不可能同時(shí)控制一個(gè)檢驗(yàn)的兩類錯(cuò)誤概率趋急。所以喝峦,在此基礎(chǔ)上,采用折中方案呜达,僅限制犯第一類錯(cuò)誤的概率不超過事先設(shè)定的值谣蠢,再盡量減少犯第二類錯(cuò)誤的概率。
稱該拒絕域所代表的檢驗(yàn)為顯著性水平的檢驗(yàn),稱
為顯著性水平眉踱。 最常用的選擇是
挤忙。
四、建立檢驗(yàn)統(tǒng)計(jì)量谈喳,給出拒絕域
確定了顯著性水平后册烈,可以來確定拒絕域中的臨界值c了。下面這個(gè)例子介紹具體步驟叁执。
在這里茄厘,為了求出臨界值c的值矮冬,構(gòu)造了一個(gè)統(tǒng)計(jì)量谈宛,稱符合這個(gè)要求的統(tǒng)計(jì)量為檢驗(yàn)統(tǒng)計(jì)量。再本例中胎署,檢驗(yàn)統(tǒng)計(jì)量
服從標(biāo)準(zhǔn)正態(tài)分布吆录,故該檢驗(yàn)又稱為
-檢驗(yàn)(又可稱為
-檢驗(yàn))
綜上所述,在給定顯著性水平下琼牧,求拒絕域
的一般步驟如下:
五恢筝、p值和p值檢驗(yàn)法
p值檢驗(yàn)法的原則是當(dāng)p值小到一定程度時(shí)拒絕
通常約定:
第二節(jié) 正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)
一撬槽、單正態(tài)總體均值的假設(shè)檢驗(yàn)
假定總體,考慮以下三種均值
的檢驗(yàn)問題:
由于正態(tài)分布中有兩個(gè)參數(shù)
1.方差\sigma^2已知時(shí)的均值檢驗(yàn)
在上述過程中,檢驗(yàn)的原假設(shè)與備擇假設(shè)構(gòu)成一個(gè)雙側(cè)檢驗(yàn)問題占调,換成如下單側(cè)(右側(cè))檢驗(yàn)問題:
檢驗(yàn)的討論過程完全相似暂题。
單正態(tài)總體方差的假設(shè)檢驗(yàn)
考慮如下三種關(guān)于方差的檢驗(yàn)問題:
實(shí)際情況中通常假定
綜上所述究珊,關(guān)于單正態(tài)總體方差的假設(shè)檢驗(yàn)問題如下表所示:
三薪者、兩個(gè)正態(tài)總體均值差的假設(shè)檢驗(yàn)
同單正態(tài)總體的假設(shè)檢驗(yàn)一樣,兩個(gè)總體的未知參數(shù)的檢驗(yàn)問題都有一對(duì)原假設(shè)和備擇假設(shè)剿涮,同樣也存在雙側(cè)和單側(cè)假設(shè)檢驗(yàn)言津。
同置信區(qū)間求解過程相似,
四、兩個(gè)正態(tài)分布方差比的假設(shè)檢驗(yàn)
綜上所述想括,關(guān)于兩個(gè)正態(tài)總體方差比的假設(shè)檢驗(yàn)問題如下表所示:
第三節(jié) 擬合優(yōu)度檢驗(yàn)
第七章的參數(shù)固定是假定總體的分布類型是已知的陷谱,需要通過樣本來估計(jì)刻畫總體分布的一個(gè)或若干個(gè)參數(shù)。但是,在實(shí)際問題中烟逊,經(jīng)常不知道總體服從什么分布渣窜,這時(shí)只能假定其為某種分布,那么就需要根據(jù)樣本數(shù)據(jù)來檢驗(yàn)假設(shè)是否合理宪躯,即檢驗(yàn)假設(shè)的總體分布是否可以被接受乔宿。又稱為 分布的擬合檢驗(yàn)。常用的方法有擬合優(yōu)度檢驗(yàn)访雪。
上面這個(gè)例子中详瑞,我們假定每一組的概率
都是已知的i=1,2,...,k,但在實(shí)際問題中臣缀,有時(shí)
還依賴于r個(gè)未知參數(shù)坝橡,而這r個(gè)未知參數(shù)需要利用樣本來估計(jì)。
這時(shí)先用點(diǎn)估計(jì)法估計(jì)出這r個(gè)位置參數(shù)精置,然后再算出的估計(jì)值
拓展閱讀
假設(shè)檢驗(yàn)與區(qū)間估計(jì)的關(guān)系: