要點(diǎn)
1. 單個(gè)二項(xiàng)分布檢驗(yàn)用SPSS二項(xiàng)檢驗(yàn)或者單樣本T檢驗(yàn)
2. 比較兩個(gè)個(gè)二項(xiàng)分布差異性之類的可以用Anova或者獨(dú)立樣本T檢驗(yàn)逼肯,后者可以得到置信區(qū)間方援。
3.上面的SPSS數(shù)據(jù)形式都是1和0的形式偷办,用MATLAB生成即可猾昆。
譬如這樣一個(gè)問(wèn)題:
中國(guó)的互聯(lián)網(wǎng)絡(luò)覆蓋率是不是在30%以上(5%顯著性水平)肪凛?抽樣顯示态蒂,150個(gè)樣本中杭措,有57個(gè)是有網(wǎng)絡(luò)覆蓋的。
解題:
H0:網(wǎng)絡(luò)覆蓋率小于等于30%
H1:網(wǎng)絡(luò)覆蓋率在30%以上
如果H0成立钾恢,這個(gè)總體是一個(gè)典型的伯努利分布手素,伯努利分布是有總體標(biāo)準(zhǔn)差的吕喘,總體平均值為0.3, 方差就是p(1-p)刑桑,這里的p就是0.3氯质,標(biāo)準(zhǔn)差為 √(0.3*0.7),就不用拿樣本的標(biāo)準(zhǔn)差進(jìn)行估計(jì)了祠斧。
0 | 1 |
---|---|
0.7 | 0.3 |
根據(jù)中心極限定理闻察,樣本均值的抽樣分布是符合正態(tài)分布的,此正態(tài)分布的均值等于總體均值0.3琢锋,而這個(gè)分布的標(biāo)準(zhǔn)差等于總體標(biāo)準(zhǔn)差/√ 150 = 0.037辕漂,而我們這個(gè)特定的樣本均值為57/150 = 0.38,可以計(jì)算出來(lái)z statistic(z 統(tǒng)計(jì)量吴超,即離均值有多少個(gè)標(biāo)準(zhǔn)差遠(yuǎn))為(0.38-0.3)/0.037 = 2.14钉嘹。
因?yàn)槲覀兊臉颖玖看笥?0,所以我們查z table(下圖)鲸阻,也就是這是個(gè)z test跋涣,單側(cè)5%的z score 查表為1.65,也就是鸟悴,假如原假設(shè)H0成立陈辱,我們調(diào)查的網(wǎng)絡(luò)覆蓋率38%或者更極端的情況發(fā)生的可能性小于5%,顯然不太可能细诸,所以我們拒絕原假設(shè)沛贪。
附:SPSS二項(xiàng)檢驗(yàn)
原始數(shù)據(jù)為57個(gè)1和93個(gè)0(因?yàn)槲覀円獧z驗(yàn)的是有網(wǎng)絡(luò)覆蓋),然后分析-非參數(shù)檢驗(yàn)-舊對(duì)話框-二項(xiàng)震贵,檢驗(yàn)比例設(shè)置為0.3利赋,結(jié)果如下,p值0.022表示如果原假設(shè)成立即覆蓋率基本30%猩系,則得到我們樣本數(shù)據(jù)的概率為2.2%媚送,顯然不太可能(起碼在5%顯著性水平內(nèi)),拒絕覆蓋率基本是30%蝙眶,應(yīng)該是覆蓋率顯著大于30%的季希。
PS:也可以用單樣本t檢驗(yàn),只是結(jié)果是雙尾的幽纷,除以2即可式塌。