引用(商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)19章)
實(shí)踐中樣本總體往往不服從正態(tài)分布馏鹤,下面介紹針對(duì)非正態(tài)分布總體的假設(shè)檢驗(yàn)葱峡,也稱為非參數(shù)檢驗(yàn)刽漂。
1.符號(hào)檢驗(yàn)
1). 符號(hào)檢驗(yàn)樣本數(shù)n<20, 單個(gè)總體中位數(shù)差異雙側(cè)檢測過程:
(1)給定來自同一總體的N個(gè)樣本值玉控,給定一個(gè)假設(shè)的總體中位數(shù) m
(2) H0: 總體中位數(shù) = m之景,H1:總體中位數(shù)≠m澄干, 確定顯著度α
(3) 將N個(gè)樣本中>m 的樣本記為“+”旺芽, <m的記為“-”, =m的樣本刪除,得到n個(gè)樣本
(4)令P表示“+”號(hào)的概率擅这,則若中位數(shù)=m(H0成立)澈魄,p=0.5,所以將假設(shè)轉(zhuǎn)化為二項(xiàng)分布概率p的假設(shè):
H0: p=0.5, H1:p≠0.5
(5)計(jì)算二項(xiàng)分布的概率分布圖仲翎,binomial(n=i, p=0.5), i= 1, ...n,
(6) 由于是雙側(cè)檢測痹扇,p為"+"的概率:
(7) 若 p-value < α,拒絕假設(shè)H0(總體中位數(shù)不是m)溯香, 否則不能拒絕假設(shè)H1
2).符號(hào)檢驗(yàn)樣本數(shù)>20, 單個(gè)總體中位數(shù)單側(cè)檢測過程:
(1)給定來自同一總體的N個(gè)樣本值鲫构,給定一個(gè)假設(shè)的總體中位數(shù) m
(2)H0: 總體中位數(shù) >= m,H1:總體中位數(shù)<m(比如指標(biāo)中位數(shù)有所下降)玫坛, 確定顯著度α
(3)將N個(gè)樣本中>m 的樣本記為“+”结笨, <m的記為“-”, =m的樣本刪除,得到n個(gè)樣本
(4)令P表示“+”號(hào)的概率,所以將假設(shè)轉(zhuǎn)化為二項(xiàng)分布概率p的假設(shè):H0: p>=0.5, H1:p<0.5?
(5) n+ < 0.5n (否則一般不會(huì)有下降的備則假設(shè)H1)炕吸, 位于二項(xiàng)分布下側(cè)伐憾,
,可以這樣計(jì)算
(6) 由于當(dāng)n>20時(shí),二項(xiàng)分布隨機(jī)變量x(正的頻數(shù)) 近似服從
為的連續(xù)因子矯正值算途,?
(7) 若p-value <α塞耕, 拒絕H0(指標(biāo)中位數(shù)有所下降), 否則無法拒絕H0
2. 匹配樣本(成對(duì)樣本)的假設(shè)
檢測兩總體是否有差異的檢驗(yàn)過程:
(1) 提供N對(duì)樣本嘴瓤,其中一個(gè)來自總體1扫外,另一個(gè)來自總體2,
(2) 每一對(duì)樣本廓脆,偏好總體1為“+”, 偏好總體2偏好為“-”筛谚, 無差別的樣本刪掉, 得n個(gè)樣本
(3) 定義p為偏好總體1的概率停忿,H0: p=0.5, H1: p ≠0.5驾讲, 定義顯著度α
(4) 符號(hào)檢驗(yàn),雙側(cè):
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(5) 若 p-value <α席赂,拒絕H0(兩總體有偏好差別)吮铭, 否則無法拒絕H0
若 N > 20, 亦可用正態(tài)分布求p-value。
3. 連續(xù)區(qū)間校正
當(dāng)隨機(jī)變量X是離散變量時(shí)颅停,用正態(tài)分布近似要將X=x的離散概率近似為(x-0.5, x+0.5)區(qū)間上的正態(tài)概率谓晌,
若為上側(cè)取 X= x+0.5, 若為下側(cè)取 X=x-0.5