? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 作者丨梅子
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 來(lái)源丨醫(yī)數(shù)思維云課堂(ID:Datamedi)? ?
確定擬合模型的口徑之后,我們還要對(duì)該擬合模型進(jìn)行必要的檢驗(yàn)进胯。這里指的檢驗(yàn)是指模型的顯著性檢驗(yàn)和參數(shù)的顯著性檢驗(yàn)向楼。
01
模型的顯著性檢驗(yàn)
模型的顯著性檢驗(yàn)主要是模型的有效性。一個(gè)模型是否顯著有效主要看提取的信息是否充分。
一個(gè)好的擬合模型應(yīng)該能夠提取觀察值序列中幾乎所有的樣本相關(guān)信息鳍烁,即殘差序列應(yīng)該為白噪聲序列蔚叨。這樣的模型稱(chēng)為顯著有效模型。
反之粥诫,如果殘差序列為非白噪聲序列油航,那就意味著序列中還殘留著相關(guān)信息未被提取,這就說(shuō)明擬合模型不夠有效怀浆,通常需要選擇其他模型谊囚,重新擬合。因此执赡,模型的顯著性檢驗(yàn)就是殘差序列的白噪聲檢驗(yàn)镰踏。
1.AR(p)模型檢驗(yàn)
檢驗(yàn)1950—2008年我國(guó)郵路及農(nóng)村投遞線路每年新增里程數(shù)序列擬合模型的顯著性。
mileage<-read.table("mileage.txt",header=T)
miles<-ts(mileage[2],start=1950)
x.fit<-arima(miles,order=c(2,0,0),method="ML")
##對(duì)殘差x.fit$residual進(jìn)行白噪聲檢驗(yàn)
for(i in 1:2) print(Box.test(x.fit$residual,lag=6*i))
結(jié)果如下:
P>0.05,接受原假設(shè)沙合,即殘差為白噪聲奠伪,所以擬合模型顯著有效。
2.MA(q)模型檢驗(yàn)
檢驗(yàn)美國(guó)科羅拉多州某一加油站連續(xù)57天的 OVERSHORT 序列擬合模型的顯著性首懈。
ver<-read.table("overshort.txt",header=T)
overshort<-ts(over[2],start=1)
overshort.fit<-arima(overshort,order=c(0,0,1))
##對(duì)殘差overshort.fit.fit$residual進(jìn)行白噪聲檢驗(yàn)
for(i in 1:2) print(Box.test(overshort.fit$residual,lag=6*i))
結(jié)果如下:
P>0.05,接受原假設(shè)绊率,即殘差為白噪聲,所以擬合模型顯著有效究履。
3.ARMA(p,q)模型檢驗(yàn)
檢驗(yàn)1880—1985年全球氣表平均溫度改變值差分序列擬合模型的顯著性滤否。
a<-read.table("average_temp.txt",header=T)
a<-ts(a[2],start=1880)
a.fit<-arima(a,order=c(1,1,1),method="CSS")
for(i in 1:2) print(Box.test(a.fit$residual,lag=6*i))
結(jié)果如下:
P>0.05,接受原假設(shè),即殘差為白噪聲挎袜,所以擬合模型顯著有效顽聂。
02
參數(shù)的顯著性檢驗(yàn)
參數(shù)的顯著性檢驗(yàn)就是要檢驗(yàn)每一個(gè)未知參數(shù)是否顯著非零。這個(gè)檢驗(yàn)的目的是使模型最精簡(jiǎn)盯仪。
如果某個(gè)參數(shù)不顯著紊搪,即表示該參數(shù)所對(duì)應(yīng)的那個(gè)自變量對(duì)因變量的影響不明顯,該自變量可以從擬合模型中剔除全景。最終模型將由一系列參數(shù)顯著非零的自變量表示耀石。
R 軟件不提供參數(shù)的顯著檢驗(yàn)結(jié)果,一般默認(rèn)輸出參數(shù)顯著非零爸黄。如果用戶(hù)想獲得參數(shù)檢驗(yàn)統(tǒng)計(jì)量的P值滞伟,需要自己計(jì)算參數(shù)的t統(tǒng)計(jì)量的值及統(tǒng)計(jì)量的P值揭鳞。
調(diào)用t分布P值函數(shù)pt即可獲得t統(tǒng)計(jì)量的P值。
pt函數(shù)的命令格式為:
pt(t,df=,lower.tail=)
-t:統(tǒng)計(jì)量的值
-df:自由度
-lower.tail:計(jì)算概率的方向
-lower.tail =T 計(jì)算Pr(X<=x)(對(duì)于參數(shù)顯著檢驗(yàn)梆奈,如果參數(shù)估計(jì)值為負(fù)野崇,選擇lower.tail =T )
lower.tail =F 計(jì)算Pr(X>x)(對(duì)于參數(shù)顯著檢驗(yàn),如果參數(shù)估計(jì)值為正亩钟,選擇lower.tail =F)
1.AR(p)模型參數(shù)檢驗(yàn)
檢驗(yàn)1950—2008年我國(guó)郵路及農(nóng)村投遞線路每年新增里程數(shù)序列擬合模型參數(shù)的顯著性乓梨。
x<-ts(a$kilometer,start=1950)
x.fit<-arima(x,order = c(2,0,0),method = "ML")
x.fit
結(jié)果如下:
#ar1系數(shù)顯著性檢驗(yàn)
t1<-0.7185/0.1083
pt(t1,df=56,lower.tail = F)
結(jié)果如下:
#ar2系數(shù)顯著性檢驗(yàn)
t2<-0.5294/0.1067
pt(t2,df=56,lower.tail = T)
結(jié)果如下:
#ar3系數(shù)顯著性檢驗(yàn)
t0=11.0223/3.0906
pt(t0,df=56,lower.tail = F)
結(jié)果如下:
參數(shù)檢驗(yàn)結(jié)果顯示,三個(gè)系數(shù)均顯著非零清酥,說(shuō)明模型參數(shù)有統(tǒng)計(jì)學(xué)意義扶镀。
時(shí)間序列之模型檢驗(yàn)的內(nèi)容就講到這里,大家有任何疑問(wèn)都可以加入我們的QQ群:生物統(tǒng)計(jì)學(xué)習(xí)討論群:938773609焰轻。期待我們的再次相約臭觉。