前面草堂君已經(jīng)按照時間序列分析的教學順序推送了以下文章损离,大家可以直接點擊下方文章名稱閱讀回顧:
在以上這些文章中州泊,介紹了什么是時間序列以及時間序列分析的作用丧蘸、時間序列的描述、時間序列的變動成分組成遥皂、如何用指數(shù)平滑模型分析帶有長期趨勢和季節(jié)變動兩種變動成分的時間序列力喷。可惜的是演训,事實總比想象來得復雜弟孟,很多時間序列的變動成分組成并不能直接通過時間序列圖看出來,這個時候样悟,通過時間序列分解的方法分析時間序列就不太合適了拂募,而且準確性也會大打折扣庭猩。
因為傳統(tǒng)時間序列分析技術(時間序列分解法)的缺陷,所以統(tǒng)計學家開發(fā)出更為通用的時間序列分析方法陈症,其中AR/MA/ARMA/ARIMA在這個發(fā)展過程中扮演了非常重要的角色蔼水,直到現(xiàn)在,它們都在實際工作生活中發(fā)揮重要作用录肯。這四種分析方法的共同特點都是跳出變動成分的分析角度趴腋,從時間序列本身出發(fā),力求得出前期數(shù)據(jù)與后期數(shù)據(jù)的量化關系论咏,從而建立前期數(shù)據(jù)為自變量于样,后期數(shù)據(jù)為因變量的模型,達到預測的目的潘靖。來個通俗的比喻,大前天的你蚤蔓、前天的你卦溢、昨天的你造就了今天的你。
雖然AR/MA/ARMA/ARIMA是四種可以獨立使用的分析方法秀又,但是它們其實是互補的關系单寂,適用于包含不同變動成分的時間序列。由于這四種分析方法涉及的原理解釋起來需要大量篇幅吐辙,所以草堂君在這里做通俗介紹宣决。
通俗介紹四種時間序列分析法之前,需要先回顧前面介紹的一個知識點昏苏,平穩(wěn)時間序列和非平穩(wěn)時間序列尊沸,AR/MA/ARMA用于分析平穩(wěn)時間序列,ARIMA通過差分可以用于處理非平穩(wěn)時間序列贤惯。平穩(wěn)時間序列和非平穩(wěn)時間序列如下面兩幅圖所示:
左邊的圖是工業(yè)生產(chǎn)中的溫度時間序列洼专,它是圍繞一個常數(shù)上下波動的,也就是計算時間序列所有數(shù)值的平均值孵构,會等于這個常數(shù)屁商。工業(yè)生產(chǎn)中對液面、壓力颈墅、溫度的控制過程蜡镶;某地的氣溫變化過程;某條河流的水位變化過程基本都屬于平穩(wěn)時間序列恤筛。
右邊的圖是中國外匯儲備額的時間序列官还,可以發(fā)現(xiàn)這個時間序列是有持續(xù)增長的,先慢后快毒坛,這是一個非平穩(wěn)時間序列妻枕。在經(jīng)濟領域,例如一個國家的GDP、進出口額的時間序列基本都是非平穩(wěn)時間序列屡谐。
一般具有長期趨勢的時間序列都是非平穩(wěn)時間序列述么。根據(jù)趨勢的不同,可以使用差分將具有長期趨勢的時間序列轉換成平穩(wěn)時間序列愕掏。例如度秘,線性增長的長期趨勢,可以通過一階差分形成新的平穩(wěn)的(消除長期趨勢)時間序列:
例如饵撑,時間序列的數(shù)值為線性增長的(1,2,3,4,5,6,7,8)剑梳,經(jīng)過一階差分以后,新的時間序列的數(shù)值為(1,1,1,1,1,1,1)滑潘,就成為穩(wěn)定的時間序列了垢乙。
根據(jù)長期趨勢的發(fā)展趨勢不同,可以進行差分的次數(shù)和方法也不相同语卤,一般的規(guī)律如下:
一次差分的時間序列數(shù)值大體相同追逮,配合直線趨勢;
二次差分的時間序列數(shù)值大體相同粹舵,配合二次曲線
對數(shù)的一次差分的時間序列數(shù)值大體相同钮孵,配合指數(shù)曲線
一次差分的環(huán)比值大體相同,配合修正指數(shù)曲線
對數(shù)一次差分的環(huán)比值大體相同眼滤,配合Gompertz曲線
倒數(shù)一次差分的環(huán)比值大體相同巴席,配合Logistic曲線
這四種模型的名稱都是它們英文全稱的縮寫。AR模型稱為自回歸模型(Auto Regressive model)诅需;MA模型稱為移動平均模型(Moving Average model)漾唉;ARMA稱為自回歸移動平均模型(Auto Regressive and Moving Average model);ARIMA模型稱為差分自回歸移動平均模型堰塌。
如果某個時間序列的任意數(shù)值可以表示成下面的回歸方程毡证,那么該時間序列服從p階的自回歸過程,可以表示為AR(p):
可以發(fā)現(xiàn)蔫仙,AR模型利用前期數(shù)值與后期數(shù)值的相關關系(自相關)料睛,建立包含前期數(shù)值和后期數(shù)值的回歸方程,達到預測的目的摇邦,因此成為自回歸過程恤煞。這里需要解釋白噪聲,大家可以將白噪聲理解成時間序列數(shù)值的隨機波動施籍,這些隨機波動的總和會等于0居扒,例如前面統(tǒng)計基礎文章中介紹的,某條餅干的自動化生產(chǎn)線丑慎,要求每包餅干為500克喜喂,但是生產(chǎn)出來的餅干產(chǎn)品由于隨機因素的影響瓤摧,不可能精確的等于500克,而是會在500克上下波動玉吁,這些波動的總和將會等于互相抵消等于0照弥。
如果某個時間序列的任意數(shù)值可以表示成下面的回歸方程,那么該時間序列服從q階的移動平均過程进副,可以表示為MA(q):
可以發(fā)現(xiàn)这揣,某個時間點的指標數(shù)值等于白噪聲序列的加權和,如果回歸方程中影斑,白噪聲只有兩項给赞,那么該移動平均過程為2階移動平均過程MA(2)。比較自回歸過程和移動平均過程可知矫户,移動平均過程其實可以作為自回歸過程的補充片迅,解決自回歸方差中白噪聲的求解問題,兩者的組合就成為自回歸移動平均過程皆辽,稱為ARMA模型柑蛇。
自回歸移動平均模型由兩部分組成:自回歸部分和移動平均部分,因此包含兩個階數(shù)膳汪,可以表示為ARMA(p,q),p是自回歸階數(shù)九秀,q為移動平均階數(shù)遗嗽,回歸方程表示為:
從回歸方程可知,自回歸移動平均模型綜合了AR和MA兩個模型的優(yōu)勢鼓蜒,在ARMA模型中痹换,自回歸過程負責量化當前數(shù)據(jù)與前期數(shù)據(jù)之間的關系,移動平均過程負責解決隨機變動項的求解問題都弹,因此娇豫,該模型更為有效和常用。
介紹時間序列平穩(wěn)性時提到過畅厢,AR/MA/ARMA模型適用于平穩(wěn)時間序列的分析冯痢,當時間序列存在上升或下降趨勢時,這些模型的分析效果就大打折扣了框杜,這時差分自回歸移動平均模型也就應運而生浦楣。ARIMA模型能夠用于齊次非平穩(wěn)時間序列的分析,這里的齊次指的是原本不平穩(wěn)的時間序列經(jīng)過d次差分后成為平穩(wěn)時間序列咪辱。
在現(xiàn)實生活中振劳,存在很多非平穩(wěn)的時間序列,它們的均值和方差是隨著時間的變化而變化的油狂,幸運的是历恐,統(tǒng)計學家們發(fā)現(xiàn)寸癌,很多時間序列本身雖然不平穩(wěn),但是經(jīng)過差分(相鄰時間點的指標數(shù)值相減)之后弱贼,形成的新時間序列就變成平穩(wěn)時間序列了蒸苇。因此,差分自回歸移動平均模型寫成ARIMA(p,d,q)哮洽。p代表自回歸階數(shù)填渠;d代表差分次數(shù);q代表移動平均階數(shù)鸟辅。在spss軟件中氛什,有時輸出的ARIMA模型包括6個參數(shù):ARIMA(p,d,q)(P,D,Q),這是因為如果時間序列中包含季節(jié)變動成分的話匪凉,需要首先將季節(jié)變動分解出來枪眉,然后再分別分析移除季節(jié)變動后的時間序列和季節(jié)變動本身。這里小寫的p,d,q描述的是移除季節(jié)變動成分后的時間序列再层;大寫的P,D,Q描述的是季節(jié)變動成分贸铜。兩個部分是相乘的關系。因此聂受,ARIMA(p,d,q)(P,D,Q)也被稱為復合季節(jié)模型蒿秦。
時間序列分析的文章更新到這里,總共介紹了兩個時間序列分析的體系:時間序列分解模型體系和AR/MA/ARMA/ARIMA模型體系蛋济。兩者的分析原理是不同的棍鳖,時間序列分解是力求將時間序列分解成不同的變動成分,分析每種變動成分的規(guī)律碗旅,然后在綜合各種成分的規(guī)律用于預測渡处;AR/MA/ARMA/ARIMA模型體系是從時間序列數(shù)值本身的相關關系出發(fā),將移動平均技術祟辟、相關分析技術和平穩(wěn)技術(差分)等納入模型医瘫,力求建立時間序列數(shù)值之間的回歸方程,從而達到預測的目的旧困。
下篇推送將重點介紹ARIMA模型的分析原理:包括如何確定p醇份,d,q參數(shù)吼具;如何判斷模型的擬合效果被芳;如何利用SPSS做時間序列的ARIMA模型分析。