學(xué)習(xí)書目:Introduction to Time Series and Forecasting ----Brockwell&Davis
1.定義
時間序列:時間序列是一系列在不同的特定時間記錄下來的數(shù)據(jù)。通常這些數(shù)據(jù)會顯示出趨勢泻蚊,季節(jié)性還有隨機(jī)性栅哀。
時間序列模型:時間序列模型通常是具體描述時間序列的聯(lián)合分布(可能只是均值和協(xié)方差)。
注:在研究時間序列的時候通常我們只關(guān)注一階矩和二階矩(EXt,EXtXt+h)性質(zhì)(second-order properties)而账,一來是因?yàn)樵谔囟ㄇ闆r下胰坟,二階性質(zhì)就決定了聯(lián)合分布,二來是因?yàn)樽钚【秸`差的線性預(yù)測只取決于隨機(jī)變量的二階性質(zhì)泞辐。
季節(jié)性(seasonality):時間序列的季節(jié)性是指序列有周期變化笔横,比如說事故死亡人數(shù)在按年周期波動,每年七月最多咐吼,二月最少吹缔。季節(jié)性可以用多個sine曲線加總來進(jìn)行擬合。
2.時間序列模型的一般方法
- 畫出序列圖锯茄,檢查圖的特點(diǎn)厢塘,尤其是否有以下特征:
- a trend 趨勢
- a seasonal component 季節(jié)性
- any apparent sharp changes in behavior 急劇變化 --分成幾個同質(zhì)片段來研究
- any outlying observations 偏離 --是否有理由丟棄這個數(shù)據(jù)
- 去除趨勢和季節(jié)性茶没,以獲得平穩(wěn)殘差
(這里需要對數(shù)據(jù)進(jìn)行預(yù)先的變換,比如說如果波動幅度的線性變大晚碾,那么可以使用ln變換抓半;去除趨勢和季節(jié)性還可以使用差分。) - 選擇模型擬合殘差格嘁,使用各種樣本統(tǒng)計量琅关,包括樣本自相關(guān)函數(shù)。
- 預(yù)測讥蔽。 先預(yù)測殘差值涣易,然后再做逆變換得到原始數(shù)據(jù)的預(yù)測值。
3. 平穩(wěn)序列
注:嚴(yán)平穩(wěn)序列要求對任意整數(shù)h聯(lián)合分布一樣冶伞,我們一般講平穩(wěn)指的是寬平穩(wěn)新症,除非特別說明是嚴(yán)平穩(wěn)。
4. 樣本自相關(guān)函數(shù)
4.1 ACF 定義
通常來講我們是從觀測數(shù)據(jù)開始研究的响禽,為了衡量觀測數(shù)據(jù)的相關(guān)性徒爹,并且選擇合適的模型來描述數(shù)據(jù),我們使用一個重要的工具:樣本自相關(guān)函數(shù)(sample ACF)芋类。
如果我們相信這些數(shù)據(jù)是平穩(wěn)序列的值隆嗅,那么樣本自相關(guān)函數(shù)能夠提供給我們序列的自相關(guān)函數(shù)的估計。例如侯繁,如果樣本的自相關(guān)函數(shù)對于任何非零延遲來講都是接近于0的胖喳,那就表明這個數(shù)據(jù)適合的模型很可能是獨(dú)立同分布的噪音。
注: 這里的樣本自協(xié)方差函數(shù)是除以n贮竟,為什么不是除以n-h呢丽焊?參照以下答案:
https://stats.stackexchange.com/questions/56238/question-about-sample-autocovariance-function
主要原因是除以n得到的協(xié)方差矩陣是非負(fù)正定的(非負(fù)正定是協(xié)方差矩陣的性質(zhì)之一,所以樣本協(xié)方差也要保留這樣的性質(zhì))咕别,除以n-h得到的協(xié)方差矩陣很可能是奇異矩陣技健;另外我們關(guān)心的是h遠(yuǎn)小于n時的情況,在這種情況下惰拱,除以n和除以n-h的差別不大雌贱。
4.2 ACF用處
- 如果數(shù)據(jù)包含趨勢,那么自相關(guān)函數(shù)會隨著延遲h的增大而減小
- 自相關(guān)函數(shù)會表現(xiàn)出和原數(shù)據(jù)一樣的周期性
5.估計和消除趨勢項(xiàng)偿短、季節(jié)項(xiàng)
我們的目的是通過消除趨勢項(xiàng)和季節(jié)項(xiàng)來獲得平穩(wěn)序列欣孤,然后就可以對平穩(wěn)序列使用合適的模型。
有兩種方法消除趨勢和季節(jié)性:
1)估計出趨勢翔冀、季節(jié)項(xiàng)
2)通過差分的方式得到新的平穩(wěn)序列
5.1 消除趨勢項(xiàng)(沒有季節(jié)性)
- 方法一:估計趨勢
移動平均和光譜平滑是重要的估計趨勢的非參數(shù)方法导街。
(a)Smoothing with a finite moving average filter.有限移動平均平滑
因?yàn)閅t的均值為0披泪,所以在使用移動平均的時候可以將Yt消除纤子,從而
注:移動平均過濾子實(shí)際上就是利用了線性趨勢函數(shù)求和再平均后數(shù)據(jù)值不改變,而Yt的均值為0 的性質(zhì)來消除了該隨機(jī)變量對數(shù)據(jù)的影響,僅僅保留下了趨勢控硼。
(b)Exponential smoothing 指數(shù)平滑
(c)Smoothing by elimination of high-frequency components.
(d)polynomial fitting多項(xiàng)式擬合
- 方法二:差分消除趨勢
5.2 同時消除趨勢和季節(jié)性
- 方法一:估計趨勢和季節(jié)性
- 方法二:差分
6.測試殘差序列是否是獨(dú)立同分布隨機(jī)變量
我們做數(shù)據(jù)轉(zhuǎn)換的目的是為了獲得沒有趨勢沒有季節(jié)性也沒有明顯偏離的平穩(wěn)殘差序列泽论。這一步完成后,我們就要對殘差序列進(jìn)行建模卡乾。
如果序列之間沒有顯著依賴性翼悴,那么我們就可以認(rèn)為是獨(dú)立隨機(jī)變量,從而只需要估計均值和方差幔妨;但如果殘差之間是有依賴性的鹦赎,那么我們需要尋找更復(fù)雜的平穩(wěn)時間序列模型來解釋這種依賴性。這種依賴性也意味著過去的噪音序列值可以幫助我們預(yù)測未來的值误堡。
下面介紹幾種測試殘差序列是否是獨(dú)立同分布隨機(jī)變量的方法
- (a)樣本自相關(guān)函數(shù).
- (b) The portmanteau test.
- (c) The turning point test.
- (d) The difference-sign test.
- (e) The rank test.
- (f) Fitting an autoregressive model.
- (g) Checking for normality.