時間序列筆記-自相關(guān)

筆記說明

在datacamp網(wǎng)站上學習“Time Series with R ”track
“Introduction to Time Series Analysis”課程 做的對應(yīng)筆記。
學識有限舞吭,錯誤難免睛挚,還請不吝賜教纳击。
如無特殊說明,筆記中所使用數(shù)據(jù)均來自datacamp課程

自協(xié)方差與自相關(guān)

自相關(guān)(autocorrelation or lagged correlation)用于評估時間序列數(shù)據(jù)是否依賴于其過去的數(shù)據(jù)帐我。
假設(shè)時間序列是弱平穩(wěn)的:Y_t與Y_{t+h}之間的相關(guān)系數(shù)記為ρ(h)槽卫,函數(shù)ρ稱為自相關(guān)函數(shù)(autocorrelation function, ACF)
與之類似,自協(xié)方差函數(shù)用γ(h)表示

  • γ(0)=σ^2
  • γ(h)=σ^2ρ(h)
  • ρ(h)=γ(h)/σ^2=γ(h)/γ(0)

設(shè)Y_1,...,Y_n滿足弱平穩(wěn)過程擦囊。

  • 用樣本均值\overline y估計總體均值μ,用樣本方差s^2估計總體方差σ^2
  • 用樣本自協(xié)方差函數(shù)估計總體自協(xié)方差函數(shù)嘴办,樣本自協(xié)方差函數(shù):
    ??\hat γ(h)=n^{-1}\sum_{t=1}^{n-h}(Y_{t+h}-\overline y)(Y_{t}-\overline y)=n^{-1}\sum_{t=h+1}^{n}(Y_{t}-\overline y)(Y_{t-h}-\overline y)
    另外一種計算版本用(n-h)^{-1}替代上式中的n^{-1}瞬场,當n相對大而h相對小時,這兩種計算方法間的差異是很小的涧郊。
    (這里我感覺用n-h做分母,和協(xié)方差計算公式保持一致更加合理)
  • 用樣本自相關(guān)函數(shù)(sample ACF)估計ρ(·)贯被,樣本自相關(guān)函數(shù)定義為:
    ??????\hat ρ(h)=\frac {\hat γ(h)} {\hat γ(0)}

用cov()函數(shù)手動計算自相關(guān)系數(shù)

設(shè)有例數(shù)為n的時間序列數(shù)據(jù)x,按照自相關(guān)函數(shù)的定義妆艘,以計算\hat ρ(1)為例彤灶,我們可以手動構(gòu)造計算自相關(guān)系數(shù)的成對數(shù)據(jù),x_t0 x_t1對應(yīng)x[t],x[t-1]批旺,然后用cor()函數(shù)計算\hat ρ(1)幌陕,本例中n=150:

本例數(shù)據(jù)

# Define x_t0 as x[-1]
x_t0 <- x[-1]

# Define x_t1 as x[-n]
x_t1 <- x[-150]

# Confirm that x_t0 and x_t1 are (x[t], x[t-1]) pairs  
head(cbind(x_t0, x_t1))
  
# Plot x_t0 and x_t1
plot(x_t0, x_t1)

# View the correlation between x_t0 and x_t1
cor(x_t0, x_t1)
plot(x_t0, x_t1)

cor(x_t0, x_t1)輸出為:0.7630314

用acf()函數(shù)計算自相關(guān)系數(shù)

acf(..., lag.max =1, plot = FALSE)函數(shù)可以用來計算lag為1的自相關(guān)系數(shù):

acf(x, lag.max = 1, plot = F)

acf()函數(shù)輸出中l(wèi)ag為1的自相關(guān)系數(shù)為0.758

可以看出我們手動計算的結(jié)果和acf()函數(shù)計算的結(jié)果略有不同。這是因為acf()使用的是用n作為分母的計算版本而手動計算利用cov()函數(shù)使用的是用n-h(這里h=1)作為分母的計算版本汽煮。
acf()函數(shù)以n作為分母的計算方法算出的自相關(guān)系數(shù)是有偏的搏熄,但是在時間序列分析中更常用(preferred)棚唆。

驗證兩種計算方法相差一個因子:(n-h)/n

# Confirm that difference factor is (n-1)/n
cor(x_t1, x_t0) * (n-1)/n
acf(x, lag.max = 1, plot = F)[1][[1]]

cor(x_t1, x_t0) * (n-1)/n輸出結(jié)果為0.7579445.
acf(x, lag.max = 1, plot = F)[1][[1]]輸出結(jié)果為0.7579761
看來除了課程中提到的計算版本分母不同以外這兩種計算方法還有其他的差異導致計算結(jié)果在考慮到分母問題以后仍然有一點點微小的不同。

關(guān)于acf()函數(shù)的更多內(nèi)容

acf(..., lag.max = ..., plot = FALSE)函數(shù)會計算h=0,1,2...直到lag.max參數(shù)指定值對應(yīng)的自相關(guān)系數(shù)心例。
此外宵凌,acf()函數(shù)的plot選項默認為TRUE,可以生成自相關(guān)圖契邀,自相關(guān)圖會顯示各lag值對應(yīng)的自相關(guān)系數(shù)摆寄,并用藍色水平虛線表示自相關(guān)系數(shù)為0的95%置信區(qū)間邊界線,如果自相關(guān)系數(shù)在兩條虛線以內(nèi)則表明自相關(guān)系數(shù)沒有統(tǒng)計學意義坯门。
例子數(shù)據(jù):x顯示出強持續(xù)性(persistence),即時間序列的值與前一測量值呈現(xiàn)出強相關(guān)性逗扒;y具有周期性古戴,周期大約為4;z則沒有明確的模式矩肩。



對上面三個時間序列使用acf()函數(shù):

# View the ACF of x y z
acf(x)

acf(y)

acf(z)
x對前幾個lag顯示出強正相關(guān)性现恼,后快速消減趨于0

y對4的倍數(shù)值的lag顯示出強正相關(guān)性

z對除0外的所有l(wèi)ag的相關(guān)性都接近0
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市黍檩,隨后出現(xiàn)的幾起案子叉袍,更是在濱河造成了極大的恐慌,老刑警劉巖刽酱,帶你破解...
    沈念sama閱讀 207,248評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件喳逛,死亡現(xiàn)場離奇詭異,居然都是意外死亡棵里,警方通過查閱死者的電腦和手機润文,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評論 2 381
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來殿怜,“玉大人典蝌,你說我怎么就攤上這事⊥访眨” “怎么了骏掀?”我有些...
    開封第一講書人閱讀 153,443評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長柱告。 經(jīng)常有香客問我截驮,道長,這世上最難降的妖魔是什么末荐? 我笑而不...
    開封第一講書人閱讀 55,475評論 1 279
  • 正文 為了忘掉前任侧纯,我火速辦了婚禮,結(jié)果婚禮上甲脏,老公的妹妹穿的比我還像新娘眶熬。我一直安慰自己妹笆,他們只是感情好,可當我...
    茶點故事閱讀 64,458評論 5 374
  • 文/花漫 我一把揭開白布娜氏。 她就那樣靜靜地躺著拳缠,像睡著了一般。 火紅的嫁衣襯著肌膚如雪贸弥。 梳的紋絲不亂的頭發(fā)上窟坐,一...
    開封第一講書人閱讀 49,185評論 1 284
  • 那天,我揣著相機與錄音绵疲,去河邊找鬼哲鸳。 笑死,一個胖子當著我的面吹牛盔憨,可吹牛的內(nèi)容都是我干的徙菠。 我是一名探鬼主播,決...
    沈念sama閱讀 38,451評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼郁岩,長吁一口氣:“原來是場噩夢啊……” “哼婿奔!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起问慎,我...
    開封第一講書人閱讀 37,112評論 0 261
  • 序言:老撾萬榮一對情侶失蹤萍摊,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后如叼,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體冰木,經(jīng)...
    沈念sama閱讀 43,609評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,083評論 2 325
  • 正文 我和宋清朗相戀三年薇正,在試婚紗的時候發(fā)現(xiàn)自己被綠了片酝。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,163評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡挖腰,死狀恐怖雕沿,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情猴仑,我是刑警寧澤审轮,帶...
    沈念sama閱讀 33,803評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站辽俗,受9級特大地震影響疾渣,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜崖飘,卻給世界環(huán)境...
    茶點故事閱讀 39,357評論 3 307
  • 文/蒙蒙 一榴捡、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧朱浴,春花似錦吊圾、人聲如沸达椰。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽啰劲。三九已至,卻和暖如春檀何,著一層夾襖步出監(jiān)牢的瞬間蝇裤,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評論 1 261
  • 我被黑心中介騙來泰國打工频鉴, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留栓辜,地道東北人。 一個月前我還...
    沈念sama閱讀 45,636評論 2 355
  • 正文 我出身青樓砚殿,卻偏偏與公主長得像啃憎,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子似炎,可洞房花燭夜當晚...
    茶點故事閱讀 42,925評論 2 344

推薦閱讀更多精彩內(nèi)容

  • 本章涉及知識點:1、時間序列分析2悯姊、平穩(wěn)時間序列3羡藐、白噪聲4、AR自回歸模型5悯许、MA滑動平均模型6仆嗦、ARMA模型7...
    PrivateEye_zzy閱讀 13,345評論 1 7
  • 第一節(jié) 平穩(wěn)時間序列 什么可以對一個時間序列進行完整地描述?為什么在實際中我們極少用到它先壕?概率分布族瘩扼;實際應(yīng)用中,...
    廓然寄暢閱讀 1,874評論 0 3
  • 基礎(chǔ)定義 1垃僚、方差:在統(tǒng)計描述中集绰,方差用來計算每一個變量(觀察值)與總體均數(shù)之間的差異。為避免出現(xiàn)離均差總和為零谆棺,...
    叢小賤閱讀 4,371評論 0 0
  • 來源: http://www.douban.com/group/topic/14820131/ 調(diào)整變量格式: f...
    MC1229閱讀 6,907評論 0 5
  • 最不愿接受的事實栽燕,在眼前…… 求生的欲望,必定勝天改淑! 今天轉(zhuǎn)院碍岔,沒有導流。我們姊妹三個一起陪老媽坐動車去太原朵夏,我哥...
    勁汶閱讀 231評論 0 0