在最開始,我首先給出一個(gè)原始序列妓局,序列并沒有任何意義总放,藍(lán)線為原始序列,黃線為其線性回歸好爬,可以看到序列有一個(gè)明顯的線性上升的趨勢(shì)局雄,并且序列有很強(qiáng)的年際變化和年代際變化特征。
去趨勢(shì)
研究長(zhǎng)時(shí)間的氣候變化會(huì)發(fā)現(xiàn)很多序列是帶有趨勢(shì)的存炮,有部分觀點(diǎn)認(rèn)為這是認(rèn)為因素造成全球變暖導(dǎo)致的炬搭,研究本身的大氣變化需要去掉序列的趨勢(shì),簡(jiǎn)單來說就是序列的每一個(gè)點(diǎn)都減去序列趨勢(shì)的回歸斜率乘以一個(gè)時(shí)間步長(zhǎng)穆桂,當(dāng)然前提是這個(gè)序列的線性趨勢(shì)是顯著的宫盔。還有一個(gè)要注意的是去趨勢(shì)序列(若干年長(zhǎng)度的序列)并不等于該序列的年際變化,獲得年際變化分量需要去用濾波或者其他方法單獨(dú)提取享完,我目前看到的大部分文獻(xiàn)中的去趨勢(shì)都是為了剔除人為因素造成的全球變暖灼芭。
scipy直接提供了一個(gè)去趨勢(shì)函數(shù),十分的方便般又。
scipy.signal.detrend(data, axis=-1, type='linear', bp=0, overwrite_data=False)
#data:輸入數(shù)據(jù)彼绷,可以為任意維度
#axis,指定對(duì)哪一維度去趨勢(shì)
#type茴迁,可設(shè)置為'linear'即為去線性趨勢(shì)寄悯,設(shè)置為'constant',則為去平均值堕义,即為求距平
#bp热某,斷點(diǎn),若設(shè)置,則為斷點(diǎn)兩側(cè)分別去趨勢(shì)昔馋,即將序列分成兩個(gè)子序列各自計(jì)算
#overwrite_data筹吐,是否覆蓋原數(shù)據(jù)
對(duì)上邊的序列去線性趨勢(shì)(紅色為原始序列,藍(lán)色為去趨勢(shì)后序列):
time_series_dtrend = signal.detrend(time_series, axis=0, type='linear',
bp=0, overwrite_data=False)
plt.plot(x,time_series_dtrend,c = "b")
plt.plot(x,time_series,c = "r")
濾波
濾波有很多濾波器秘遏,我這里只給出其中一種丘薛,仍是scipy.signal提供的Butterworth(巴特沃斯)濾波器。
scipy.signal.butter(N, Wn, btype='low')
#N: 濾波器階數(shù)
#Wn:臨界頻率
#btype:濾波器類型邦危,{‘lowpass’, ‘highpass’, ‘bandpass’, ‘bandstop’}分別為高通洋侨,低通,帶通倦蚪,帶阻希坚。
#比如50年序列,提取年代際用低通陵且,提取年際用高通
那比如說我們要對(duì)上邊的原始序列分別提取年代際分量裁僧,我們的采樣頻率是1年,1個(gè)年代際周期是10年慕购,也就是頻率為0.1聊疲,那么截至頻率Wn=2*0.1/1=0.2,比如我們構(gòu)造一個(gè)8階Butterworth低通濾波器沪悲,那么
b, a = signal.butter(8, 0.2, 'lowpass')
#b,a分別為分子和分母系數(shù)获洲,用法請(qǐng)繼續(xù)往下看
濾波器構(gòu)造好后就可以對(duì)原序列濾波了,這時(shí)候使用到濾波函數(shù)
scipy.signal.filtfilt(b, a, x, axis=-1)
#這時(shí)我們就用到了a和b
#X為要濾波的序列
#axis指定對(duì)哪一維濾波
完整的濾波:
b, a = signal.butter(8, 0.2, 'lowpass')
time_series_filt = signal.filtfilt(b, a, time_series,axis = 0)
plt.plot(x,time_series_filt,c = "r")
雖然看起來很奇怪殿如,但是確實(shí)是這樣贡珊,我給出九年滑動(dòng)平均來對(duì)比(藍(lán)色為原始序列,紅色為低通濾波涉馁,黑色為九年滑動(dòng)平均):
所以這就不難發(fā)現(xiàn)為什么很多人用九年滑動(dòng)平均代替年代際分量门岔,因?yàn)榇_實(shí)結(jié)果差不多,實(shí)際上從原理來講我認(rèn)為滑動(dòng)平均也可以算是一種濾波了谨胞。至于為什么濾波的結(jié)果這么平滑固歪,這是濾波器的階數(shù)造成的蒜鸡,降低濾波器的階數(shù)就可以了胯努。
滑動(dòng)平均
最后部分給出滑動(dòng)平均的方法,前陣子我在一個(gè)群里看到有人問逢防,實(shí)際上python的滑動(dòng)平均是被卷積函數(shù)代替的叶沛。通過構(gòu)造一個(gè)卷積核來實(shí)現(xiàn)權(quán)重滑動(dòng)平均,在這一點(diǎn)上忘朝,它的用法是比NCL中的smooth函數(shù)更廣泛的灰署。我們以等權(quán)重九年滑動(dòng)平均舉例(卷積的概念就不細(xì)講了,感興趣的可以百度,大致理解為滑動(dòng)也是可以的溉箕。):
#首先構(gòu)造一個(gè)等權(quán)重的卷積核晦墙,這個(gè)卷積核規(guī)定了滑動(dòng)長(zhǎng)度為9,每個(gè)點(diǎn)的權(quán)重是等權(quán)重的1/9
a = np.repeat(1/9, 9)
#卷積運(yùn)算(滑動(dòng)平均)
time_series_9 = np.convolve(time_series, a, mode='same')
#這里的mode是設(shè)置滑動(dòng)后序列兩端值的 參數(shù)有{‘full’, ‘valid’, ‘same’}
#‘full’ 默認(rèn)值肴茄,返回每一個(gè)卷積值晌畅,長(zhǎng)度是N+M-1,在卷積的邊緣處,信號(hào)不重疊寡痰,存在邊際效應(yīng)抗楔,實(shí)際上是擴(kuò)充了兩端數(shù)值,通常不選這個(gè)選項(xiàng)拦坠。
#‘same’ 返回的數(shù)組長(zhǎng)度為max(M, N),邊際效應(yīng)依舊存在连躏。得到序列與原始序列長(zhǎng)度一樣。
#‘valid’ 兩端缺失贞滨,不自動(dòng)補(bǔ)全入热。