用于流量預(yù)測(cè)的時(shí)序圖卷積
問(wèn)題背景:交通流量預(yù)測(cè)嘱腥。
提出模型:為了同時(shí)捕獲空間和時(shí)間相關(guān)性俱饿,提出了時(shí)間圖卷積網(wǎng)絡(luò)(T-GCN)模型阀捅,即將圖卷積網(wǎng)絡(luò)(GCN)和GRU結(jié)合陨溅。GCN用于學(xué)習(xí)復(fù)雜的拓?fù)浣Y(jié)構(gòu)以捕獲空間依賴性壹无,而GRU用于學(xué)習(xí)交通數(shù)據(jù)的動(dòng)態(tài)變化以捕獲時(shí)間依賴性葱绒。T-GCN的代碼:GitHub - lehaifeng/T-GCN: Temporal Graph Convolutional Network for Urban Traffic Flow Prediction Method
現(xiàn)有的流量預(yù)測(cè)方法:自回歸綜合移動(dòng)平均(ARIMA)模型,SVM 和部分神經(jīng)網(wǎng)絡(luò)斗锭,考慮了交通的動(dòng)態(tài)變化而忽略了空間依賴性地淀。為了更好地刻畫(huà)空間特征,引入CNN進(jìn)行空間建模岖是。然而帮毁,CNN通常用于歐氏數(shù)據(jù),如圖像豺撑,規(guī)則網(wǎng)格等烈疚。CNN無(wú)法描述具有復(fù)雜拓?fù)浣Y(jié)構(gòu)的城市道路網(wǎng)絡(luò)的空間依賴性。
本文貢獻(xiàn):
(1)T-GCN集成GCN和GRU聪轿。GCN用于捕獲道路網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)爷肝,對(duì)空間依賴性進(jìn)行建模。 GRU用于捕獲道路上交通數(shù)據(jù)的動(dòng)態(tài)變化陆错,對(duì)時(shí)間依賴性進(jìn)行建模灯抛。?
(2)T-GCN模型不僅可以短期預(yù)測(cè),還可以用于長(zhǎng)期的交通預(yù)測(cè)任務(wù) 音瓷。
方法
定義1:G=(V,E). V-N個(gè)road節(jié)點(diǎn)对嚼,E-邊,鄰接矩陣表示road節(jié)點(diǎn)的連接绳慎,元素為0/1猪半。
定義2:特征矩陣,P表示node屬性特征的數(shù)量(歷史時(shí)間序列的長(zhǎng)度)偷线。
通過(guò)學(xué)得一個(gè)映射函數(shù)f磨确,根據(jù)圖G和特征矩陣X,計(jì)算接下來(lái)T個(gè)時(shí)間步的預(yù)測(cè)值:
,n為歷史時(shí)序長(zhǎng)度声邦。
空間依賴建模:
給定鄰接矩陣A和特征矩陣X乏奥,GCN會(huì)在傅立葉域中構(gòu)造一個(gè)濾波器。 過(guò)濾器作用在圖的節(jié)點(diǎn)上亥曹,通過(guò)其一階鄰域捕獲節(jié)點(diǎn)之間的空間特征邓了,然后通過(guò)堆疊多個(gè)卷積層構(gòu)建GCN,其表示:
為第l層輸出媳瞪,為第l層參數(shù)骗炉,.
本論文用兩層GCN獲取空間依賴信息:
表示前向傳播,是輸入層→輸出層的權(quán)重矩陣蛇受,H為隱藏單元個(gè)數(shù)句葵,P為特征矩陣長(zhǎng)度。是隱藏層→輸出層的權(quán)重矩陣,乍丈,T為預(yù)測(cè)長(zhǎng)度剂碴。
時(shí)間依賴建模:
選用GRU的原因:LSTM訓(xùn)練時(shí)間較長(zhǎng),GRU結(jié)構(gòu)相對(duì)簡(jiǎn)單轻专,參數(shù)較少忆矛,訓(xùn)練能力較快。
損失函數(shù):
.為L(zhǎng)2范數(shù)催训,防止過(guò)擬合。
實(shí)驗(yàn)設(shè)置
數(shù)據(jù)集:1.深圳出租車宗收。156條道路(節(jié)點(diǎn))漫拭,每15min匯總流量速度。鄰接矩陣A[156,156], 特征矩陣 X[156,15]镜雨。2.Los-loop嫂侍。A[207,207],X [207,5]。
數(shù)據(jù)集劃分:80%-訓(xùn)練荚坞,20%-測(cè)試挑宠。
預(yù)測(cè):15,30颓影,45各淀,60min后的流量速度。
評(píng)價(jià)指標(biāo):RMSE诡挂,MAE碎浇,accuracy,R^2, var
RMSE和MAE來(lái)測(cè)量預(yù)測(cè)誤差:值越小苟穆,預(yù)測(cè)效果越好。 精度用于檢測(cè)預(yù)測(cè)精度:值越大唱星,預(yù)測(cè)效果越好雳旅。 R2和var計(jì)算相關(guān)系數(shù),該系數(shù)表示預(yù)測(cè)實(shí)際數(shù)據(jù)的能力:值越大间聊,預(yù)測(cè)效果越好攒盈。
超參數(shù):lr=0.001,batchsize=32哎榴,epoch=5000. hidden units={8,16,32,64,100,128}. 優(yōu)化器Adam.
Baseline: ARIMA, SVR, GCN,GRU.
實(shí)驗(yàn)結(jié)果
1.5個(gè)度量標(biāo)準(zhǔn)結(jié)果比較
2.時(shí)空預(yù)測(cè)能力--與GCN, GRU比較
3.長(zhǎng)期預(yù)測(cè)能力--不同預(yù)測(cè)長(zhǎng)度的比較
4.擾動(dòng)分析和魯棒性
5.可解釋性
(1)T-GCN模型在局部最小值/最大值處預(yù)測(cè)不佳。推測(cè):GCN在傅立葉域中定義平滑濾波器般妙,并通過(guò)不斷移動(dòng)濾波器來(lái)捕獲空間特征纪铺,這個(gè)導(dǎo)致峰變得更平滑。
(2)實(shí)際交通信息與預(yù)測(cè)結(jié)果之間存在一定的誤差碟渺,這是由“零出租車值”引起的鲜锚。出租車零值是將真實(shí)值不為零的交通特征矩陣設(shè)置為零的現(xiàn)象。
(3)T-GCN模型可以捕獲時(shí)空特征并學(xué)習(xí)變化趨勢(shì)苫拍,可以檢測(cè)高峰時(shí)間的開(kāi)始和結(jié)束芜繁,并以與實(shí)際交通速度相似的模式得出預(yù)測(cè)結(jié)果。