本次異常監(jiān)測(cè)背景條件為交通數(shù)據(jù)挖掘中的流量-時(shí)間占有率的分析
根據(jù)前輩們的經(jīng)驗(yàn)積累督勺,在交通方面,車輛在較低時(shí)速的時(shí)候會(huì)位置著一個(gè)比較恒定的車頭時(shí)距,但是當(dāng)車輛速度比較大的時(shí)候就不會(huì)維持這一距離了,往往會(huì)根據(jù)自己的個(gè)人喜好決定實(shí)際跟車距離狠鸳,其實(shí)稍微一想揣苏,在現(xiàn)實(shí)中,這種描述確實(shí)很準(zhǔn)確碰煌。做一個(gè)圖的話就是一個(gè)倒V字形舒岸。
對(duì)于將要做的異常監(jiān)測(cè)來(lái)說(shuō)绅作,這是一個(gè)非常重要的先驗(yàn)知識(shí)芦圾,。配合分箱異常檢測(cè)方法(通過(guò)考慮鄰居的值來(lái)平滑存儲(chǔ)數(shù)據(jù)的值)俄认。我們對(duì)f(x)分別進(jìn)行縮小和放大得到fmin(x)和fmax(x)的值作為上界以及下界个少,使得交通流量-時(shí)間占有率盡量分布在max和min之間,而落在之外的即為異常數(shù)據(jù)眯杏。根據(jù)倒V理論夜焦,我們指導(dǎo),在不同的時(shí)間占有率范圍內(nèi)岂贩,車流量的波動(dòng)程度不同茫经,所以我們對(duì)于f(x)進(jìn)行放大和所轄?wèi)?yīng)該一句時(shí)間占有率范圍的不同而不同。
首先將時(shí)間占有率劃分為101個(gè)等分區(qū)間萎津,f(x)上面n個(gè)和下面n個(gè)卸伞,分別對(duì)這個(gè)2n個(gè)區(qū)域中分布的點(diǎn)求平均車流量和平均占有率就可以得到各個(gè)區(qū)域中心點(diǎn):上界點(diǎn)(AvgFlowUpi,AvgAccuUpi)/下界點(diǎn)(AvgFlowDowni,AvgAccuDowni) [i=1,2,3,....n],對(duì)各個(gè)區(qū)域車流量求標(biāo)準(zhǔn)差得到:上界區(qū)域stdFlwoUpi/下界區(qū)域stdFlwoDowni[i=1,2,3,4...n]锉屈,如果某一個(gè)區(qū)域沒(méi)有數(shù)據(jù)那么不進(jìn)行計(jì)算荤傲,這樣在原你和曲線上方和下方均可以建立新的數(shù)據(jù)點(diǎn):上界區(qū)域(NewUpFlowi,NewUpOccui)/下界區(qū)域(NewDownFlowi,NewDownOccui)[i=1,2,3,4...n];其中上下新數(shù)據(jù)點(diǎn)的計(jì)算公式為:
NewUpFlowi=AvgFlowUpi+σ*stdFlowUpi
NewUpOccui=AvgAccuUpi
NewDownFlowi=AvgFlowDowni+σ*stdFlowDowni
NewDownOccui=AvgAccuDowni
σ為放縮因子颈渊,使用三次多項(xiàng)式對(duì)上方和下方的心數(shù)據(jù)點(diǎn)以及(0,0),(100,0)點(diǎn)進(jìn)行擬合就可以得到fmax(x),fmin(x)兩個(gè)多項(xiàng)式遂黍,
做出圖如圖所示,只要不包含在邊界之內(nèi)的就是異常值