論文閱讀:Streaming pattern discovery in multiple time-series

VLDB 發(fā)表時間:2005 作者:Spiros Papadimitriou
在2005年提出的該方法具有很強(qiáng)的先進(jìn)性奠衔,可以利用該思想對模型進(jìn)行改進(jìn)和驗證。是一篇非常值得學(xué)習(xí)的文章

abstract

In this paper, we introduce SPIRIT (Streaming Pattern discovery in multIple Time-series). Given n numerical data streams, all of whose values we observe at each time tick t, SPIRIT can incrementally find correlations and hidden variables, which summarise the key trends in the entire stream collection. It can do this quickly, with no buffering of stream values and without comparing pairs of streams. Moreover, it is anytime, single pass, and it dynamically detects changes. The discovered trends can also be used to immediately spot potential anomalies, to do efficient forecasting and, more generally, to dramatically simplify further data processing. Our experimental evaluation and case studies show that SPIRIT can incrementally capture correlations and discover trends, efficiently and effectively.

1.這篇文章提出了SPIRIT多時間序列中流模式的發(fā)現(xiàn)导狡,從時間間隔為t的n個數(shù)據(jù)流,找到相關(guān)性和隱藏變量(提取流數(shù)據(jù)中的關(guān)鍵信息)偎痛。
2.該方法具有快速旱捧、不需要緩存、不需要對照流的優(yōu)點(diǎn)看彼,同時可以在任何時候廊佩、動態(tài)的檢測變化囚聚。
3.該方法可以立刻檢測異常點(diǎn),進(jìn)行高效的預(yù)測标锄,簡化下一步的數(shù)據(jù)處理顽铸。
4.并通過實驗驗證了該方法捕獲相關(guān)性和發(fā)現(xiàn)趨勢越來越有效。

背景:

流數(shù)據(jù)是非常常見的數(shù)據(jù)形式料皇,他們都有兩個共同點(diǎn)谓松,1)數(shù)據(jù)量大刷新頻率高,實時處理緩慢2)用戶或者應(yīng)用不能得到及時的數(shù)據(jù)反饋践剂。流數(shù)據(jù)的處理已經(jīng)有一些基礎(chǔ)模型鬼譬,并在實際中應(yīng)用。流數(shù)據(jù)管理系統(tǒng)對預(yù)測模型和行慣性分析是十分重要的逊脯,流數(shù)據(jù)中很多變量是相關(guān)的优质,用很少的隱藏變量處理表示流數(shù)據(jù)的是十分重要的,該文章提出用少數(shù)變量表示整個流數(shù)據(jù)特征的方法军洼。

該方法主要有兩個作用:

1.發(fā)現(xiàn)流數(shù)據(jù)的模式巩螃,用隱藏變量表示流數(shù)據(jù)的變化規(guī)律。
2.自動確定隱藏變量個數(shù)匕争。

該方法對數(shù)據(jù)的要求:

1.流數(shù)據(jù)
2.數(shù)據(jù)根據(jù)流數(shù)的多少進(jìn)行線性變化(不能是平方或者非線性)
3.It is adaptive, and fully automatic.(個人理解應(yīng)該是動態(tài)變化的)

解決問題:

對多個流數(shù)據(jù)進(jìn)行自動特征提取避乏,用k個變量表征多個流數(shù)據(jù)的規(guī)律「噬#可以用作異常檢測和預(yù)測拍皮。

實現(xiàn)該方法的主要步驟:

1.計算隱藏變量
1)主成分分析獲得w_t
2)根據(jù)w_t計算隱藏變量y_i
3)根據(jù)隱藏變量計算重構(gòu)誤差e
4)根據(jù)誤差e更新w_ty_i
2.計算隱藏變量的個數(shù)k
1)根據(jù)輸入x_t的平方和計算E_{t+1}
2)計算k個隱藏變量下的E_{(k)}
3)根據(jù)E_{t+1}E_{k}和兩個閾值調(diào)整k的大小
其中w_t跑杭、y_i铆帽、eE_{t+1}艘蹋、E_{k}給出了詳細(xì)的計算步驟锄贼。

實驗結(jié)果:

論文用了三種數(shù)據(jù)集驗證該方法的有效性票灰,并對精度進(jìn)行分析女阀。

結(jié)論:

該方法有效地實現(xiàn)了在流數(shù)據(jù)中尋找模式、相關(guān)性和隱藏變量屑迂,并具有以下特性:

  • 發(fā)現(xiàn)多個流之間的潛在相關(guān)性浸策,獲得隱藏變量,并通過一些隱藏變量提供流集合的非常緊湊的表示惹盼。
  • 自動估計要隱藏變量的數(shù)量k庸汗。
  • 無論是在數(shù)據(jù)庫大小(即時間刻度t的數(shù)量)還是在流的數(shù)量n上手报,它的擴(kuò)展都非常好蚯舱。因此改化,它適用于大量的傳感器/數(shù)據(jù)源。
  • 計算要求低:只需O(nk)浮點(diǎn)運(yùn)算枉昏,無矩陣變換和奇異值分解(SVD)
  • 它可以很自然地與任何預(yù)測方法相結(jié)合陈肛,因此很容易進(jìn)行預(yù)測,并處理缺失值兄裂。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末句旱,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子晰奖,更是在濱河造成了極大的恐慌谈撒,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,826評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件匾南,死亡現(xiàn)場離奇詭異啃匿,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)蛆楞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評論 3 395
  • 文/潘曉璐 我一進(jìn)店門立宜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人臊岸,你說我怎么就攤上這事橙数。” “怎么了帅戒?”我有些...
    開封第一講書人閱讀 164,234評論 0 354
  • 文/不壞的土叔 我叫張陵灯帮,是天一觀的道長。 經(jīng)常有香客問我逻住,道長钟哥,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,562評論 1 293
  • 正文 為了忘掉前任瞎访,我火速辦了婚禮腻贰,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘扒秸。我一直安慰自己播演,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評論 6 392
  • 文/花漫 我一把揭開白布伴奥。 她就那樣靜靜地躺著写烤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪拾徙。 梳的紋絲不亂的頭發(fā)上洲炊,一...
    開封第一講書人閱讀 51,482評論 1 302
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼暂衡。 笑死询微,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的狂巢。 我是一名探鬼主播拓提,決...
    沈念sama閱讀 40,271評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼隧膘!你這毒婦竟也來了代态?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,166評論 0 276
  • 序言:老撾萬榮一對情侶失蹤疹吃,失蹤者是張志新(化名)和其女友劉穎蹦疑,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體萨驶,經(jīng)...
    沈念sama閱讀 45,608評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡歉摧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了腔呜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片叁温。...
    茶點(diǎn)故事閱讀 39,926評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖核畴,靈堂內(nèi)的尸體忽然破棺而出膝但,到底是詐尸還是另有隱情,我是刑警寧澤谤草,帶...
    沈念sama閱讀 35,644評論 5 346
  • 正文 年R本政府宣布跟束,位于F島的核電站,受9級特大地震影響丑孩,放射性物質(zhì)發(fā)生泄漏冀宴。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評論 3 329
  • 文/蒙蒙 一温学、第九天 我趴在偏房一處隱蔽的房頂上張望略贮。 院中可真熱鬧,春花似錦仗岖、人聲如沸澄者。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽愉舔。三九已至舟舒,卻和暖如春咖气,著一層夾襖步出監(jiān)牢的瞬間睬隶,已是汗流浹背愉烙。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留是嗜,地道東北人愈案。 一個月前我還...
    沈念sama閱讀 48,063評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像鹅搪,于是被迫代替她去往敵國和親站绪。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評論 2 354