KDD2015捶箱,SEISMIC,用點過程做tweet 流行度預(yù)測

SEISMIC: A Self-Exciting Point Process Model for Predicting Tweet Popularity

概述

  • 用自激點過程預(yù)測一條tweet的最終轉(zhuǎn)發(fā)量
  • 斯坦福的工作
  • 公開了數(shù)據(jù)和代碼:http://snap.stanford.edu/seismic
  • 模型不用訓(xùn)練持灰,也沒用過多的特征
  • 根據(jù)tweet早期(前一小時)的轉(zhuǎn)發(fā)情況,預(yù)測最終轉(zhuǎn)發(fā)量
  • 實驗上只用15%的相對誤差
動機(jī)
  • 預(yù)測一篇文章的最終流行度對于內(nèi)容的排序和內(nèi)容的聚合是很重要的
  • Twitter這種信息流式的內(nèi)容负饲,用戶幾乎不可能全部跟上堤魁,所以可能會錯過大量的信息
  • 準(zhǔn)確的預(yù)測將使Twitter能夠更好地對內(nèi)容進(jìn)行排名,更快地發(fā)現(xiàn)熱門帖子
自激點過程
  • 點過程:描述某類事件發(fā)生的時刻返十、地點等的一種隨機(jī)過程妥泉。其中- - - 描述某類事件發(fā)生次數(shù)隨時間變化的過程叫做“計數(shù)過程”,比較常見的是泊松過程
  • 自激點過程就是每次時間發(fā)生能使得這個事件的發(fā)生概率發(fā)生變化吧慢,例如霍克斯過程涛漂,自激點過程常常被用來對“rich get richer”現(xiàn)象建模
  • 在tweet的轉(zhuǎn)發(fā)過程中,每一次被轉(zhuǎn)發(fā)都可能帶動更多的人轉(zhuǎn)發(fā)检诗,因為轉(zhuǎn)發(fā)能夠使得更多人看到匈仗,而且一個tweet的傳播性也會隨著時間而下降。
SEISMIC (Self-Exciting Model of Information Cascades) 模型
  • tweet的傳播性隨時間變化
  • 能夠識別某個時間點信息流的狀態(tài):supercritical or subcritical state (超臨界或者亞臨界狀態(tài))逢慌,就是傳播性大于或者小于某個值
  • 超臨界狀態(tài)下的信息流正在經(jīng)歷一個“爆炸”增長的時期悠轩, 在這個時候,這個信息的最終流行度無法被準(zhǔn)確的預(yù)測攻泼, 反之就容易預(yù)測火架。
  • 模型無參數(shù),也沒有特征工程忙菠,也沒有考慮社交網(wǎng)絡(luò)結(jié)構(gòu)
  • 只用到了tweet歷史被轉(zhuǎn)發(fā)的時間和節(jié)點(轉(zhuǎn)發(fā)的人)在社交網(wǎng)絡(luò)里面的度數(shù)(這個人的follow 數(shù)量)
  • 模型的時間復(fù)雜度是線性的何鸡,也容易并行化
  • 模型有較強的解釋性
實驗效果
  • 超過state of the art方法的效果30%(accuracy)
  • 用前一小時的記錄預(yù)測,15%的相對誤差
  • 用前10分鐘的記錄預(yù)測牛欢,25%的相對誤差
  • 實驗還展示了怎么識別將會“病毒式”傳播的tweet

相關(guān)工作

  • 一般分為基于特征的方法和基于點過程的方法
  • 本工作與其他用霍克斯過程的方法的不同是:本方法的過程的強度(intensity)會依賴于另一個過程強度而變化骡男。
重要參考文獻(xiàn)
  • S. Gao, J. Ma, and Z. Chen. Modeling and predicting
    retweeting dynamics on microblogging platforms. In WSDM
    ’15, 2015. 也是點過程做流行度預(yù)測

方法實現(xiàn)

  • 一堆公式看得腦殼疼
公式1

公式2

公式3

實驗

  • 實驗做了挺多做的挺充分的
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市傍睹,隨后出現(xiàn)的幾起案子隔盛,更是在濱河造成了極大的恐慌犹菱,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,695評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吮炕,死亡現(xiàn)場離奇詭異腊脱,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)龙亲,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評論 3 399
  • 文/潘曉璐 我一進(jìn)店門陕凹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人俱笛,你說我怎么就攤上這事捆姜。” “怎么了迎膜?”我有些...
    開封第一講書人閱讀 168,130評論 0 360
  • 文/不壞的土叔 我叫張陵泥技,是天一觀的道長。 經(jīng)常有香客問我磕仅,道長珊豹,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,648評論 1 297
  • 正文 為了忘掉前任榕订,我火速辦了婚禮店茶,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘劫恒。我一直安慰自己贩幻,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 68,655評論 6 397
  • 文/花漫 我一把揭開白布两嘴。 她就那樣靜靜地躺著丛楚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪憔辫。 梳的紋絲不亂的頭發(fā)上趣些,一...
    開封第一講書人閱讀 52,268評論 1 309
  • 那天,我揣著相機(jī)與錄音贰您,去河邊找鬼坏平。 笑死,一個胖子當(dāng)著我的面吹牛锦亦,可吹牛的內(nèi)容都是我干的舶替。 我是一名探鬼主播,決...
    沈念sama閱讀 40,835評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼杠园,長吁一口氣:“原來是場噩夢啊……” “哼坎穿!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起返劲,我...
    開封第一講書人閱讀 39,740評論 0 276
  • 序言:老撾萬榮一對情侶失蹤玲昧,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后篮绿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體孵延,經(jīng)...
    沈念sama閱讀 46,286評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,375評論 3 340
  • 正文 我和宋清朗相戀三年亲配,在試婚紗的時候發(fā)現(xiàn)自己被綠了尘应。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,505評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡吼虎,死狀恐怖犬钢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情思灰,我是刑警寧澤玷犹,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站洒疚,受9級特大地震影響歹颓,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜油湖,卻給世界環(huán)境...
    茶點故事閱讀 41,873評論 3 333
  • 文/蒙蒙 一巍扛、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧乏德,春花似錦撤奸、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至瘾晃,卻和暖如春贷痪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蹦误。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評論 1 272
  • 我被黑心中介騙來泰國打工劫拢, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人强胰。 一個月前我還...
    沈念sama閱讀 48,921評論 3 376
  • 正文 我出身青樓舱沧,卻偏偏與公主長得像,于是被迫代替她去往敵國和親偶洋。 傳聞我的和親對象是個殘疾皇子熟吏,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,515評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 原文:Accurately Measuring Model Prediction Error 在機(jī)器學(xué)習(xí)模型的效果...
    jiandanjinxin閱讀 2,483評論 0 3
  • 問:地藏菩薩,我從無始劫以來至今,當(dāng)下所受哪些業(yè)報牵寺?分別是善的還是惡的悍引? 答:不邪淫/大善,不妄語/大善帽氓,不兩舌/...
    長小白閱讀 231評論 0 0
  • 高效勞累的一天黎休,真真的是像陀螺一樣一刻不停閑浓领。晨會、交班势腮,整理參賽病例與領(lǐng)導(dǎo)溝通联贩,第一次正式考核選手,外出給領(lǐng)導(dǎo)親...
    劉淑正閱讀 753評論 4 11
  • 農(nóng)歷九月初一(2018.10.9)周二 雨轉(zhuǎn)晴 昨天老師說今天要考試捎拯,囑咐了幾句泪幌,還開了句玩笑問彧寶:“要考試了,...
    亦然愛彧閱讀 144評論 0 1
  • 我們今天畫的是花田里的小村莊玄渗。是用水粉畫的座菠。 先畫五座小房子,三座高的藤树,兩座矮的浴滴,屋頂是弧形的...
    郝麗君_67b1閱讀 113評論 0 0