頻繁子圖挖掘算法gSpan的實(shí)現(xiàn)

頻繁子圖挖掘算法gSpan的實(shí)現(xiàn)

項(xiàng)目地址:https://github.com/betterenvi/gSpan

gSpan算法簡(jiǎn)介

頻繁子圖挖掘是數(shù)據(jù)挖掘中一個(gè)非常廣泛的應(yīng)用。頻繁子圖挖掘是指從大量的圖中挖掘出滿足給定支持度的頻繁子圖,同時(shí)算法需要保證這些頻繁圖不能重復(fù)。頻繁模式挖掘主要就是應(yīng)用兩種策略(這里不討論基于垂直增長(zhǎng)的方法)——Apriori和Growth蜀铲。最早的AGM和FSG就分別實(shí)現(xiàn)了這兩重策略的基本思想审残。gSpan是一個(gè)非常高效的算法骑冗,它利用dfs-code序列對(duì)搜索樹(shù)進(jìn)行編碼,并且制定一系列比較規(guī)則淌山,從而保證最后只得到序列“最小”的頻繁圖集合拯勉。

我用Python實(shí)現(xiàn)了面向無(wú)向圖竟趾、有向圖的GSpan耙考,在實(shí)現(xiàn)時(shí),參考了gboost潭兽,一個(gè)gSpan的C++實(shí)現(xiàn)。在挖掘無(wú)向圖的頻繁子圖時(shí)斗遏,經(jīng)過(guò)多輪比較山卦,我的實(shí)現(xiàn)和gboost的輸出一致。

當(dāng)前(時(shí)間:2016-10-29)诵次,gboost還不支持有向圖的頻繁子圖挖掘账蓉。在我的實(shí)現(xiàn)中,支持面向有向圖的頻繁子圖挖掘逾一,可以挖掘那些至少有一個(gè)點(diǎn)能夠到達(dá)其他任一點(diǎn)的頻繁子圖铸本,但是還沒(méi)有全面測(cè)試過(guò),正確性不敢保證遵堵。只在兩個(gè)簡(jiǎn)單的數(shù)據(jù)集上箱玷,運(yùn)行了數(shù)次,暫時(shí)還未發(fā)現(xiàn)錯(cuò)誤陌宿。歡迎大家訪問(wèn)我的項(xiàng)目https://github.com/betterenvi/gSpan锡足,如果能夠幫忙看看面向有向圖的挖掘是否正確,將十分感謝壳坪!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末舶得,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子爽蝴,更是在濱河造成了極大的恐慌沐批,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蝎亚,死亡現(xiàn)場(chǎng)離奇詭異九孩,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)颖对,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)捻撑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人缤底,你說(shuō)我怎么就攤上這事顾患。” “怎么了个唧?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,747評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵江解,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我徙歼,道長(zhǎng)犁河,這世上最難降的妖魔是什么鳖枕? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,939評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮桨螺,結(jié)果婚禮上宾符,老公的妹妹穿的比我還像新娘。我一直安慰自己灭翔,他們只是感情好魏烫,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,955評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著肝箱,像睡著了一般哄褒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上煌张,一...
    開(kāi)封第一講書(shū)人閱讀 51,737評(píng)論 1 305
  • 那天呐赡,我揣著相機(jī)與錄音,去河邊找鬼骏融。 笑死链嘀,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的档玻。 我是一名探鬼主播管闷,決...
    沈念sama閱讀 40,448評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼窃肠!你這毒婦竟也來(lái)了包个?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,352評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤冤留,失蹤者是張志新(化名)和其女友劉穎碧囊,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體纤怒,經(jīng)...
    沈念sama閱讀 45,834評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡糯而,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,992評(píng)論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了泊窘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片熄驼。...
    茶點(diǎn)故事閱讀 40,133評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖烘豹,靈堂內(nèi)的尸體忽然破棺而出瓜贾,到底是詐尸還是另有隱情,我是刑警寧澤携悯,帶...
    沈念sama閱讀 35,815評(píng)論 5 346
  • 正文 年R本政府宣布祭芦,位于F島的核電站,受9級(jí)特大地震影響憔鬼,放射性物質(zhì)發(fā)生泄漏龟劲。R本人自食惡果不足惜胃夏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,477評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望昌跌。 院中可真熱鬧仰禀,春花似錦、人聲如沸蚕愤。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,022評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)审胸。三九已至,卻和暖如春卸勺,著一層夾襖步出監(jiān)牢的瞬間砂沛,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,147評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工曙求, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留碍庵,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,398評(píng)論 3 373
  • 正文 我出身青樓悟狱,卻偏偏與公主長(zhǎng)得像静浴,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子挤渐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,077評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,183評(píng)論 25 707
  • 前言 其實(shí)讀完斯坦福的這本《互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘》苹享,讓我感覺(jué)到,什么是人工智能浴麻?人工智能就是更高層次的數(shù)據(jù)挖掘得问。機(jī)...
    我偏笑_NSNirvana閱讀 12,587評(píng)論 1 23
  • //我所經(jīng)歷的大數(shù)據(jù)平臺(tái)發(fā)展史(三):互聯(lián)網(wǎng)時(shí)代 ? 上篇http://www.infoq.com/cn/arti...
    葡萄喃喃囈語(yǔ)閱讀 51,227評(píng)論 10 200
  • 喜歡她的那兩年,一直覺(jué)得天是藍(lán)的软免,云是輕的宫纬,放在心里的都是美的。轉(zhuǎn)過(guò)身的這幾年膏萧,云和天都沒(méi)有變漓骚,只是少了抬頭仰望,...
    kimijie閱讀 233評(píng)論 0 1
  • 大晚上的榛泛,實(shí)在寫(xiě)不出什么蝌蹂,頭痛得很,身邊又沒(méi)有了素材曹锨,頓時(shí)覺(jué)得頭腦堵塞叉信,不甚暢快,心中又有不少心事聚集艘希,只好硬著頭...
    WrittingTalia閱讀 294評(píng)論 0 0