CS224W-圖神經網絡 筆記4.3:Community Structure in Networks - 網絡中重疊社區(qū)的挖掘——BigCLAM 算法

CS224W-圖神經網絡 筆記4.3:Community Structure in Networks - 網絡中重疊社區(qū)的挖掘——BigCLAM 算法

本文總結之日CS224W Winter 2021只更新到了第四節(jié)钞澳,所以下文會參考2021年課程的PPT并結合2019年秋季課程進行總結以求內容完整
課程主頁:CS224W: Machine Learning with Graphs
視頻鏈接:【斯坦噶撸】CS224W:圖機器學習( 中英字幕 | 2019秋)

[toc]

1 引言

上面介紹了非重疊社區(qū)挖掘的Louvin算法送淆,本節(jié)聊聊重疊社區(qū)的挖掘過程。兩類社區(qū)區(qū)別可以反映在鄰接矩陣上宅此。

圖片

2 BigClAM 算法

2.1 主要思路

通過前面的介紹,基于圖生成模型,可以生成一個網絡删壮。相反的基于一個網絡铐拐,能否確定一個圖生成模型徘键。并且模型自動劃分節(jié)點的社區(qū)結構。

聽起來好像想的過分美好遍蟋,但實際上是真實可行的吹害。而這個特殊的圖生成模型就是 AGM模型(Community-Affiliation Graph Model)。

整個算法步驟分為三步

  1. 利用AGM(Community Affiliation Graph Model)構造一個圖生成模型虚青。
  2. 根據我們實際的圖G它呀,迭代AGM的模型參數,尋找一個最優(yōu)擬合(fitting)實際圖的AGM棒厘。
  3. 通過這個AGM纵穿,確定每個節(jié)點所屬的社區(qū)

2.2 AGM模型(Community-Affiliation Graph Model)

模型是一個二部圖結構。用表示.四個參數含義如下:

圖片
  1. 社區(qū) A 內部的每對節(jié)點相連的概率為p_c.每個社區(qū)對應一個奢人。
  2. 兩個社區(qū)重疊的部分越多谓媒,則重疊區(qū)域的節(jié)點彼此相連的概率越高
  3. 對于彼此之間沒有共同社區(qū)的兩個節(jié)點之間的連接概率并不為0,而為??(??,??)=??何乎,叫做背景社區(qū)稱為\varepsilon - community 句惯。論文中建議(\varepsilon = 2|E|/(|V|(|V|-1)))

雖然,AMG模型是在重疊社區(qū)挖掘的時候引入的宪赶,但并不意味著AMG模型只能生成有重疊社區(qū)的網絡宗弯。事實上,其非常靈活搂妻,可以生成不同類型的社區(qū)結構蒙保。如

圖片

3 圖擬合

通過上面可以看到AGM的參數主要有三個:

  1. 節(jié)點歸屬關系 Membership ??
  2. 社區(qū)內連接概率 p_c
  3. 社區(qū)數 ??
圖片

3.1 確定M

對于歸屬關系M 用矩陣F(Factor Matrix)表示,矩陣的列為社區(qū)數欲主,列為對應節(jié)點邓厕,每元素表示該節(jié)點歸屬社區(qū)的強度。從強度到節(jié)點間連接概率的推導過程如下圖:

圖片

看到連乘和求大值扁瓢,很自然會想到取對數详恼,轉化為求和,便于求導。優(yōu)化采用梯度下降優(yōu)化參數引几。

圖片

3.2 確定社區(qū)內連接概率p_c

從確定的節(jié)點強度舉證就可以反推得到社區(qū)內部節(jié)點之間的連接概率昧互。

圖片

3.3 確定社區(qū)數 ??

社區(qū)數,決定了因子矩陣F的列數。論文中采用的做法也非常巧妙敞掘,將其初始化一個較大的社區(qū)數 叽掘,通過在優(yōu)化函數上加入L1正則,讓模型自己學習玖雁。類似邏輯回歸中對于特征的選則更扁。最終列不全為零的個數就是最終的社區(qū)數。

圖片

通過最終的AGM模型可以很容易得到最終的社區(qū)結構赫冬。

4 總結

本算法是老師在2014年提出的算法(原論文為參考資料3)浓镜,其時間復雜度低,可以運用于大型網絡數據劲厌。另外一提膛薛,cs224w 每年老師講的內容的詳細程度不盡相同,建議大家結合起來一起看脊僚。

5 參考文章

  1. http://snap.stanford.edu/agm/
  2. http://snap.stanford.edu/class/cs224w-2019/slides/
  3. http://ilpubs.stanford.edu:8090/1103/
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末相叁,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子辽幌,更是在濱河造成了極大的恐慌增淹,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,561評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件乌企,死亡現場離奇詭異虑润,居然都是意外死亡,警方通過查閱死者的電腦和手機加酵,發(fā)現死者居然都...
    沈念sama閱讀 90,218評論 3 385
  • 文/潘曉璐 我一進店門拳喻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人猪腕,你說我怎么就攤上這事冗澈。” “怎么了陋葡?”我有些...
    開封第一講書人閱讀 157,162評論 0 348
  • 文/不壞的土叔 我叫張陵亚亲,是天一觀的道長。 經常有香客問我腐缤,道長捌归,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,470評論 1 283
  • 正文 為了忘掉前任岭粤,我火速辦了婚禮惜索,結果婚禮上,老公的妹妹穿的比我還像新娘剃浇。我一直安慰自己巾兆,他們只是感情好猎物,可當我...
    茶點故事閱讀 65,550評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著臼寄,像睡著了一般霸奕。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吉拳,一...
    開封第一講書人閱讀 49,806評論 1 290
  • 那天,我揣著相機與錄音适揉,去河邊找鬼留攒。 笑死,一個胖子當著我的面吹牛嫉嘀,可吹牛的內容都是我干的炼邀。 我是一名探鬼主播,決...
    沈念sama閱讀 38,951評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼剪侮,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了瓣俯?” 一聲冷哼從身側響起杰标,我...
    開封第一講書人閱讀 37,712評論 0 266
  • 序言:老撾萬榮一對情侶失蹤彩匕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后驼仪,有當地人在樹林里發(fā)現了一具尸體掸犬,經...
    沈念sama閱讀 44,166評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡湾碎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,510評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了奠货。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片介褥。...
    茶點故事閱讀 38,643評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖仇味,靈堂內的尸體忽然破棺而出呻顽,到底是詐尸還是另有隱情,我是刑警寧澤丹墨,帶...
    沈念sama閱讀 34,306評論 4 330
  • 正文 年R本政府宣布廊遍,位于F島的核電站,受9級特大地震影響贩挣,放射性物質發(fā)生泄漏喉前。R本人自食惡果不足惜没酣,卻給世界環(huán)境...
    茶點故事閱讀 39,930評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望卵迂。 院中可真熱鬧裕便,春花似錦、人聲如沸见咒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽改览。三九已至下翎,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間宝当,已是汗流浹背视事。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留庆揩,地道東北人俐东。 一個月前我還...
    沈念sama閱讀 46,351評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像订晌,于是被迫代替她去往敵國和親虏辫。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,509評論 2 348

推薦閱讀更多精彩內容