論文閱讀“Adaptive Graph Auto-Encoder for General Data Clustering”

Li X, Zhang H, Zhang R. Adaptive Graph Auto-Encoder for General Data Clustering[J]. arXiv preprint arXiv:2002.08648, 2020.

摘要翻譯

基于圖的聚類在聚類領域具有重要的作用螺男。近年來棒厘,關于圖卷積神經(jīng)網(wǎng)絡的研究在圖形類型數(shù)據(jù)方面取得了令人矚目的成功。然而下隧,在一般的聚類任務中奢人,不存在數(shù)據(jù)的圖結構,因此構造圖的策略對性能至關重要淆院。因此何乎,如何將圖卷積網(wǎng)絡擴展到一般的聚類任務中是一個很有吸引力的問題。本文提出了一種用于一般數(shù)據(jù)聚類的圖自編碼器土辩,它根據(jù)圖的生成視角自適應地構造圖支救。自適應過程旨在誘導模型挖掘數(shù)據(jù)背后的高級信息,充分利用非歐幾里德結構脯燃。論文進一步設計了一種新的機制搂妻,并進行了嚴格的分析,以避免自適應結構造成的負面影響辕棚。通過將網(wǎng)絡嵌入的生成模型和基于圖的聚類相結合欲主,開發(fā)了一種基于圖的自動編碼器和解碼器,使其在加權圖的應用場景中表現(xiàn)良好逝嚎。大量的實驗證明了我們的模型的優(yōu)越性扁瓢。
GNNs extend classical neural networks into irregular data so that the deep information hidden in graphs is exploited sufficiently.[Scarselli F, Gori M, Tsoi A C, et al. The graph neural network model[J]. IEEE transactions on neural networks, 2008, 20(1): 61-80.]
GCNs have shown superiority compared with traditional network embedding models. []
Similarly, graph auto-encoder (GAE) is developed to extend GCN into unsupervised learning.[Kipf T N, Welling M. Variational graph auto-encoders[J]. arXiv preprint arXiv:1611.07308, 2016.]
切入點:為探索歐式數(shù)據(jù)域中的拓撲結構信息,論文從生成角度自適應的構造圖补君,并使用GCN更好的提升聚類性能引几。

主要貢獻點
  • 為構建理想的圖結構信息,模型合并了網(wǎng)絡嵌入的生成模型挽铁∥拔Γ基于生成的觀點,進一步整合了表示學習叽掘,以使圖自然編碼自然地被用來學習嵌入楣铁。(基于生成的思想,更容易探索數(shù)據(jù)中各節(jié)點間的連接分布)
  • 從生成的圖模型獲得的學習的連通性分布更扁,被用作圖自動編碼器重構的目標盖腕,這也啟發(fā)了我們?yōu)榻獯a器設計一種新穎的體系結構赫冬。
  • 模型根據(jù)生成的嵌入內(nèi)容自適應地更新圖,從而可以利用深層信息并修改由原始特征導致的不良圖溃列。通過更改圖形的稀疏度劲厌,我們消除了自適應結構導致的崩潰。此外听隐,給出了相關的理論分析以了解該現(xiàn)象大渤。

相關工作結構
深度聚類(AE-based 和 CNN-based)
GAE相關

模型淺析
Probabilistic Perspective of Weighted Graphs

論文有個基礎假設绸罗,任意兩個節(jié)點之間的連通性被定義為條件概率p(v|v_i),并且在整張圖中有\sum_{j=1}^np(v_j|v_i)=1。因此守呜,可以將這種連通性看做采樣結果欧引,這也是生成網(wǎng)絡嵌入的核心假設手趣。
當然這種采樣會由于連通性的差異導致p(v_i|v_j)\neq p(v_j|v_i)(有向加權圖)阁最。因此,加權圖的構造等效于找到基礎的連通性分布成玫。
為了找到近似的連通分布加酵,論文給出假設1:如果p(v_i|v_j)值比較大,等價于節(jié)點v_iv_j的特征表示是相似的哭当。

紅框中是代表為節(jié)點v_i采樣的期望猪腕,即期望在該節(jié)點的所有鄰接節(jié)點中選出差異性d(v_i,v_j)較小的節(jié)點集合。根據(jù)圖中連通性的稀疏性原則钦勘,在自主學習連通性的過程中添加了正則項(由于L0和L1都存在些缺陷陋葡,因此論文選擇使用L2正則項來保證節(jié)點連接的稀疏性)。通過對模型超參數(shù)的權衡彻采,論文為所有節(jié)點選擇相同的稀疏度腐缤,并被設置為控制參數(shù)的上界。

p_i作者將其定義為節(jié)點v_i相對于每個節(jié)點的條件概率p_i=[p(v_1|v_i), p(v_2|v_i), ..., p(v_n|v_i)]肛响,并且在初始化時將其看做最簡單的解決方案岭粤,即除自身節(jié)點外,其余節(jié)點的條件概率都等于0.

Graph Auto-Encoder for Weighted Graph

通過上述帶權節(jié)點的連通性學習特笋,我們其實得到的是有向帶權圖剃浇,在這一部分的運算中將其轉(zhuǎn)換為無向圖W_{ij}=(p(v_i|v_j)+p(v_j|v_i))/2,并且W鄰接矩陣被作為GAE的重構目標猎物。

  • Encoder
    在普通GCN運算中鄰接信息的引入使用(A+I)虎囚,通過自環(huán)的權重是自適應學習的,而不是原始的I蔫磨,因此在Encoder中溜宽,作者將該部分替換為W,其余算子未變质帅,因此有:
  • Decoder
    不同于重建A的內(nèi)積,論文基于假設1來重建連通性分布p(v|v_i)
    連通性分布計算

\hat{d_{ij}}=||z_i-z_j||_2^2為嵌入空間對應的差異性煤惩。很明顯嫉嘀,\hat{d_{ij}}越小,q(v_j|v_i)值越大魄揉。
為了監(jiān)督自適應圖的優(yōu)化剪侮,論文使用KL散度做損失。


因此總體的Loss可以表示為:
total loss

Adaptive Graph Auto-Encoder

基于上述兩部分洛退,完整的自適應圖自編碼器可以形式化為如圖瓣俯。三種不同顏色的線代表了模型中主要三部分的調(diào)節(jié)和更新。
并且在這部分討論了k和t設置兵怯。也沒太看懂彩匕,這里就不誤人子弟了。


整個論文內(nèi)容飽滿媒区,做了很多理論假設說明驼仪。使得論文華美引人!自愧不如且學不來袜漩!

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末绪爸,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子宙攻,更是在濱河造成了極大的恐慌奠货,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件座掘,死亡現(xiàn)場離奇詭異递惋,居然都是意外死亡,警方通過查閱死者的電腦和手機雹顺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進店門丹墨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人嬉愧,你說我怎么就攤上這事贩挣。” “怎么了没酣?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵王财,是天一觀的道長。 經(jīng)常有香客問我裕便,道長绒净,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任偿衰,我火速辦了婚禮挂疆,結果婚禮上改览,老公的妹妹穿的比我還像新娘。我一直安慰自己缤言,他們只是感情好宝当,可當我...
    茶點故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著胆萧,像睡著了一般庆揩。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上跌穗,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天订晌,我揣著相機與錄音,去河邊找鬼蚌吸。 笑死锈拨,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的套利。 我是一名探鬼主播推励,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼肉迫!你這毒婦竟也來了验辞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤喊衫,失蹤者是張志新(化名)和其女友劉穎跌造,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體族购,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡壳贪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了寝杖。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片违施。...
    茶點故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖瑟幕,靈堂內(nèi)的尸體忽然破棺而出磕蒲,到底是詐尸還是另有隱情,我是刑警寧澤只盹,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布辣往,位于F島的核電站,受9級特大地震影響殖卑,放射性物質(zhì)發(fā)生泄漏站削。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一孵稽、第九天 我趴在偏房一處隱蔽的房頂上張望许起。 院中可真熱鬧十偶,春花似錦、人聲如沸园细。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽珊肃。三九已至,卻和暖如春馅笙,著一層夾襖步出監(jiān)牢的瞬間伦乔,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工董习, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留烈和,地道東北人。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓皿淋,卻偏偏與公主長得像招刹,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子窝趣,可洞房花燭夜當晚...
    茶點故事閱讀 44,933評論 2 355