論文閱讀“Simple Contrastive Graph Clustering”

Liu Y, Yang X, Zhou S, et al. Simple Contrastive Graph Clustering[J]. arXiv preprint arXiv:2205.07865, 2022.

摘要導(dǎo)讀

復(fù)雜的數(shù)據(jù)增強(qiáng)( complicated data augmentations)和較為耗時(shí)的圖卷積操作(time-consuming graph convolutional operation)影響了對(duì)比學(xué)習(xí)在圖聚類的應(yīng)用。對(duì)此,本文聚焦網(wǎng)絡(luò)結(jié)構(gòu)猴鲫、數(shù)據(jù)增強(qiáng)和目標(biāo)函數(shù)三個(gè)方面鸡挠,提出了一個(gè)簡(jiǎn)單的對(duì)比圖聚類結(jié)構(gòu)报亩。該結(jié)構(gòu)分為預(yù)處理和網(wǎng)絡(luò)backbone兩個(gè)部分羹唠。
從結(jié)構(gòu)上來說,本文使用了一個(gè)簡(jiǎn)單的低通去噪操作將鄰居信息聚合作為一個(gè)獨(dú)立的預(yù)處理操作像樊,骨干(backbone)部分只包括兩個(gè)多層感知器(MLP)眷唉。
對(duì)于數(shù)據(jù)增強(qiáng)予颤,通過設(shè)計(jì)參數(shù)不共享的連體編碼器和直接corrupt節(jié)點(diǎn)嵌入來構(gòu)建同一頂點(diǎn)的兩個(gè)增強(qiáng)視圖。
最后冬阳,在目標(biāo)函數(shù)方面蛤虐,為了進(jìn)一步提高聚類性能,設(shè)計(jì)了一個(gè)新的跨視圖結(jié)構(gòu)一致性目標(biāo)函數(shù)摩泪,以提高網(wǎng)絡(luò)的判別能力。

模型淺析
  • 相關(guān)說明和問題定義
    \mathcal{V}=\{v_1, v_2, \cdots, v_N\}是來自C個(gè)類簇的N個(gè)節(jié)點(diǎn)劫谅,\mathcal{E}為這些節(jié)點(diǎn)所對(duì)應(yīng)的邊见坑。矩陣XA分別為屬性矩陣和原始的鄰接矩陣嚷掠。圖\mathcal{G}=\{X,A\}被記為無向圖。D=diag(d_1, d_2, \cdots, d_N)為度矩陣荞驴,d_i=\sum_{(v_i,v_j) \in \mathcal{E}}a_{ij}不皆。圖的拉普拉斯矩陣L=D-A。根據(jù)對(duì)應(yīng) 的重正則化技巧熊楼,\hat{A}=A+I是加入自環(huán)的鄰接矩陣霹娄,因此對(duì)應(yīng)改變了D的計(jì)算,得到了對(duì)應(yīng)的\hat{D}\hat{L}鲫骗,此時(shí)對(duì)稱的正則圖拉普拉斯矩陣可以重新計(jì)算:
  • 本文的任務(wù)是使用無監(jiān)督的方式學(xué)習(xí)面向聚類的節(jié)點(diǎn)embedding犬耻,在其上直接應(yīng)用k-means進(jìn)行聚類。模型的整體結(jié)構(gòu)如圖所示:

    其流程主要包含三個(gè)部分执泰,低通去噪操作枕磁,結(jié)構(gòu)對(duì)比模塊,以及最后的聚類過程术吝。

  • 低通去噪操作
    已經(jīng)有文獻(xiàn)指出(Adaptive graph encoder for attributed graph embedding & Deeper insights into graph
    convolutional networks for semi-supervised learning & Simplifying graph convolutional networks)计济,拉普拉斯濾波器(Laplacian filter)可以實(shí)現(xiàn)和圖卷積類似的效果。受其啟發(fā)排苍,本文引入低通去噪操作來進(jìn)行近鄰信息的聚合沦寂,該過程是獨(dú)立于后續(xù)模塊的獨(dú)立操作。使用的濾波器公式如下:
    其中淘衙,\tilde{L}是前序提到的對(duì)稱正則的圖拉普拉斯矩陣传藏,k為實(shí)值,這里固定為\frac{2}{3}幔翰。該部分采用了堆疊t層拉普拉斯過濾器:
    X為原始輸入的屬性矩陣漩氨,而X_s為平滑過后的屬性矩陣。通過該低通去噪操作遗增,屬性中的高頻噪聲會(huì)被過濾掉叫惊,從而可以提高聚類的性能和訓(xùn)練的效率。
  • 結(jié)構(gòu)對(duì)比模塊
    該模塊的目的是保持兩個(gè)不同視圖表示的結(jié)構(gòu)一致性做修,以提高網(wǎng)絡(luò)的辨別能力霍狰。
    通過設(shè)計(jì)兩個(gè)結(jié)構(gòu)一致但參數(shù)不共享的MLP學(xué)習(xí)兩種不同的正則化的視圖表示:
    因此,Z^{v_1}Z^{v_2}可以在訓(xùn)練中學(xué)習(xí)到不同的語義信息饰及。
    在此基礎(chǔ)上蔗坯,為了保證兩個(gè)視圖表示的差異性,對(duì)Z^{v_2}添加了隨機(jī)高斯噪聲的擾動(dòng):

    在簡(jiǎn)化數(shù)據(jù)增強(qiáng)的操作之上燎含,本文還設(shè)計(jì)了一個(gè)面向近鄰的對(duì)比損失來確北霰簦跨視圖之間的結(jié)構(gòu)一致性。首先需要計(jì)算兩個(gè)視圖之間的樣本相似性矩陣S \in \mathbb{R} ^ {N \times N}
    對(duì)于給定樣本數(shù)據(jù)而言屏箍,其鄰接矩陣只存在一個(gè)绘梦。因此橘忱,可以利用兩個(gè)增強(qiáng)視圖的相似性來構(gòu)造與輸入的損失而進(jìn)行自監(jiān)督學(xué)習(xí)。最簡(jiǎn)單的方式是強(qiáng)制跨視圖之間的相似性矩陣S與自環(huán)鄰接矩陣是相等的卸奉,來保持結(jié)構(gòu)學(xué)習(xí)的一致性钝诚。
    這里,將同一節(jié)點(diǎn)的跨視圖鄰居視為正樣本榄棵,而將其他非鄰居節(jié)點(diǎn)視為負(fù)樣本凝颇。具體而言,上述式子中的第一項(xiàng)迫使節(jié)點(diǎn)即使在兩個(gè)不同的視圖中也與它們的鄰居保持一致疹鳄,而第二項(xiàng)則使節(jié)點(diǎn)與其非鄰居之間的一致性最小化拧略。這種面向近鄰的對(duì)比目標(biāo)函數(shù)通過保持跨視圖結(jié)構(gòu)的一致性,提高了網(wǎng)絡(luò)的鑒別能力尚辑,從而提高了聚類性能辑鲤。
  • 融合和聚類
    前序?qū)W到了兩個(gè)增強(qiáng)視圖的節(jié)點(diǎn)嵌入表示Z^{v_1}Z^{v_2},并采用線性組合的方式進(jìn)行融合:
    所獲得的Z \in \mathbb{R}^{N \times d}是面向聚類的節(jié)點(diǎn)表示杠茬。在此基礎(chǔ)上月褥,直接應(yīng)用k-means得出聚類結(jié)果。
  • 整體算法流程

從論文給出的結(jié)果來看瓢喉,雖然沒有依賴KL的聚類回調(diào)聚類分配和特征表示宁赤,但是依然獲得了較好的效果,特別是在圖數(shù)據(jù)集上獲得了明顯的效果栓票。說明無論是低通去噪操作還是后續(xù)設(shè)計(jì)的面向近鄰的對(duì)比損失决左,對(duì)節(jié)點(diǎn)的表示學(xué)習(xí)是有很大作用的。特別是使用高斯噪聲對(duì)增強(qiáng)視圖的構(gòu)造方式走贪,不僅降低了計(jì)算成本佛猛,也降低了在數(shù)據(jù)增強(qiáng)中與\mathcal{G}=\{X,A\}的耦合性,很巧妙坠狡。
在組里之前的工作中也用到了類似的方式進(jìn)行損失的構(gòu)造继找,但是沒從對(duì)比學(xué)習(xí)的思路去思考。逃沿。感覺這是一個(gè)很好的啟發(fā)婴渡。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市凯亮,隨后出現(xiàn)的幾起案子边臼,更是在濱河造成了極大的恐慌,老刑警劉巖假消,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件柠并,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)臼予,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門亿傅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瘟栖,你說我怎么就攤上這事×掳ⅲ” “怎么了半哟?”我有些...
    開封第一講書人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)签餐。 經(jīng)常有香客問我寓涨,道長(zhǎng),這世上最難降的妖魔是什么氯檐? 我笑而不...
    開封第一講書人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任戒良,我火速辦了婚禮,結(jié)果婚禮上冠摄,老公的妹妹穿的比我還像新娘糯崎。我一直安慰自己,他們只是感情好河泳,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開白布沃呢。 她就那樣靜靜地躺著,像睡著了一般拆挥。 火紅的嫁衣襯著肌膚如雪薄霜。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評(píng)論 1 302
  • 那天纸兔,我揣著相機(jī)與錄音惰瓜,去河邊找鬼。 笑死汉矿,一個(gè)胖子當(dāng)著我的面吹牛崎坊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播负甸,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼流强,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了呻待?” 一聲冷哼從身側(cè)響起打月,我...
    開封第一講書人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蚕捉,沒想到半個(gè)月后奏篙,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年秘通,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了为严。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡肺稀,死狀恐怖第股,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情话原,我是刑警寧澤夕吻,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站繁仁,受9級(jí)特大地震影響涉馅,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜黄虱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一稚矿、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧捻浦,春花似錦晤揣、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至母剥,卻和暖如春滞诺,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背环疼。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工习霹, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人炫隶。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓淋叶,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親伪阶。 傳聞我的和親對(duì)象是個(gè)殘疾皇子煞檩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354