論文閱讀“Multi-view graph embedding clustering network"

Xia W, Wang S, Yang M, et al. Multi-view graph embedding clustering network: Joint self-supervision and block diagonal representation[J]. Neural Networks, 2022, 145: 1-9.

摘要概述

本文提出了一種多視圖圖嵌入聚類網(wǎng)絡(luò)(MVGC)以彌補(bǔ)多視圖聚類和圖聚類之間的Gap蘸鲸。具體來說泉褐,與傳統(tǒng)的多視圖構(gòu)造方法只適用于描述歐幾里得結(jié)構(gòu)數(shù)據(jù)不同苦丁,本文利用歐拉變換來增強(qiáng)節(jié)點(diǎn)屬性,作為一個(gè)新的視圖描述肮塞,用于非歐幾里得結(jié)構(gòu)數(shù)據(jù)(即構(gòu)建圖數(shù)據(jù))逗柴。同時(shí)诸狭,使用?1,2-范數(shù)施加塊對(duì)角線對(duì)自表示稀疏矩陣進(jìn)行約束先鱼,以很好地探索聚類結(jié)構(gòu)。此外适瓦,利用學(xué)習(xí)到的聚類標(biāo)簽來指導(dǎo)節(jié)點(diǎn)表示和系數(shù)矩陣的學(xué)習(xí)竿开,然后用系數(shù)矩陣進(jìn)行后續(xù)的聚類。提出的方法實(shí)現(xiàn)了表示學(xué)習(xí)和聚類的連接優(yōu)化玻熙,避免了次優(yōu)解的出現(xiàn)否彩。
In this way, clustering and representation learning are seamlessly connected, with the aim to achieve better clustering performance.

  • 考慮塊對(duì)角線表示對(duì)于聚類的學(xué)習(xí)
  • 使用聚類標(biāo)簽指導(dǎo)表示學(xué)習(xí)

符號(hào)定義

這里主要是關(guān)于幾個(gè)正則項(xiàng)的定義,如||\textbf{M}||_F||\textbf{M}||_{1,2}^2等嗦随。

模型淺析

結(jié)合圖中給出的5個(gè)部分的loss來進(jìn)行對(duì)模型的描述列荔。

  • Attribute augmentation
    根據(jù)多視圖數(shù)據(jù)的特點(diǎn),本文認(rèn)為現(xiàn)有的特征提取方法直接構(gòu)建多個(gè)屬性是一種簡單而有效的方法枚尼。作者受核技巧可以捕獲非線性特征的特點(diǎn)啟發(fā)贴浙,提出使用歐拉變換來構(gòu)建圖結(jié)構(gòu)數(shù)據(jù)。給定視圖0的樣本x_i \in R^{1 \times d_0}署恍,d_0為該視圖的數(shù)據(jù)維度崎溃。其變換公式如下,

    其中盯质,α∈R^+是一個(gè)參數(shù)袁串,它被調(diào)整以抑制由異常值引起的值概而。
    通過以上操作,可以得到一個(gè)新的節(jié)點(diǎn)屬性矩陣X^{(2)}=B囱修,原始節(jié)點(diǎn)屬性為X^{(1)} \in R^{N \times d_0}赎瑰。由此,單視圖的圖結(jié)構(gòu)數(shù)據(jù)被拓展為多視圖數(shù)據(jù)破镰。

  • Multi-view node subspace clustering module
    該模塊的目的是學(xué)習(xí)一個(gè)由多個(gè)視圖共享的系數(shù)表示餐曼,然后將節(jié)點(diǎn)分配到這個(gè)新子空間中的K個(gè)簇中的一個(gè)。通過將每個(gè)視圖的節(jié)點(diǎn)表示X和圖結(jié)構(gòu)A傳入一個(gè)兩層的圖卷積編碼器啤咽,得到H

    (1)自表示學(xué)習(xí)模塊
    為了使該模塊對(duì)下游的聚類更加友好晋辆,在此使用自表示學(xué)習(xí)模塊來學(xué)習(xí)一個(gè)共享的自表示系數(shù)表示Z

    為了確保學(xué)習(xí)到的節(jié)點(diǎn)表示H^{(v)}保留了足夠的圖結(jié)構(gòu)信息宇整,將第v個(gè)視圖的新表示H^{(v)}Z隨后輸入內(nèi)積解碼器用于預(yù)測兩個(gè)節(jié)點(diǎn)之間是否存在鏈接。
    (2)一致性表示約束
    為了確保模型能夠在不同的視圖之間學(xué)習(xí)到一個(gè)一致的子空間Z芋膘,本文使用了一個(gè)一致的表示約束來捕獲來自不同視圖的嵌入幾何關(guān)系相似度鳞青。

    經(jīng)過上述步驟,可以學(xué)習(xí)到一個(gè)較為滿意的自表示系數(shù)矩陣Z为朋,由此可以構(gòu)造Affinity矩陣
    然后用于normalized cut譜聚類臂拓。

  • Block diagonal representation constraint
    同時(shí)作者希望學(xué)習(xí)到的系數(shù)矩陣Z符合塊對(duì)角線性質(zhì)(BDP, block-diagonal property),以捕獲正確的聚類分配习寸。即胶惰,Z是一個(gè)K塊對(duì)角,其中Z_j對(duì)應(yīng)于屬于j-th類簇的樣本表示X_j,j \in \{1,..,K\}霞溪。因此孵滞,引入?1,2范數(shù)來約束Z

    通過最小化上式,第iz_i的平方?1范數(shù)中的不同元素相互競爭鸯匹,使得z_i(第i個(gè)樣本表示)中至少有一個(gè)元素保留下來(保持非零)坊饶。通過這樣做,每個(gè)類簇都保留了一些鑒別特征殴蓬,為學(xué)習(xí)到的系數(shù)表示提供了一定的靈活性匿级。使Z能夠很好地保留塊的對(duì)角線屬性。

  • Dual self-supervised mechanism
    在該模塊中染厅,本文使用聚類標(biāo)簽\hat{L}分別對(duì)自表示Z和隱變量表示H^{(v)}進(jìn)行了反調(diào)約束痘绎。
    (1)對(duì)隱含表示的自監(jiān)督
    這部分主要通過構(gòu)造一個(gè)自分類模型將H^{(v)}映射到類別空間Y^{(v)}來實(shí)現(xiàn)對(duì)\hat{Y}的利用。主要包含兩種分類的交叉熵?fù)p失肖粮,和類簇中心到分類表示(軟分配)之間的距離(有助于壓縮簇內(nèi)變化)


    (2)對(duì)自表示進(jìn)行自監(jiān)督
    該部分利用最后一次迭代產(chǎn)生的聚類標(biāo)簽\hat{L}來監(jiān)督自表示系數(shù)矩陣Z孤页。具體來說,對(duì)于Z尿赚,只有當(dāng)?shù)?img class="math-inline" src="https://math.jianshu.com/math?formula=i" alt="i" mathimg="1">個(gè)和第j個(gè)節(jié)點(diǎn)具有相同的簇標(biāo)簽時(shí)散庶,Z_{ij}才非零蕉堰。最后一次迭代得到的聚類結(jié)果可以為系數(shù)矩陣Z的微調(diào)提供豐富的信息,這對(duì)節(jié)點(diǎn)子空間的聚類具有重要意義悲龟。因此屋讶,最小化Z和偽標(biāo)簽矩陣\hat{L}之間的差異:
    其中\hat{l_i}表示偽標(biāo)簽對(duì)應(yīng)的向量表示。

  • 總體損失和細(xì)節(jié)

    根據(jù)前序模塊的設(shè)定须教,模型的總體損失如下:
    關(guān)于聚類標(biāo)簽的對(duì)齊皿渗,這里也是采用了匈牙利算法進(jìn)行了最優(yōu)的對(duì)齊。并且轻腺,類簇標(biāo)簽的調(diào)節(jié)是每5個(gè)epoch進(jìn)行更新乐疆,以保證模型的穩(wěn)定性。

    另外贬养,關(guān)于自表示模塊的對(duì)角線為0的約束挤土,也采用小trick來簡化:(以tf1.x代碼展示)
    約束trick
    總體的算法流程如下:

感覺在表示學(xué)習(xí)這一塊,由于多視圖的良好特性误算,很多工作都通過數(shù)據(jù)增強(qiáng)等模式對(duì)原有的單視圖數(shù)據(jù)進(jìn)行增強(qiáng)以擴(kuò)展到多視圖進(jìn)行訓(xùn)練仰美。本文的最大啟發(fā)在于對(duì)角塊約束的引入和對(duì)偽標(biāo)簽的利用。該思路既可以用于在行列學(xué)習(xí)之間建立關(guān)聯(lián)關(guān)系儿礼,也使得聚類可以對(duì)學(xué)習(xí)進(jìn)行反調(diào)咖杂,是對(duì)DEC聚類層及其變體(如||P-Q||)的一種簡化。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蚊夫,一起剝皮案震驚了整個(gè)濱河市诉字,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌知纷,老刑警劉巖壤圃,帶你破解...
    沈念sama閱讀 221,548評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異屈扎,居然都是意外死亡埃唯,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門鹰晨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來墨叛,“玉大人,你說我怎么就攤上這事模蜡∧茫” “怎么了?”我有些...
    開封第一講書人閱讀 167,990評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵忍疾,是天一觀的道長闯传。 經(jīng)常有香客問我,道長卤妒,這世上最難降的妖魔是什么甥绿? 我笑而不...
    開封第一講書人閱讀 59,618評(píng)論 1 296
  • 正文 為了忘掉前任字币,我火速辦了婚禮,結(jié)果婚禮上共缕,老公的妹妹穿的比我還像新娘洗出。我一直安慰自己,他們只是感情好图谷,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評(píng)論 6 397
  • 文/花漫 我一把揭開白布翩活。 她就那樣靜靜地躺著,像睡著了一般便贵。 火紅的嫁衣襯著肌膚如雪菠镇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,246評(píng)論 1 308
  • 那天承璃,我揣著相機(jī)與錄音利耍,去河邊找鬼。 笑死绸硕,一個(gè)胖子當(dāng)著我的面吹牛堂竟,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播玻佩,決...
    沈念sama閱讀 40,819評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼席楚!你這毒婦竟也來了咬崔?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤烦秩,失蹤者是張志新(化名)和其女友劉穎垮斯,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體只祠,經(jīng)...
    沈念sama閱讀 46,268評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡兜蠕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了抛寝。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片熊杨。...
    茶點(diǎn)故事閱讀 40,488評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖盗舰,靈堂內(nèi)的尸體忽然破棺而出晶府,到底是詐尸還是另有隱情,我是刑警寧澤钻趋,帶...
    沈念sama閱讀 36,181評(píng)論 5 350
  • 正文 年R本政府宣布川陆,位于F島的核電站,受9級(jí)特大地震影響蛮位,放射性物質(zhì)發(fā)生泄漏较沪。R本人自食惡果不足惜鳞绕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望尸曼。 院中可真熱鬧们何,春花似錦、人聲如沸骡苞。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽解幽。三九已至贴见,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間躲株,已是汗流浹背片部。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留霜定,地道東北人档悠。 一個(gè)月前我還...
    沈念sama閱讀 48,897評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像望浩,于是被迫代替她去往敵國和親辖所。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容