論文閱讀“Contrastive and attentive graph learning for multi-view clustering”

Wang R, Li L, Tao X, et al. Contrastive and attentive graph learning for multi-view clustering[J]. Information Processing & Management, 2022, 59(4): 102967.

摘要導(dǎo)讀

基于圖的多視圖聚類旨在利用多視圖圖信息來提供聚類解決方案掐隐。多視圖的一致性約束是多視圖圖聚類的關(guān)鍵∩碳埽現(xiàn)有的研究大多是生成融合圖,并通過聚類損失來約束多視圖的一致性。本文認(rèn)為局部視圖對的一致性可以實(shí)現(xiàn)多個視圖中的共識信息的fine-modeling(精細(xì)建模)。為此,本文提出了一種新的對比和注意圖學(xué)習(xí)框架的多視圖聚類方法状飞。具體來說,本文設(shè)計(jì)了一個多視圖圖學(xué)習(xí)的 contrastive fine-modeling书斜,利用最大化成對視圖的相似性诬辈,以保證多視圖的一致性。同時荐吉,采用基于注意力網(wǎng)絡(luò)的附加加權(quán)細(xì)化融合圖模塊焙糟,動態(tài)捕捉不同視圖的容量差異,進(jìn)一步促進(jìn)了單個視圖和融合視圖的相互強(qiáng)化样屠。此外酬荞,提出的CAGL可以通過一個自訓(xùn)練的聚類模塊來學(xué)習(xí)一個專門的聚類表示搓劫。最后,開發(fā)了一個聯(lián)合優(yōu)化目標(biāo)來平衡每個模塊混巧,并在圖編解碼器的框架下迭代優(yōu)化所提出的CAGL。

With the development of information collection and processing technology, multi-view data with multiple types of features are pervasive in various application domains. For example, a text document can be analyzed by word, sentence, and paragraph or different languages. (Cross language text classification via subspace co-regularized multi-view learning)

Intro結(jié)構(gòu)記錄
  • 多視圖數(shù)據(jù)介紹
  • 圖表示的引入

The graph is widely used in representation learning as an important data structure to represent the relationship between various types of objects.

  • 基于圖的多視圖聚類方法的介紹

Given the natural advantages of graph structure, graph-based multi-view clustering (GMC) has made impressive progress.

  • 現(xiàn)有方法存在的缺點(diǎn)總結(jié)(因此本文提出了什么方法)
  • 本文提出的解決方案的模塊化介紹

    整體流程圖可以由如下表示:
    flow chart
  • 總結(jié)
  • 文章的章節(jié)安排
方法淺析

數(shù)據(jù)定義:給定包含m個視圖多視圖圖數(shù)據(jù)集勤揩,\{X^1,\cdots,X^m\}咧党,X^m=\{x^m_1,\cdots,x^m_n\} \in R^{d_m \times n}。即陨亡,視圖m包含n個樣本點(diǎn)傍衡,且對于視圖m而言,其維度為d^m负蠕。
除一個多視圖圖自編碼器之外蛙埂,整體的模型主要包含三個主要模塊,分別為基于注意權(quán)重的融合模塊遮糖,對比多視圖圖學(xué)習(xí)模塊绣的,以及一個自訓(xùn)練的聚類模塊。

  • Multi-view graph encoder
    GCN每一層的計(jì)算可以寫成:
    其中欲账,\rho為激活函數(shù)屡江,\tilde{A}=D^{-\frac{1}{2}}AD^{-\frac{1}{2}}是正則化之后的對稱鄰接矩陣。W_0為權(quán)重矩陣赛不。l表示GCN的層數(shù)惩嘉。當(dāng)l=0時,L^{(0)}=X踢故。
    對于每個視圖的輸入文黎,都對應(yīng)著一個自己視圖的GCN圖編碼器。
  • Att-weighted graph fusion module


對樣本特征進(jìn)行加權(quán)平均融合特征和對視圖特征拼接往往導(dǎo)致性能次優(yōu)殿较。因此耸峭,作者引入了注意力機(jī)制學(xué)習(xí)每個視圖的權(quán)重參數(shù)⌒敝基于該思想抓艳,模型可以對來自不同視圖的信息進(jìn)行利用,其z_i^{fusion}計(jì)算方式如下:

其中s_mm視圖的加性核學(xué)習(xí)帚戳,a_i^m為softmax得到的權(quán)重參數(shù)玷或。z_i^{fusion}為融合后的特征表示。s_m的計(jì)算可以由兩層的MLP計(jì)算得到片任,首先通過的是一個帶有偏置項(xiàng)和激活函數(shù)的全連接層偏友,第二層相當(dāng)于是權(quán)重的修正學(xué)習(xí)。
通過att加權(quán)融合模塊獲得的融合特征增強(qiáng)了多視圖的全局識別程度对供。

  • Contrastive multi-view graph learning module


在此基礎(chǔ)上位他,本模塊的目標(biāo)是實(shí)現(xiàn)在多個視圖中的共識信息的fine-modeling氛濒。本模塊對傳統(tǒng)的基于樣本的視圖對齊的對比學(xué)習(xí)方法:

此時正負(fù)例的設(shè)置是來自視圖的同一樣本和不同樣本。在此基礎(chǔ)上鹅髓,為了最大化正例以實(shí)現(xiàn)一致的表示特征舞竿,本文對負(fù)例進(jìn)行了重新定義,即s_{ii}^{(m,v)}, v \neq m'為負(fù)例樣本窿冯。
這個式子我覺得存在一定的錯誤骗奖,即紅框之內(nèi)的,v \neq i醒串,首先v是視圖的角標(biāo)执桌,i是樣本的角標(biāo),二者不存在相等的關(guān)系芜赌。其次仰挣,在給定的負(fù)例的定義中,僅包含當(dāng)前樣本的不同視圖表示缠沈,因此分母部分存在一定的筆誤膘壶。
筆者認(rèn)為關(guān)于l_i^{(m,m')}的定義應(yīng)該是如下的形式:l_i^{(m,m')}=-log\frac{exp(s_{ii}^{(m,m')})/\tau}{\sum_{v \neq m' I_{[v \neq m]}}exp(s_{ii}^{(m,v)})/\tau}上式中,排除了(m,m)(m,m')作為負(fù)例的情況博烂。在這種情況下香椎,對于僅包含兩個視圖的數(shù)據(jù)集,其計(jì)算就被簡化為l_i^{(m,m')}=-log~exp(s_{ii}^{(m,m')})/\tau禽篱。(作者在實(shí)驗(yàn)中缺失避免了對兩個視圖數(shù)據(jù)集的使用
對于一個batch中的所有樣本畜伐,其損失計(jì)算方式如下:
通過最小化該損失,使得整個模型增加了局部視圖對的一致性躺率,實(shí)現(xiàn)了多個視圖中共識信息的fine-modeling玛界。

  • Self-training clustering module


該模塊的主要操作是形成以聚類分配驅(qū)動的深度框架,聚類損失還是對DEC的沿用悼吱。這里給出公式慎框,不再贅述:
  • Multi-view graph decoder

    在該模塊,僅構(gòu)造了一個decoder去恢復(fù)m個視圖對應(yīng)的圖的輸入后添。本文采用的是分別對每個視圖的A^{(m)}進(jìn)行重構(gòu)笨枯,其損失函數(shù)寫成:
    關(guān)于視圖m,其計(jì)算如下\tilde{A}^{(m)}=Sigmoid(z^{(fusion)}w^{(m)}z^{(fusion)T})遇西。

  • Joint loss

    由于提出的方法是基于圖編解碼器的框架馅精,因此可以通過一個聯(lián)合優(yōu)化目標(biāo)輕松地實(shí)現(xiàn)端到端學(xué)習(xí)。整體框架的優(yōu)化包含三個部分的學(xué)習(xí)目標(biāo):
    其中粱檀,??1洲敢、??2、??3是調(diào)整各子損失函數(shù)之間的權(quán)重茄蚯。

總體而言压彭,其創(chuàng)新點(diǎn)主要是框架的集成和模塊化目標(biāo)的設(shè)計(jì)睦优。作為我的夢中情刊,竟然被我發(fā)現(xiàn)了好多錯誤壮不。汗盘。。但是不得不說忆畅,關(guān)于論文的組織結(jié)構(gòu)和語言的組織衡未,都很厲害。
大量的實(shí)驗(yàn)證明了該框架的有效性家凯。特別是關(guān)于參數(shù)敏感性學(xué)習(xí)的部分,對z^{(fusion)}的維度如失,學(xué)習(xí)率\epsilon绊诲,收斂性分析,以及l(fā)oss的參數(shù)(\lambda_1,\lambda_2,\lambda_3)(這里又出現(xiàn)了錯誤褪贵,明明說這3個參數(shù)都在[0,1]掂之,結(jié)果畫出的圖的坐標(biāo)竟然。脆丁。世舰。截圖為證)進(jìn)行了展示。

損失函數(shù)中權(quán)重的敏感性學(xué)習(xí)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末槽卫,一起剝皮案震驚了整個濱河市跟压,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌歼培,老刑警劉巖震蒋,帶你破解...
    沈念sama閱讀 217,406評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異躲庄,居然都是意外死亡查剖,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評論 3 393
  • 文/潘曉璐 我一進(jìn)店門噪窘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來笋庄,“玉大人,你說我怎么就攤上這事倔监≈鄙埃” “怎么了?”我有些...
    開封第一講書人閱讀 163,711評論 0 353
  • 文/不壞的土叔 我叫張陵丐枉,是天一觀的道長哆键。 經(jīng)常有香客問我,道長瘦锹,這世上最難降的妖魔是什么籍嘹? 我笑而不...
    開封第一講書人閱讀 58,380評論 1 293
  • 正文 為了忘掉前任闪盔,我火速辦了婚禮,結(jié)果婚禮上辱士,老公的妹妹穿的比我還像新娘泪掀。我一直安慰自己,他們只是感情好颂碘,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評論 6 392
  • 文/花漫 我一把揭開白布异赫。 她就那樣靜靜地躺著,像睡著了一般头岔。 火紅的嫁衣襯著肌膚如雪塔拳。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,301評論 1 301
  • 那天峡竣,我揣著相機(jī)與錄音靠抑,去河邊找鬼。 笑死适掰,一個胖子當(dāng)著我的面吹牛颂碧,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播类浪,決...
    沈念sama閱讀 40,145評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼载城,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了费就?” 一聲冷哼從身側(cè)響起诉瓦,我...
    開封第一講書人閱讀 39,008評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎受楼,沒想到半個月后垦搬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,443評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡艳汽,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評論 3 334
  • 正文 我和宋清朗相戀三年猴贰,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片河狐。...
    茶點(diǎn)故事閱讀 39,795評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡米绕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出馋艺,到底是詐尸還是另有隱情栅干,我是刑警寧澤,帶...
    沈念sama閱讀 35,501評論 5 345
  • 正文 年R本政府宣布捐祠,位于F島的核電站碱鳞,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏踱蛀。R本人自食惡果不足惜窿给,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評論 3 328
  • 文/蒙蒙 一贵白、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧崩泡,春花似錦禁荒、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,731評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至谒所,卻和暖如春热康,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背劣领。 一陣腳步聲響...
    開封第一講書人閱讀 32,865評論 1 269
  • 我被黑心中介騙來泰國打工褐隆, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人剖踊。 一個月前我還...
    沈念sama閱讀 47,899評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像衫贬,于是被迫代替她去往敵國和親德澈。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 字符串 1.什么是字符串 使用單引號或者雙引號括起來的字符集就是字符串固惯。 引號中單獨(dú)的符號梆造、數(shù)字、字母等叫字符葬毫。 ...
    mango_2e17閱讀 7,508評論 1 7
  • 《閉上眼睛才能看清楚自己》這本書是香海禪寺主持賢宗法師的人生體悟镇辉,修行心得及講學(xué)錄,此書從六個章節(jié)講述了禪修是什么...
    宜均閱讀 10,021評論 1 25
  • 前言 Google Play應(yīng)用市場對于應(yīng)用的targetSdkVersion有了更為嚴(yán)格的要求贴捡。從 2018 年...
    申國駿閱讀 64,088評論 14 98
  • 第七章:理性的投資觀 字?jǐn)?shù): 1.投資要圍繞目的進(jìn)行 投資的目的是為了掙錢忽肛。投資的除了金錢還有時間和精力也是一種投...
    幸福萍寶閱讀 3,325評論 1 2
  • 本文轉(zhuǎn)載自微信公眾號“電子搬磚師”,原文鏈接 這篇文章會以特別形象通俗的方式講講什么是PID烂斋。 很多人看到網(wǎng)上寫的...
    這個飛宏不太冷閱讀 6,837評論 2 15