論文閱讀“Deep Embedded Multi-view Clustering with Collaborative Training”

引用格式:Xu J, Ren Y, Li G, et al. Deep Embedded Multi-view Clustering with Collaborative Training[J]. arXiv preprint arXiv:2007.13067, 2020.

摘要翻譯

通過利用來自多視圖的信息桶现,多視圖聚類最近引起了越來越多的關注蚜点。但是敷搪,現(xiàn)有的多視圖聚類方法要么具有較高的計算和空間復雜性,要??么缺乏表示能力。為了解決這些問題巷挥,我們在本文中提出了帶有協(xié)作訓練(DEMVC)的深度嵌入式多視圖聚類梧奢。首先,深度自動編碼器分別學習多個視圖的嵌入表示穆刻。然后,考慮了多方意見的共識和互補杠步,提出了一種新穎的協(xié)作訓練方案氢伟。具體來說,所有視圖的特征表示和聚類分配都是通過協(xié)作學習的幽歼。進一步開發(fā)了用于聚類中心初始化的新一致性策略朵锣,以通過協(xié)作訓練來改善多視圖聚類性能。在多個流行的多視圖數(shù)據(jù)集上的實驗結果表明甸私,DEMVC與最新方法相比有了顯著改進诚些。

論文的關注點在于:使用協(xié)同訓練機制來對不同視圖的表示和聚類分配進行協(xié)作學習(輪流使用不同視圖的信息)。

模型描述

DEMVC包含V個encoders和其對應的V個decoders(這里構成了深度自編碼器對多個視圖的嵌入表示),除此之外诬烹,還有對應V個視圖的V個聚類層砸烦。簡單圖示如下:

The framework of DEMVC.png

對于多視圖信息的引用則是在不同輪迭代中選取參照視圖。上圖顯示第一視圖作為參考視圖绞吁,如實線所示幢痘。 虛線表示相應的P^i不參與本輪計算。 引用的參照視圖將依次更改以便學習不同視圖中的補充信息家破。

方法解析

多視圖協(xié)同訓練

數(shù)據(jù)集的定義:\{x^v_i \in R^D\}^N_{i=1}代表當前視圖v的維度為D颜说,并且在此數(shù)據(jù)集中含有N個 樣本。V為該數(shù)據(jù)集的視圖個數(shù)汰聋,表示每個對象有V個子樣本需要聚類门粪。對于每個視圖v,定義f^v_{\Theta}{g^v_{\Omega}}分別為編碼器和解碼器马僻。\Theta\Omega為可訓練的參數(shù)庄拇。
因此網(wǎng)絡模型的編碼部分可以形式化為如下的內(nèi)容:

autoencoder.png

在loss函數(shù)的定義上,為每個視圖v構建了重構loss和聚類loss韭邓。并且設置了平衡參數(shù)\gamma(這里借鑒的是IDEC對DEC的改進措近,使得在聚類的過程中也融入了重建損失)。
total loss.png

reconstruction loss for view-v.png

聚類損失還是使用了DEC中提出的Kullback-Leibler (KL) divergence女淑,定義如下:
clustering loss for view-v.png

這里明晰一下clustering loss的由來和組成(主要是提醒自己):
在這個式子中瞭郑,主要有兩個帶下標的分布,即p^v_{ij}q^v_{ij}鸭你。
首先初始化view v中類簇j的簇中心\mu^v_j屈张,q^v_{ij}旨在表示每個embedded point z^v_i和不同的cluster center \mu^v_j之間的相似度,使用了t-分布進行構造袱巨,這里給出t-分布的簡單介紹阁谆。

t-distr.png

上圖展示了一些作者可能的構造分布的想法,
q_ij.png

在當前的聚類任務中愉老,q^v_{ij}被當做soft label也就是以概率的形式分配當前視圖v中第i個樣本到第j個類簇的可能性场绿。隨著平方運算和聚類軟標簽q^v_{ij}的歸一化,DEC模型中 建立了輔助目標分布p^v_{ij} \in R^K來實現(xiàn)深度單視圖聚類嫉入。顯然在DEMVC中焰盗,每個視圖v對應的輔助分布利用如下計算:
p_ij.png

為了更好的說明KL散度對聚類的影響,作者甚至還給出了2聚類的相關示意圖咒林。

soft and hard assign.png

為了避免多視圖間的互補信息被忽略熬拒,作者采用了讓每個視圖分別成為參照視圖來引導整個框架學習適合聚類的特征。將其稱為multi-view collaborative training垫竞。因此我們定義P^r為當前參考視圖的輔助目標分布澎粟,并且這個輔助目標分布在數(shù)據(jù)的多個視圖之間共享。對于視圖v的clustering loss則改變?yōu)槿缦拢?br>

clustering loss new.png

關于這個參照視圖的作用及解釋,作者給出了如下的說法:

explain.png

大概意思是對不同view的坐標參照系進行了對齊捌议,使得可以捕獲更多的互補信息哼拔。
綜合上述表示引有,DEMVC的total loss如下:

DEMVC total loss.png

這么做作者既保留了來自不同視圖的local structure瓣颅,也使用參照視圖的方法捕獲了來自不同視圖的互補信息。

關于聚類中心初始化的一致性策略

作者考慮為多個視圖設置相同的類簇譬正,以更好地遵循共識原則宫补。這樣,多個視圖就不會僅限其自己的群集中心曾我,更易于接受所引用視圖的指導粉怕。因此在初始化聚類中心的時候引入了首選的參考視圖V_s,使用k-menas初始化:

mse.png

~
Consistency strategy.png

值得注意的是抒巢,這種相同簇中心的初始化只在初始化階段贫贝。在fine-tuning階段,簇中心則是在多視圖協(xié)同訓練過程中同步更新蛉谜,并且只有當前的參考視圖是共享的稚晚,而每個視圖出來的soft label是不同的。


這個思想和我們約束聚類的方式很像型诚,只不過使用了trick用于深度模型客燕。值得借鑒。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末狰贯,一起剝皮案震驚了整個濱河市也搓,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌涵紊,老刑警劉巖傍妒,帶你破解...
    沈念sama閱讀 217,826評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異摸柄,居然都是意外死亡颤练,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評論 3 395
  • 文/潘曉璐 我一進店門塘幅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來昔案,“玉大人,你說我怎么就攤上這事电媳√ごВ” “怎么了?”我有些...
    開封第一講書人閱讀 164,234評論 0 354
  • 文/不壞的土叔 我叫張陵匾乓,是天一觀的道長捞稿。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么娱局? 我笑而不...
    開封第一講書人閱讀 58,562評論 1 293
  • 正文 為了忘掉前任彰亥,我火速辦了婚禮,結果婚禮上衰齐,老公的妹妹穿的比我還像新娘任斋。我一直安慰自己,他們只是感情好耻涛,可當我...
    茶點故事閱讀 67,611評論 6 392
  • 文/花漫 我一把揭開白布废酷。 她就那樣靜靜地躺著,像睡著了一般抹缕。 火紅的嫁衣襯著肌膚如雪澈蟆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,482評論 1 302
  • 那天卓研,我揣著相機與錄音趴俘,去河邊找鬼。 笑死奏赘,一個胖子當著我的面吹牛寥闪,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播志珍,決...
    沈念sama閱讀 40,271評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼橙垢,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了伦糯?” 一聲冷哼從身側響起柜某,我...
    開封第一講書人閱讀 39,166評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎敛纲,沒想到半個月后喂击,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體背犯,經(jīng)...
    沈念sama閱讀 45,608評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡讨勤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,814評論 3 336
  • 正文 我和宋清朗相戀三年矩桂,在試婚紗的時候發(fā)現(xiàn)自己被綠了夏志。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,926評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡潘拨,死狀恐怖非迹,靈堂內(nèi)的尸體忽然破棺而出惩歉,到底是詐尸還是另有隱情抡谐,我是刑警寧澤裁奇,帶...
    沈念sama閱讀 35,644評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站麦撵,受9級特大地震影響刽肠,放射性物質發(fā)生泄漏溃肪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,249評論 3 329
  • 文/蒙蒙 一音五、第九天 我趴在偏房一處隱蔽的房頂上張望惫撰。 院中可真熱鬧,春花似錦躺涝、人聲如沸厨钻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽莉撇。三九已至呢蛤,卻和暖如春惶傻,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背其障。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評論 1 269
  • 我被黑心中介騙來泰國打工银室, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人励翼。 一個月前我還...
    沈念sama閱讀 48,063評論 3 370
  • 正文 我出身青樓蜈敢,卻偏偏與公主長得像,于是被迫代替她去往敵國和親汽抚。 傳聞我的和親對象是個殘疾皇子抓狭,可洞房花燭夜當晚...
    茶點故事閱讀 44,871評論 2 354

推薦閱讀更多精彩內(nèi)容