引用格式:Xu J, Ren Y, Li G, et al. Deep Embedded Multi-view Clustering with Collaborative Training[J]. arXiv preprint arXiv:2007.13067, 2020.
摘要翻譯
通過利用來自多視圖的信息桶现,多視圖聚類最近引起了越來越多的關注蚜点。但是敷搪,現(xiàn)有的多視圖聚類方法要么具有較高的計算和空間復雜性,要??么缺乏表示能力。為了解決這些問題巷挥,我們在本文中提出了帶有協(xié)作訓練(DEMVC)的深度嵌入式多視圖聚類梧奢。首先,深度自動編碼器分別學習多個視圖的嵌入表示穆刻。然后,考慮了多方意見的共識和互補杠步,提出了一種新穎的協(xié)作訓練方案氢伟。具體來說,所有視圖的特征表示和聚類分配都是通過協(xié)作學習的幽歼。進一步開發(fā)了用于聚類中心初始化的新一致性策略朵锣,以通過協(xié)作訓練來改善多視圖聚類性能。在多個流行的多視圖數(shù)據(jù)集上的實驗結果表明甸私,DEMVC與最新方法相比有了顯著改進诚些。
論文的關注點在于:使用協(xié)同訓練機制來對不同視圖的表示和聚類分配進行協(xié)作學習(輪流使用不同視圖的信息)。
模型描述
DEMVC包含個encoders和其對應的
個decoders(這里構成了深度自編碼器對多個視圖的嵌入表示),除此之外诬烹,還有對應
個視圖的
個聚類層砸烦。簡單圖示如下:
對于多視圖信息的引用則是在不同輪迭代中選取參照視圖。上圖顯示第一視圖作為參考視圖绞吁,如實線所示幢痘。 虛線表示相應的不參與本輪計算。 引用的參照視圖將依次更改以便學習不同視圖中的補充信息家破。
方法解析
多視圖協(xié)同訓練
數(shù)據(jù)集的定義:代表當前視圖
的維度為
颜说,并且在此數(shù)據(jù)集中含有
個 樣本。
為該數(shù)據(jù)集的視圖個數(shù)汰聋,表示每個對象有
個子樣本需要聚類门粪。對于每個視圖
,定義
和
分別為編碼器和解碼器马僻。
和
為可訓練的參數(shù)庄拇。
因此網(wǎng)絡模型的編碼部分可以形式化為如下的內(nèi)容:
在loss函數(shù)的定義上,為每個視圖
聚類損失還是使用了DEC中提出的Kullback-Leibler (KL) divergence女淑,定義如下:
這里明晰一下clustering loss的由來和組成(主要是提醒自己):
在這個式子中瞭郑,主要有兩個帶下標的分布,即和
鸭你。
首先初始化view中類簇
的簇中心
屈张,
旨在表示每個embedded point
和不同的cluster center
之間的相似度,使用了t-分布進行構造袱巨,這里給出t-分布的簡單介紹阁谆。
t-distr.png
上圖展示了一些作者可能的構造分布的想法,
q_ij.png
在當前的聚類任務中愉老,被當做soft label也就是以概率的形式分配當前視圖
中第
個樣本到第
個類簇的可能性场绿。隨著平方運算和聚類軟標簽
的歸一化,DEC模型中 建立了輔助目標分布
來實現(xiàn)深度單視圖聚類嫉入。顯然在DEMVC中焰盗,每個視圖
對應的輔助分布利用如下計算:
p_ij.png
為了更好的說明KL散度對聚類的影響,作者甚至還給出了2聚類的相關示意圖咒林。
為了避免多視圖間的互補信息被忽略熬拒,作者采用了讓每個視圖分別成為參照視圖來引導整個框架學習適合聚類的特征。將其稱為multi-view collaborative training垫竞。因此我們定義為當前參考視圖的輔助目標分布澎粟,并且這個輔助目標分布在數(shù)據(jù)的多個視圖之間共享。對于視圖
的clustering loss則改變?yōu)槿缦拢?br>
關于這個參照視圖的作用及解釋,作者給出了如下的說法:
大概意思是對不同view的坐標參照系進行了對齊捌议,使得可以捕獲更多的互補信息哼拔。
綜合上述表示引有,DEMVC的total loss如下:
這么做作者既保留了來自不同視圖的local structure瓣颅,也使用參照視圖的方法捕獲了來自不同視圖的互補信息。
關于聚類中心初始化的一致性策略
作者考慮為多個視圖設置相同的類簇譬正,以更好地遵循共識原則宫补。這樣,多個視圖就不會僅限其自己的群集中心曾我,更易于接受所引用視圖的指導粉怕。因此在初始化聚類中心的時候引入了首選的參考視圖,使用k-menas初始化:
值得注意的是抒巢,這種相同簇中心的初始化只在初始化階段贫贝。在fine-tuning階段,簇中心則是在多視圖協(xié)同訓練過程中同步更新蛉谜,并且只有當前的參考視圖是共享的稚晚,而每個視圖出來的soft label是不同的。
這個思想和我們約束聚類的方式很像型诚,只不過使用了trick用于深度模型客燕。值得借鑒。