論文粗讀“Dual Mutual Information Constraints for Discriminative Clustering”

Li, Hongyu et al. “Dual Mutual Information Constraints for Discriminative Clustering.” AAAI Conference on Artificial Intelligence (2023).

摘要導(dǎo)讀

深度聚類是機器學(xué)習(xí)和數(shù)據(jù)挖掘中的一項基本任務(wù),旨在學(xué)習(xí)面向聚類的特征表示。在以往的研究中朋其,大多數(shù)的深度聚類方法都遵循自監(jiān)督表示學(xué)習(xí)的思想通過最大化相似實例對的一致性,而忽略特征冗余對聚類性能的影響砍鸠。因此涡拘,作者設(shè)計了一種基于深度對比聚類結(jié)構(gòu)的雙互信息約束聚類方法DMICC唉堪,其中雙互信息約束給出了堅實的理論保證和實驗驗證分衫。具體來說场刑,在特征層面上,通過最小化所有維度上的互信息來減少特征之間的冗余蚪战,以鼓勵神經(jīng)網(wǎng)絡(luò)提取更多可辨別的特征牵现。在樣本層面,最大化相似實例對的互信息邀桑,以獲得更無偏和魯棒的表示瞎疼。雙互信息約束同時作用,相互補充概漱,共同優(yōu)化適合聚類任務(wù)的更好的特征丑慎。

具體的概念圖如下所示:
粗淺一點解釋的話,就是將特征選擇和表示學(xué)習(xí)利用互信息做成了相互促進補充的關(guān)系瓤摧,從而學(xué)習(xí)適合下游任務(wù)的特征表示。
方法淺析

首先通過兩個數(shù)據(jù)增強來構(gòu)造數(shù)據(jù)對玉吁。然后照弥,使用參數(shù)共享網(wǎng)絡(luò)從不同的數(shù)據(jù)擴充中提取特征。并且對從兩個分支中提取的特征進行IMI約束进副,然后采用非參數(shù)SoftMax这揣,對每個分支進行FMI約束,用于學(xué)習(xí)可辨別的樣本特征影斑。

  • Feature Redundancy-Minimization Module
    該模塊的關(guān)注重點是特征冗余给赞,在特征層面實現(xiàn)了互信息最小化約束。該模塊的目標(biāo)是通過這種方式有效地減少特征維度之間的冗余性矫户,獲得更多的鑒別特征片迅,以提升深度聚類的效率。在信息論中皆辽,熵是不確定性的度量柑蛇,這里將它記為H芥挣。以下是涉及到的一些互信息計算的公式:(信息熵是考慮該隨機變量的所有可能取值,即所有可能發(fā)生事件所帶來的信息量的期望)
    變量X的熵:H(X)= -\sum_{x \in X} p(x)\log p(x)耻台,p(x)x發(fā)生的概率空免。
    條件熵:

    論文中用到的互信息公式:I(X;Y) = \sum_{x \in X} \sum_{y \in Y} p(x, y)\log \frac{p(x, y)}{p(x)p(y)}
    假設(shè)由前面的特征抽取器提取的特征矩陣為F^1 \in \mathbb{R}^{b \times d}F^2 \in \mathbb{R}^{b \times d},并使用f^1_lf^2_l分別表示F^1F^2的第l列盆耽。忽略下標(biāo)蹋砚,給定特征矩陣F,可以表示為d個列向量摄杂,即F=[f_1, f_2, \cdots, f_d]坝咐。因此,要實現(xiàn)特征層面的互信息的最小化匙姜,其目標(biāo)函數(shù)可以寫作:\min \frac{1}{d^2}\sum_{i}^d\sum_j^dI(f_i, f_j)畅厢。
    --
    作者思路:因為要計算特征層面信息的最小化,根據(jù)互信息公式氮昧,我們需要知道特征維度的聯(lián)合概率分布p(f_i, f_j)框杜,以及邊緣分布概率p(f_i)p(f_j)。作者認為維度之間相關(guān)性的度(degree)和聯(lián)合概率分布有很強的聯(lián)系袖肥,即咪辱,當(dāng)維度的相關(guān)性顯著時,聯(lián)合概率分布的值較高椎组。因此油狂,作者假設(shè)聯(lián)合概率分布p(f_i, f_j)可以在一定程度上被維度之間的相關(guān)值所代替。具體來說寸癌,可以首先構(gòu)造協(xié)方差矩陣cov(f_i,f_j)并對其進行歸一化专筷,最后的結(jié)果作為聯(lián)合概率分布p(f_i, f_j)
    --
    具體的操作為:對F進行歸一化蒸苇,利用內(nèi)積得到相關(guān)性矩陣C =(F^T F)\in \mathbb{R}^{d \times d}磷蛹。
    根據(jù)前面的假設(shè),
    聯(lián)合分布p(f_i, f_j)可以由以下形式計算:p(f_i, f_j)=\frac{C(f_i, f_j)}{sum(C)}溪烤。其中味咳,C(f_i, f_j)表示f_if_j的相關(guān)性得分,sum(C)表示矩陣C的和檬嘀。
    邊緣分布p(f_i) = \sum_{j=1}^d p(f_i, f_j)槽驶,p(f_j) = \sum_{i=1}^d p(f_i, f_j)
    由此,該模塊的FMI約束損失\mathcal{L}_{FMI}可以表示為如下的形式:
    其中鸳兽,\eta是一個平衡超參數(shù)掂铐,用來縮放邊際概率分布。
    --
    方法有效性的證明這里不再贅述,可以移步原文

  • Instance Similarity-Maximization Module
    Instance discrimination Backbone 實例識別的關(guān)鍵是:假設(shè)每個實例都代表一個不同的類堡纬。假設(shè)有n個圖像x_1,\cdots,x_n及其對應(yīng)的特征v_1, \cdots, v_n聂受。作者這里使用v_i作為權(quán)重向量的代替。
    因此該模塊的重點在于學(xué)習(xí)一個嵌入映射函數(shù)f_{\theta}烤镐,其中v=f_{\theta}(x)蛋济。這里v通過一層L_2正則化層強制||v||=1
    根據(jù)任務(wù)設(shè)定炮叶,每個樣本instance都是一個類別碗旅,那么依據(jù)給定樣本x的表示v分到第i個類別的概率可以表示為如下的形式p(i|v)=\frac{\exp(v_i^Tv/\tau)}{\sum_{j=1}^n\exp(v_j^Tv/\tau)},這里是圖中的非參的softmax操作镜悉。\tau是一個溫度超參祟辟。(雖然但是,這里的v_iv對應(yīng)的shape寫的不是很清楚侣肄。按照向量乘法的規(guī)則來說旧困,v_iv應(yīng)該都是列向量,即其shape應(yīng)該為d \times 1稼锅。樣本標(biāo)記i對應(yīng)的是第i個類別吼具,因為這里將每個樣本分為單獨的一類,v是給定樣本x對應(yīng)的表示)
    而對于Instance discrimination Backbone 矩距,其優(yōu)化目標(biāo)為最大化聯(lián)合概率分布\prod_{i=1}^np(i|f_{\theta}(x_i))=\prod_{i=1}^np(i|v_i)即將每個樣本無誤地分配到自己特定的類別中拗盒。在神經(jīng)網(wǎng)絡(luò)中其負對數(shù)優(yōu)化函數(shù)如下:


    --
    附圖為帶參數(shù)的softmax:
    以及pyTorch官方的softmax函數(shù)定義:

--
IMI Constraint 作者試圖引入對比學(xué)習(xí)來最大限度地提高對由同一組圖像生成的增強實例對的MI約束,從而產(chǎn)生更無偏和魯棒的特征锥债。
假設(shè)原始的圖像輸入為X陡蝇,經(jīng)過數(shù)據(jù)增強得到的圖像分別為X^1X^2,其對應(yīng)的矩陣為F^1=[v^1_1;\cdots;v^1_b]F^2=[v^2_1;\cdots;v^2_b]哮肚。其中v_i^1=f_{\theta}(x_i^1),v_i^2=f_{\theta}(x_i^2)登夫。目標(biāo)是最大化相應(yīng)表示的MI:

假設(shè)在基于參數(shù)共享模型的兩個分支上的特征表示的大小都是[b, d]
其聯(lián)合分布可以表示為:P=\frac{1}允趟\sum_{i=1}^bF^1(F^2)^T悼嫉。
邊緣分布P(v_i^1)=\sum_{j=1}^dP(v^1_i, v^2_j), P(v_j^2)=\sum_{i=1}^dP(v^1_i, v^2_j)
(這里可以想成是i來自第一個b,而j是第二個b的索引)拼窥。
考慮到矩陣的對稱性,P(P+P^T)/2進行對稱化蹋凝。所以有如下的IMI形式:I(F^1, F^2)=\sum_{i=1}^d\sum_{j=1}^dP(v_i^1, v_j^2)\log\frac{P(v_i^1, v_j^2)}{P(v_i^1)P( v_j^2)}
其對應(yīng)的損失函數(shù)形式為:\mathcal{L}_{IMI}=-\sum_{i=1}^d\sum_{j=1}^dP(v_i^1, v_j^2)\log\frac{P(v_i^1, v_j^2)}{\gamma^2 P(v_i^1)P( v_j^2)}
其中\gamma是一個非零常數(shù)鲁纠。在實驗中,原始的MI解可能會得到平凡的解鳍寂。因此改含,考慮通過放寬邊緣分布來進一步增加熵的共享性來避免平凡解。

  • 總體損失
    不失一般性迄汛,模型整體的目標(biāo)函數(shù)為:
    其中三個損失分別為實例判別損失捍壤、實例相似度最大化損失和特征冗余最小化損失骤视。
    --
    目標(biāo)函數(shù)的有界性證明請移步原文,這里不進行贅述
  • 聚類
    從模型設(shè)計的角度看鹃觉,應(yīng)該是使用設(shè)計的網(wǎng)絡(luò)和損失函數(shù)進行了表示的學(xué)習(xí)F^1F^2并直接使用k-means進行聚類专酗。

從論文的整體來看,主要是將特征選擇和表示學(xué)習(xí)利用互信息結(jié)合在一起盗扇。在筆者看來祷肯,無論是否引入實例識別部分(Instance discrimination Backbone )好像對兩種互信息的約束都沒有影響,因此疗隶,對于模型中為什么一定要存在這一部分交代的不是很明白佑笋。可能需要去再閱讀下作者引用的idea的原文斑鼻。蒋纬。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市坚弱,隨后出現(xiàn)的幾起案子蜀备,更是在濱河造成了極大的恐慌,老刑警劉巖史汗,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件琼掠,死亡現(xiàn)場離奇詭異,居然都是意外死亡停撞,警方通過查閱死者的電腦和手機瓷蛙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來戈毒,“玉大人艰猬,你說我怎么就攤上這事÷袷校” “怎么了冠桃?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長道宅。 經(jīng)常有香客問我食听,道長,這世上最難降的妖魔是什么污茵? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任樱报,我火速辦了婚禮,結(jié)果婚禮上泞当,老公的妹妹穿的比我還像新娘迹蛤。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布盗飒。 她就那樣靜靜地躺著嚷量,像睡著了一般。 火紅的嫁衣襯著肌膚如雪逆趣。 梳的紋絲不亂的頭發(fā)上蝶溶,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天,我揣著相機與錄音汗贫,去河邊找鬼身坐。 笑死,一個胖子當(dāng)著我的面吹牛落包,可吹牛的內(nèi)容都是我干的部蛇。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼咐蝇,長吁一口氣:“原來是場噩夢啊……” “哼涯鲁!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起有序,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤抹腿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后旭寿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體警绩,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年盅称,在試婚紗的時候發(fā)現(xiàn)自己被綠了肩祥。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,696評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡缩膝,死狀恐怖混狠,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情疾层,我是刑警寧澤将饺,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站痛黎,受9級特大地震影響予弧,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜湖饱,卻給世界環(huán)境...
    茶點故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一桌肴、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧琉历,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蝇恶,卻和暖如春拳魁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背撮弧。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工潘懊, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人贿衍。 一個月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓授舟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親贸辈。 傳聞我的和親對象是個殘疾皇子释树,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,592評論 2 353

推薦閱讀更多精彩內(nèi)容