論文閱讀“Multi-VAE: Learning Disentangled View-common and View-peculiar Visual Representations for MvC”

Xu J, Ren Y, Tang H, et al. Multi-VAE: Learning disentangled view-common and view-peculiar visual representations for multi-view clustering[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2021: 9234-9243.

摘要導(dǎo)讀

作者表示當(dāng)前的多視圖聚類任務(wù)經(jīng)常通過融合多個(gè)視圖表示或在一個(gè)共同的特征空間中處理聚類榆纽,這可能會(huì)導(dǎo)致各種特征糾纏在一起,特別是在視覺表示中。本文提出了一個(gè)基于VAE的多視圖聚類框架來學(xué)習(xí)視圖表示,總體來說在生成模型中引入了一個(gè)視圖共有變量和多個(gè)視圖特有變量灭衷。具體來說垮衷,視圖共有變量先驗(yàn)近似服從離散的Gumbel Softmax分布冈闭,用于抽取多個(gè)視圖中共享的類簇因子稼稿。同時(shí)佃却,視圖特有變量先驗(yàn)服從連續(xù)高斯分布者吁,以學(xué)習(xí)各視圖的特定的視覺特征。通過控制互信息來解耦視圖共享表示和視圖特有表示饲帅,這樣離散的類簇信息和連續(xù)的視圖信息將會(huì)被很好的挖掘复凳。

模型淺析
  • 問題聲明
    給定多視圖圖像數(shù)據(jù)集\{x_i^1,x_i^2, \cdots,x_i^V\}_{i=1}^N,每個(gè)樣本包含V個(gè)視圖分別包含不同的視覺信息灶泵,N是數(shù)據(jù)集的大小育八。多視圖聚類的目的是將綜合給定的視圖特征降樣本分配到K個(gè)類簇中。

  • 網(wǎng)絡(luò)結(jié)構(gòu)
    整體的動(dòng)機(jī)是通過VAE學(xué)習(xí)解耦的多視圖表示赦邻,具體做法是引入相互獨(dú)立的視圖共有變量c \in \mathbb{R}^K和視圖特有變量\{z^v \in \mathbb{R}^{Z_v}\}_{v=1}^V來建模多視圖數(shù)據(jù)髓棋。也就是說,整個(gè)模型需要考慮如下的生成模型(聯(lián)合概率):p(x^v,z^v,c)\\=p(x^v|z^v,c)p(z^v,c)\\=p(x^v|z^v,c)p(z^v)p(c)其中惶洲,c對(duì)應(yīng)數(shù)據(jù)的類簇信息按声,由所有視圖共享。z^v則是每個(gè)視圖對(duì)應(yīng)的不同的特征恬吕。由此签则,可以得出,cz^v的后驗(yàn)分別可以寫成p(c|\{x^v\})p(c|x^v)铐料,考慮到在VAE中難以計(jì)算后驗(yàn)的積分渐裂。在模型中使用\phi\phi^v參數(shù)化q_{\phi}(c|\{x^v\})q_{{\phi}^v}(z^v|x^v)來近似真正的后驗(yàn)。

  1. 推斷過程
    在推斷過程中钠惩,所有視圖的嵌入表示被拼接到一起以學(xué)習(xí)數(shù)據(jù)的共有信息芯义。隨后,通過K(i.e. s=\{s_1,s_2, \cdots, s_K\})個(gè)神經(jīng)元獲取視圖共有向量c妻柒。具體地說扛拨,為了輕松地表示數(shù)據(jù)的聚類分配,期望c是一個(gè)one-hot表示举塔。然而绑警,離散隨機(jī)變量對(duì)于神經(jīng)網(wǎng)絡(luò)的參數(shù)是不可微的。因此央渣,本文中计盒,p(c)被表示為相互獨(dú)立均勻的Gumbel Softmax分布的乘積p(c)=p(c_1)p(c_2)\cdots p(c_K),其中p(c_k) \sim Gumbel(0,1 )芽丹。因此北启,近似后驗(yàn)q_{\phi}(c|\{x^v\})表示為如下:q_{\phi}(c|\{x^v\}) = \prod_{k=1}^{K}q_{\phi}(c_k|\{x^v\}。為了讓整個(gè)過程變得可微,本文引入了Gumbel-Max重參數(shù)技巧:

    其中咕村,g_k~Gumbel(0,1)\tau是溫度參數(shù)场钉。
    不同于類簇信息,模型假設(shè)其他的視圖特有信息是連續(xù)的懈涛,每個(gè)變量的先驗(yàn)是標(biāo)準(zhǔn)正太分布逛万,p(z^v)=\mathcal{N}(0,I)q_{\phi^v}(z^v|x^v)被參數(shù)化為高斯因子乘積:
    同理批钠,根據(jù)重參數(shù)技巧宇植,有如下的等價(jià)表示:

  2. 生成過程
    在生成的過程中,視圖共有特征c和視圖特有特征z^v拼接在一起生成對(duì)應(yīng)的樣本\hat{x}^v埋心。即指郁,給定視圖v的生成如下:

    在整個(gè)結(jié)構(gòu)中,參數(shù)\phi, \{\phi^v\}, \{\theta^v\}是部分共享的拷呆。

  3. Multi-VAE-C:
    由于c是one-hot表示的近似值闲坎,因此第i個(gè)樣本的類簇預(yù)測可以通過:

  4. Multi-VAE-CZ:
    鑒于多個(gè)視圖的視覺信息可能是類簇信息的補(bǔ)充,分離出的視圖表示被縮放到[0,1]洋腮,并將它們拼接起來形成一個(gè)全局潛在表示[c; {z^v}], 然后將其喂入K-means得到聚類分配。

  • 變分下界
    變分推理的目的是最大化觀察到的多視圖數(shù)據(jù)的似然函數(shù)手形。
    作者在后續(xù)的推導(dǎo)中假設(shè)cz^v是相互獨(dú)立的啥供,這一點(diǎn)我有點(diǎn)不理解。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末库糠,一起剝皮案震驚了整個(gè)濱河市伙狐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瞬欧,老刑警劉巖贷屎,帶你破解...
    沈念sama閱讀 218,451評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異艘虎,居然都是意外死亡唉侄,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門野建,熙熙樓的掌柜王于貴愁眉苦臉地迎上來属划,“玉大人,你說我怎么就攤上這事候生⊥校” “怎么了?”我有些...
    開封第一講書人閱讀 164,782評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵唯鸭,是天一觀的道長须蜗。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么明肮? 我笑而不...
    開封第一講書人閱讀 58,709評(píng)論 1 294
  • 正文 為了忘掉前任菱农,我火速辦了婚禮,結(jié)果婚禮上晤愧,老公的妹妹穿的比我還像新娘大莫。我一直安慰自己,他們只是感情好官份,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,733評(píng)論 6 392
  • 文/花漫 我一把揭開白布只厘。 她就那樣靜靜地躺著,像睡著了一般舅巷。 火紅的嫁衣襯著肌膚如雪羔味。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,578評(píng)論 1 305
  • 那天钠右,我揣著相機(jī)與錄音赋元,去河邊找鬼。 笑死飒房,一個(gè)胖子當(dāng)著我的面吹牛搁凸,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播狠毯,決...
    沈念sama閱讀 40,320評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼护糖,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼!你這毒婦竟也來了嚼松?” 一聲冷哼從身側(cè)響起嫡良,我...
    開封第一講書人閱讀 39,241評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎献酗,沒想到半個(gè)月后寝受,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,686評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡罕偎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,878評(píng)論 3 336
  • 正文 我和宋清朗相戀三年很澄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片颜及。...
    茶點(diǎn)故事閱讀 39,992評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡痴怨,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出器予,到底是詐尸還是另有隱情浪藻,我是刑警寧澤,帶...
    沈念sama閱讀 35,715評(píng)論 5 346
  • 正文 年R本政府宣布乾翔,位于F島的核電站爱葵,受9級(jí)特大地震影響施戴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜萌丈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,336評(píng)論 3 330
  • 文/蒙蒙 一赞哗、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧辆雾,春花似錦肪笋、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至惭墓,卻和暖如春坛梁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背腊凶。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評(píng)論 1 270
  • 我被黑心中介騙來泰國打工划咐, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人钧萍。 一個(gè)月前我還...
    沈念sama閱讀 48,173評(píng)論 3 370
  • 正文 我出身青樓褐缠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親风瘦。 傳聞我的和親對(duì)象是個(gè)殘疾皇子队魏,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,947評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容