CADA-VAE論文閱讀筆記

文中涉及的概念

Few-shot learning

每個類只有很少的可見例子(一般小于10)队贱,訓練一個模型對其分類色冀。

Zero-shot learning

現(xiàn)有一些可見的例子和一些不可見的例子潭袱,使用可見的例子訓練模型能夠?qū)Σ豢梢姷睦舆M行分類柱嫌。

Generalized zero-shot learning

現(xiàn)有一些可見的例子和一些不可見的例子,使用可見的例子訓練模型能夠?qū)λ械睦舆M行分類屯换。

Multi-modal alignment

多模態(tài)對齊编丘,尋找不同模態(tài)(如圖像、文字彤悔、語音)中的屬性的對應(yīng)關(guān)系嘉抓,文中主要是指多個VAE中的latent space的屬性的對齊。

本文主要的工作貢獻

  • 訓練了多個VAE從不同模態(tài)晕窑,如圖像和類屬性抑片,中加密和解密特征,得到隱特征
  • 通過對齊參數(shù)分布和減小跨模態(tài)重構(gòu)損失來使隱特征多模態(tài)對齊
  • CADA-VAE證明了用于廣義零鏡頭學習的交叉模態(tài)嵌入模型比數(shù)據(jù)生成方法具有更好的性能杨赤,建立了新的state-of-the-art敞斋。

主要的難點詳解

數(shù)據(jù)增強的方式

不是增強數(shù)據(jù)本身而是增強數(shù)據(jù)的表達(隱特征)

VAE

變分自編碼是自編碼的一種,其學習得到的特征能夠用于生成更多的數(shù)據(jù)疾牲。也就是我們想通過很多可觀測到的X圖像分布來構(gòu)造出z特征植捎,通過調(diào)整z的屬性來得到更多不同的X1圖像分布,所以我們的任務(wù)可以描述為:

  1. 使用X通過編碼器計算得到z
  2. 通過z通過解碼器計算得到X1
  3. 讓q(z)與p(z|X)近可能的相似

這里的q(z)與p(z|X)是兩個概率分布,通常計算兩個概率分布的距離公式采用KL散度:

D_{KL}({q(x)}\parallel{p(x)})={\sum p(x)\ln\frac{p(x)}{q(x)}}

訓練VAE的損失函數(shù):

loss_{VAE} = D_{KL}(q(X,z) \parallel p(X,z)) = \sum [- \sum p(z|X)\ln{q(X|z)} + D_{KL}({p(z|X)}\parallel{q(z)})]

模態(tài)對齊的方式

這里兩種模態(tài)的特征都是用VAE生成的阳柔,第一個模態(tài)的特征z_1是使用圖像生成的焰枢,第二個模態(tài)的特征z_2是使用類屬性生成的,要使他們的屬性對齊文中采用了兩種損失函數(shù)舌剂。

交叉對齊損失

實際上就是將一張圖像x與其類屬性分別通過編碼器E_1济锄、E_2后得到的z_1、z_2交叉通過解碼器D_1霍转、D_2得到的x'計算歐式距離

loss_{CA} = \sum^M_i\sum^M_{j\not={i}}\left|x^{(j)}-D_j(E_i(x^{(i)}))\right|

分布對齊損失

這里實際上是在計算z_1荐绝、z_2的概率分布的相似程度,采用的是Wasserstein距離:

W_{ij}=\left(\left\|\mu_i-\mu_j\right\|^2_2+\left\|\sum\nolimits^{1\over2}_i-\sum\nolimits^{1\over2}_j\right\|^2_{Frobenius}\right)^{1\over2}

而分布對齊損失就是所有組合情況的Wasserstein距離之和:

loss_{DA}=\sum^M_i\sum^M_{j\not=i}W_{ij}

整體的損失函數(shù)

就是上述三個損失函數(shù)的加權(quán)求和:

loss_{CADA-VAE}=loss_{VAE}+\gamma loss_{CA}+\delta loss_{DA}

總結(jié)

作者提出的zero-shot learning的思想主要是如何將圖像通過一個VAE得到的特征與該圖像對應(yīng)的類屬性通過另一個VAE得到的特征對應(yīng)起來谴忧,這樣就可以將類屬性提取的特征可以與圖像提取的特征進行比較很泊,當一個未知圖像進入模型后就能計算出它的特征與各個類屬性的特征之間的距離,根據(jù)各個距離之間的比例就能實現(xiàn)zero-shot learning沾谓。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末委造,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子均驶,更是在濱河造成了極大的恐慌昏兆,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件妇穴,死亡現(xiàn)場離奇詭異爬虱,居然都是意外死亡隶债,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進店門跑筝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來死讹,“玉大人,你說我怎么就攤上這事曲梗≡蘧” “怎么了?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵虏两,是天一觀的道長愧旦。 經(jīng)常有香客問我,道長定罢,這世上最難降的妖魔是什么笤虫? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮祖凫,結(jié)果婚禮上琼蚯,老公的妹妹穿的比我還像新娘。我一直安慰自己蝙场,他們只是感情好凌停,可當我...
    茶點故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布脓魏。 她就那樣靜靜地躺著戴尸,像睡著了一般。 火紅的嫁衣襯著肌膚如雪驱敲。 梳的紋絲不亂的頭發(fā)上完箩,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天赐俗,我揣著相機與錄音,去河邊找鬼弊知。 笑死阻逮,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的秩彤。 我是一名探鬼主播叔扼,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼漫雷!你這毒婦竟也來了瓜富?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤降盹,失蹤者是張志新(化名)和其女友劉穎与柑,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡价捧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年丑念,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片结蟋。...
    茶點故事閱讀 39,902評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡脯倚,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出椎眯,到底是詐尸還是另有隱情挠将,我是刑警寧澤,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布编整,位于F島的核電站,受9級特大地震影響乳丰,放射性物質(zhì)發(fā)生泄漏掌测。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一产园、第九天 我趴在偏房一處隱蔽的房頂上張望汞斧。 院中可真熱鬧,春花似錦什燕、人聲如沸粘勒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽庙睡。三九已至,卻和暖如春技俐,著一層夾襖步出監(jiān)牢的瞬間乘陪,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工雕擂, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留啡邑,地道東北人。 一個月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓井赌,卻偏偏與公主長得像谤逼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子仇穗,可洞房花燭夜當晚...
    茶點故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內(nèi)容