論文閱讀(五)Leveraging theInvariant Side of Generative Zero-Shot Learning

1. 論文摘要

傳統(tǒng)的零樣本學習(ZSL)方法通常學習嵌入巧骚,例如視覺語義映射赊颠,以間接的方式處理看不見的視覺樣本。本文利用生成對抗網(wǎng)絡(GANs)的優(yōu)點劈彪,提出了一種利用不變邊(invariant side)GAN(LisGAN)的方法竣蹦,該方法可以直接從語義描述約束的隨機噪聲中生成看不見的特征。具體地說沧奴,我們訓練了一個條件化的Wasserstein GANs痘括,在這個GANs中,生成器通過噪聲合成假的看不見的特征滔吠,鑒別器通過一個minimax游戲區(qū)分假的和真的纲菌。考慮到一個語義描述可以對應各種合成的視覺樣本疮绷,語義描述是生成特征的靈魂翰舌,本文引入了靈魂樣本作為生成零樣本學習的不變邊。靈魂樣本是一個類的元表示冬骚。它將同一類別中每個樣本最有語義意義的方面可視化椅贱。我們規(guī)定懂算,每個生成的樣本(生成ZSL的變化側(cè))應該至少接近一個具有相同類標簽的靈魂樣本(不變側(cè))。在零樣本識別階段庇麦,我們建議使用兩個分類器犯犁,它們以級聯(lián)方式部署,以獲得從粗到細的結(jié)果女器。在五個流行的基準上進行的實驗證明酸役,我們提出的方法可以在顯著改進的情況下優(yōu)于最先進的方法。

2. 主要思想

2.1 主要概念

(1)不變邊(invariant side)
靈魂樣本作為生成零樣本學習的不變邊驾胆。靈魂樣本是一個類的元表示涣澡。
(2)考慮到一個語義描述可以對應大量的視覺樣本,有限的語義信息限制了零樣本學習的性能丧诺。

2.2 主要挑戰(zhàn)

因此昧廷,零樣本學習的生成對抗網(wǎng)絡必須挑戰(zhàn)兩個問題:1)如何保證基于有限甚至相似屬性的生成具有多樣性潜圃?2)如何確保每個生成的樣本與真實樣本和對應的語義描述高度相關租副?

2.3 解決思路

首先郑藏,為了保證生成的樣本是有意義的,我們提出從隨機噪聲中生成樣本呵晚,這些隨機噪聲受類語義描述的約束蜘腌。同時,還引入了GAN鑒別器中的監(jiān)督分類損失饵隙,以保護對抗訓練中的班間歧視撮珠。此外,為了保證每個合成樣本(生成零鏡頭學習的變化側(cè))與真實樣本和相應的語義描述(不變側(cè))高度相關金矛,本文引入了靈魂樣本芯急,如圖3所示。對于未看到的類驶俊,生成的示例的視覺特征僅取決于語義描述娶耍。因此,語義信息是生成樣本的靈魂饼酿。靈魂樣本必須不是很具體榕酒,這樣它才能清楚地看到最有語義意義的方面,并盡可能多地與樣本相關嗜湃。因此奈应,對于所看到的圖像,我們定義靈魂樣本是它們的平均表示购披。對于生成的樣本,我們將其規(guī)則化為接近靈魂樣本肩榕。因此刚陡,我們可以保證每個生成的樣本都與真實的樣本和相應的語義描述高度相關惩妇。

2.4 主要貢獻

總之,本文的主要貢獻是:
1)我們提出了一種新的利用生成對抗網(wǎng)絡的ZSL方法LisGAN筐乳。具體來說歌殃,我們部署有條件的GANS來解決兩個問題:生成多樣性和生成可靠性。為了提高生成特征的質(zhì)量蝙云,我們引入了靈魂樣本氓皱,定義為每個類別的表示。通過進一步考慮不同圖像的多視角性質(zhì)勃刨,我們提出為每個類定義多個靈魂樣本波材。我們將每一個生成的樣本規(guī)則化,使其接近至少一個靈魂樣本身隐,從而使生成零鏡頭學習中的變化側(cè)不會脫離不變側(cè)廷区。
2)在零樣本識別階段,我們建議贾铝,如果我們對識別一個看不見的樣本有很高的信心隙轻,那么該樣本(帶有指定的偽標簽)將被用作識別其他看不見樣本的參考。具體地說垢揩,我們建議使用兩個分類器玖绿,以級聯(lián)的方式部署,以獲得從粗到細的結(jié)果叁巨。本文還提出了一種簡單而有效的分類置信度度量方法镰矿。
3)對五個廣泛使用的數(shù)據(jù)集進行了大量的實驗,驗證了我們提出的方法能夠以顯著的改進超越最先進的方法俘种。

3. 方法

3.1

語義描述秤标,二進制/數(shù)字向量或word embedding/RNN 特征。每個語義描述對應一個類別宙刘。
論文中GAN生成的是視覺特征而不是圖像像素苍姜。

3.2

Since the soul samples of a category should reflect the most remarkable characteristics of the class as much as possible, we deploy the average representation of all samples from the category c to define the soul sample of c, which is similar with prototypical networks for few-shot learning [31].
在本文中,為了確保每個生成的特征與語義描述和真實樣本高度相關悬包,我們引入了靈魂樣本來規(guī)范生成器衙猪。由于一個類別的靈魂樣本應該盡可能地反映出該類別最顯著的特征,因此我們使用該類別中所有樣本的平均表示來定義的靈魂樣本布近,這與用于少數(shù)鏡頭學習的原型網(wǎng)絡類似[31]垫释。

(2)Apart from generating visual features from noises, GANs can also be used for semantic augmentation in zero-shot learning. In our future work, we will incorporate semantic data augmentation in our model to cover more unseen samples.
嵌入方法通過間接的方式處理看不見的樣本,而GAN方法通過將其轉(zhuǎn)換為有監(jiān)督的學習任務來直接處理撑瞧。結(jié)果表明棵譬,GAN是一種很有前途的解決零樣本學習問題的方法。除了從噪聲中產(chǎn)生視覺特征外预伺,GANs還可以用于零樣本學習中的語義增強订咸。在我們未來的工作中曼尊,我們將在模型中加入語義數(shù)據(jù)擴充,以覆蓋更多未看到的樣本脏嚷。

(3)
我們的方法的性能提升可以歸結(jié)為兩個方面骆撇。一個是我們引入了靈魂樣本,以保證每個生成的樣本都與語義描述高度相關父叙。靈魂樣本的正則化也解決了多視圖特性神郊。因此,它可以自動處理零樣本學習中不同視圖引起的域移位問題趾唱。另一方面涌乳,我們的級聯(lián)分類器能夠利用來自第一個分類器的結(jié)果并加強第二個分類器。這種配方通過粗到細的方式提供結(jié)果鲸匿。結(jié)果表明爷怀,利用生成ZSL的不變邊是有益的。不變邊正則化保證了每一個合成樣本都與真實樣本和相應的語義描述高度相關带欢。

(4)we can see that our method generally has better accuracy on most of the categories. Notably, we can see that the accuracy on category “tvmonitor”, “donkey” and “jetski” are boosted around 10% against f-CLSWGAN. There is also a common phenomenon that the ZSL methods perform poorly on some unseen categories. We will investigate fine-grained / classwise zero-shot learning in our future work.
我們的方法在大多數(shù)類別上通常具有更好的準確性运授。值得注意的是,我們可以看到乔煞,與F-CLSWGAN相比吁朦,“電視監(jiān)視器”、“驢子”和“噴氣式飛機”類的精確度提高了10%左右渡贾。還有一種常見的現(xiàn)象逗宜,即zsl方法在某些看不見的類別上表現(xiàn)不佳。我們將在未來的工作中研究細粒度/類化的零樣本學習空骚。

參考論文

[1] [Leveraging theInvariant Side of Generative Zero-Shot Learning][https://arxiv.org/abs/1904.04092]

論文代碼

[1] # lijin118/LisGAN

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末纺讲,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子囤屹,更是在濱河造成了極大的恐慌熬甚,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,744評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件肋坚,死亡現(xiàn)場離奇詭異乡括,居然都是意外死亡,警方通過查閱死者的電腦和手機智厌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,505評論 3 392
  • 文/潘曉璐 我一進店門诲泌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人铣鹏,你說我怎么就攤上這事敷扫。” “怎么了吝沫?”我有些...
    開封第一講書人閱讀 163,105評論 0 353
  • 文/不壞的土叔 我叫張陵呻澜,是天一觀的道長递礼。 經(jīng)常有香客問我惨险,道長羹幸,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,242評論 1 292
  • 正文 為了忘掉前任辫愉,我火速辦了婚禮栅受,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘恭朗。我一直安慰自己屏镊,他們只是感情好,可當我...
    茶點故事閱讀 67,269評論 6 389
  • 文/花漫 我一把揭開白布痰腮。 她就那樣靜靜地躺著而芥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪膀值。 梳的紋絲不亂的頭發(fā)上棍丐,一...
    開封第一講書人閱讀 51,215評論 1 299
  • 那天,我揣著相機與錄音沧踏,去河邊找鬼歌逢。 笑死,一個胖子當著我的面吹牛翘狱,可吹牛的內(nèi)容都是我干的秘案。 我是一名探鬼主播,決...
    沈念sama閱讀 40,096評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼潦匈,長吁一口氣:“原來是場噩夢啊……” “哼阱高!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起茬缩,我...
    開封第一講書人閱讀 38,939評論 0 274
  • 序言:老撾萬榮一對情侶失蹤赤惊,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后寒屯,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體荐捻,經(jīng)...
    沈念sama閱讀 45,354評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,573評論 2 333
  • 正文 我和宋清朗相戀三年寡夹,在試婚紗的時候發(fā)現(xiàn)自己被綠了处面。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,745評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡菩掏,死狀恐怖魂角,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情智绸,我是刑警寧澤野揪,帶...
    沈念sama閱讀 35,448評論 5 344
  • 正文 年R本政府宣布访忿,位于F島的核電站,受9級特大地震影響斯稳,放射性物質(zhì)發(fā)生泄漏海铆。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,048評論 3 327
  • 文/蒙蒙 一挣惰、第九天 我趴在偏房一處隱蔽的房頂上張望卧斟。 院中可真熱鬧,春花似錦憎茂、人聲如沸珍语。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,683評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽板乙。三九已至,卻和暖如春拳氢,著一層夾襖步出監(jiān)牢的瞬間募逞,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,838評論 1 269
  • 我被黑心中介騙來泰國打工饿幅, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留凡辱,地道東北人。 一個月前我還...
    沈念sama閱讀 47,776評論 2 369
  • 正文 我出身青樓栗恩,卻偏偏與公主長得像透乾,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子磕秤,可洞房花燭夜當晚...
    茶點故事閱讀 44,652評論 2 354