什么忽孽?不喜歡用PGGAN?那試試IntroVAE谢床!

PGGAN中已經(jīng)可以生成很棒很真實的圖片了兄一,但是由于計算量稍復(fù)雜。有人提出使用VAE和GAN的結(jié)合體IntroVAE來實現(xiàn)高分辨圖像的合成识腿。

一出革、摘要

IntroVAE能夠自我評估其生成的樣品的質(zhì)量并相應(yīng)地改進(jìn)自身。它的推理和生成器模型以內(nèi)省的方式共同訓(xùn)練渡讼。一方面骂束,需要發(fā)生器將來自推理模型的噪聲輸出的輸入圖像重建為正常VAE。另一方面成箫,鼓勵推理模型在生成的樣本和實際樣本之間進(jìn)行分類展箱,而生成器試圖將其作為GAN欺騙。

二蹬昌、VAE與GAN兩者方面各有的優(yōu)缺點

  • VAE理論上優(yōu)雅混驰,易于訓(xùn)練。它們具有很好的流形表示皂贩,但會產(chǎn)生非常模糊的圖像栖榨,缺乏細(xì)節(jié)

  • GAN通常會產(chǎn)生更清晰的圖像,但在訓(xùn)練穩(wěn)定性和采樣多樣性方面面臨挑戰(zhàn)明刷,尤其是在合成高分辨率圖像時婴栽。

三、本文所貢獻(xiàn)的三種方法

  • 我們?yōu)閂AE提出了一種新的訓(xùn)練技術(shù)遮精,以內(nèi)省的方式訓(xùn)練VAE居夹,使得模型本身估計生成的圖像和真實圖像之間的差異败潦,而無需額外的鑒別器。

  • 我們提出了用于高分辨率攝影圖像合成的單流單級對抗模型准脂,這是GAN以這種簡單而有效的方式生成高分辨率圖像的第一種可行方法劫扒。

  • 方法結(jié)合了GAN和VAE的優(yōu)勢,產(chǎn)生的高分辨率照片圖像與最先進(jìn)的GAN產(chǎn)生的圖像相當(dāng)狸膏,同時保留了VAE的優(yōu)點沟饥,如穩(wěn)定訓(xùn)練和漂亮的潛在變化。

四湾戳、方法

  • 對抗性分布匹配

為了使生成的樣本的分布與給定訓(xùn)練數(shù)據(jù)的真實分布相匹配贤旷,我們使用正化術(shù)語作為對抗訓(xùn)練成本函數(shù)。訓(xùn)練推理模型以最小化砾脑,使得樣本的后驗分布大致匹配先前分布幼驶。


image
  • 內(nèi)省的變分推斷

推理模型E和生成器G的訓(xùn)練對象可以重新表述如下:


image

增加重建誤差,在推理模型E和發(fā)生器G之間建立了一個橋梁韧衣,并產(chǎn)生了VAE和GAN的特定混合模型盅藻。對于來自訓(xùn)練集的數(shù)據(jù)樣本x,所提出的方法的對象折疊到VAE的標(biāo)準(zhǔn)ELBO對象畅铭,從而保留了VAE的屬性;對于生成的樣本氏淑,此對象在E和G之間生成GAN的最小 - 最大游戲,并使圖片更加逼真硕噩。

五假残、算法表示如下

image

其中ng(.)表示此時停止了梯度的反向傳播,Enc(.)表示E的映射函數(shù)炉擅,α和β是用于平衡每個項目的重要性的加權(quán)參數(shù)辉懒。

六、生成1024 * 1024 圖片的結(jié)果

將我們的采樣結(jié)果與PGGAN進(jìn)行了比較坑资,后者是合成高分辨率圖像的最先進(jìn)技術(shù)耗帕。如圖所示,我們的方法能夠合成與PGGAN相當(dāng)?shù)母叻直媛矢哔|(zhì)量樣本袱贮,這些樣本都可以與真實圖像區(qū)分開來仿便。雖然PGGAN采用漸進(jìn)式多階段方式訓(xùn)練對稱發(fā)生器和鑒別器,但我們的模型以更簡單的方式進(jìn)行訓(xùn)練攒巍,在單個階段中迭代地訓(xùn)練單個推理模型和單個發(fā)生器嗽仪,就像原始GAN一樣。我們的方法的結(jié)果表明柒莉,通過直接使用高分辨率圖像進(jìn)行訓(xùn)練闻坚,可以合成非常高分辨率的圖像,而無需將單個任務(wù)分解為多個從低到高的分辨率任務(wù)兢孝。此外窿凤,我們在圖中的LSUN BEDROOM中提供了視覺質(zhì)量結(jié)果仅偎,這進(jìn)一步證明了我們的方法能夠合成與PGGAN相當(dāng)?shù)母哔|(zhì)量圖像

LSUN BEDROOM的定性比較。
潛在空間中真實圖像的插值雳殊。最左邊和最右邊是CelebA-HQ測試集中的真實圖像橘沥,緊鄰它們的圖像是通過我們的模型重建的。其余的是插值夯秃。壓縮圖像以節(jié)省空間座咆。

七、結(jié)論

推理模型不僅學(xué)習(xí)了一個漂亮的潛在流形結(jié)構(gòu)仓洼,而且還充當(dāng)了一個鑒別器介陶,以最大化生成數(shù)據(jù)的近似后驗與先驗的發(fā)散。因此色建,所提出的IntroVAE具有內(nèi)省能力哺呜,以自我估計所生成圖像的質(zhì)量并相應(yīng)地改進(jìn)其自身。

文章引用于 http://tongtianta.site/paper/22917
編輯 Lornatang
校準(zhǔn) Lornatang

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末镀岛,一起剝皮案震驚了整個濱河市弦牡,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌漂羊,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件卸留,死亡現(xiàn)場離奇詭異走越,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)耻瑟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門旨指,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人喳整,你說我怎么就攤上這事谆构。” “怎么了框都?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵搬素,是天一觀的道長。 經(jīng)常有香客問我魏保,道長熬尺,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任谓罗,我火速辦了婚禮粱哼,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘檩咱。我一直安慰自己揭措,他們只是感情好胯舷,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著绊含,像睡著了一般桑嘶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上艺挪,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天不翩,我揣著相機(jī)與錄音,去河邊找鬼麻裳。 笑死口蝠,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的津坑。 我是一名探鬼主播妙蔗,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼疆瑰!你這毒婦竟也來了眉反?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤穆役,失蹤者是張志新(化名)和其女友劉穎寸五,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體耿币,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡梳杏,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了淹接。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片十性。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖塑悼,靈堂內(nèi)的尸體忽然破棺而出劲适,到底是詐尸還是另有隱情,我是刑警寧澤厢蒜,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布霞势,位于F島的核電站,受9級特大地震影響郭怪,放射性物質(zhì)發(fā)生泄漏支示。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一鄙才、第九天 我趴在偏房一處隱蔽的房頂上張望颂鸿。 院中可真熱鬧,春花似錦攒庵、人聲如沸嘴纺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽栽渴。三九已至尖坤,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間闲擦,已是汗流浹背慢味。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留墅冷,地道東北人纯路。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像寞忿,于是被迫代替她去往敵國和親驰唬。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容