pix2pix

論文:pix2pix
代碼:GitHub

本文最大的貢獻在于提出了一個統(tǒng)一的框架解決了圖像翻譯問題眠饮。所謂圖像翻譯硫椰,指從一副圖像到另一副圖像的轉(zhuǎn)換暑劝。可以類比機器翻譯颗搂,一種語言轉(zhuǎn)換為另一種語言担猛。常見的圖像翻譯任務(wù)有:

  • 圖像去噪
  • 圖像超分辨
  • 圖像補全
  • 風(fēng)格遷移
  • ...
    在這篇paper里面,作者提出的框架十分簡潔優(yōu)雅(好用的算法總是簡潔優(yōu)雅的)丢氢。相比以往算法的大量專家知識傅联,手工復(fù)雜的loss。這篇paper非常粗暴疚察,使用CGAN處理了一系列的轉(zhuǎn)換問題蒸走。下面是一些轉(zhuǎn)換示例:


    pix2pix結(jié)果示例

上面展示了許多有趣的結(jié)果,比如分割圖\longrightarrow街景圖貌嫡,邊緣圖\longrightarrow真實圖比驻。對于第一次看到的時候還是很驚艷的,那么這個是怎么做到的呢岛抄?我們可以設(shè)想一下别惦,如果是我們,我們自己會如何設(shè)計這個網(wǎng)絡(luò)夫椭。

直觀的想法

最直接的想法就是掸掸,設(shè)計一個CNN網(wǎng)絡(luò),直接建立輸入-輸出的映射蹭秋,就像圖像去噪問題一樣扰付。可是對于上面的問題仁讨,這樣做會帶來一個問題羽莺。生成圖像質(zhì)量不清晰。

拿左上角的分割圖\longrightarrow街景圖為例洞豁,語義分割圖的每個標(biāo)簽比如“汽車”可能對應(yīng)不同樣式禽翼,顏色的汽車。那么模型學(xué)習(xí)到的會是所有不同汽車的評均族跛,這樣會造成模糊闰挡。

pix2pix語義地圖L1loss結(jié)果

如何解決模糊呢?

這里作者想了一個辦法礁哄,即加入GAN的Loss去懲罰模型长酗。GAN相比于傳統(tǒng)生成式模型可以較好的生成高分辨率圖片。思路也很簡單桐绒,在上述直觀想法的基礎(chǔ)上加入一個判別器夺脾,判斷輸入圖片是否是真實樣本之拨。模型示意圖如下:


pix2pix模型示意圖

上圖模型和CGAN有所不同,但它是一個CGAN咧叭,只不過輸入只有一個蚀乔,這個輸入就是條件信息。原始的CGAN需要輸入隨機噪聲菲茬,以及條件吉挣。這里之所有沒有輸入噪聲信息,是因為在實際實驗中婉弹,如果輸入噪聲和條件睬魂,噪聲往往被淹沒在條件C當(dāng)中,所以這里直接省去了镀赌。

其他tricks

從上面兩點可以得到最終的Loss由兩部分構(gòu)成:

  • 輸出和標(biāo)簽信息的L1 Loss氯哮。
  • GAN Loss
  • 測試也使用Dropout,以使輸出多樣化


    pix2pix Loss

采用L1 Loss而不是L2 Loss的理由很簡單商佛,L1 Loss相比于L2 Loss保邊緣(L2 Loss基于高斯先驗喉钢,L1 Loss基于拉普拉斯先驗)。

GAN Loss為LSGAN的最小二乘Loss良姆,并使用PatchGAN(進一步保證生成圖像的清晰度)出牧。PatchGAN將圖像換分成很多個Patch,并對每一個Patch使用判別器進行判別(實際代碼實現(xiàn)有更取巧的辦法)歇盼,將所有Patch的Loss求平均作為最終的Loss舔痕。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市豹缀,隨后出現(xiàn)的幾起案子伯复,更是在濱河造成了極大的恐慌,老刑警劉巖邢笙,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件啸如,死亡現(xiàn)場離奇詭異,居然都是意外死亡氮惯,警方通過查閱死者的電腦和手機叮雳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來妇汗,“玉大人帘不,你說我怎么就攤上這事⊙罴” “怎么了寞焙?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我捣郊,道長辽狈,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任呛牲,我火速辦了婚禮刮萌,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘娘扩。我一直安慰自己着茸,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布畜侦。 她就那樣靜靜地躺著,像睡著了一般躯保。 火紅的嫁衣襯著肌膚如雪旋膳。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天途事,我揣著相機與錄音验懊,去河邊找鬼。 笑死尸变,一個胖子當(dāng)著我的面吹牛义图,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播召烂,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼碱工,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了奏夫?” 一聲冷哼從身側(cè)響起怕篷,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎酗昼,沒想到半個月后廊谓,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡麻削,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年蒸痹,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片呛哟。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡叠荠,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出扫责,到底是詐尸還是另有隱情蝙叛,我是刑警寧澤,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布公给,位于F島的核電站借帘,受9級特大地震影響蜘渣,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜肺然,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一蔫缸、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧际起,春花似錦拾碌、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至灾前,卻和暖如春防症,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背哎甲。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工蔫敲, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人炭玫。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓奈嘿,卻偏偏與公主長得像,于是被迫代替她去往敵國和親吞加。 傳聞我的和親對象是個殘疾皇子裙犹,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容