pix2pix

本文最大的貢獻在于提出了一個統(tǒng)一的框架解決了圖像翻譯問題眠饮。所謂圖像翻譯硫椰，指從一副圖像到另一副圖像的轉(zhuǎn)換暑劝。可以類比機器翻譯颗搂，一種語言轉(zhuǎn)換為另一種語言担猛。常見的圖像翻譯任務(wù)有：

圖像去噪
圖像超分辨
圖像補全
風(fēng)格遷移
...
在這篇paper里面，作者提出的框架十分簡潔優(yōu)雅（好用的算法總是簡潔優(yōu)雅的）丢氢。相比以往算法的大量專家知識傅联，手工復(fù)雜的loss。這篇paper非常粗暴疚察，使用CGAN處理了一系列的轉(zhuǎn)換問題蒸走。下面是一些轉(zhuǎn)換示例：

pix2pix結(jié)果示例

上面展示了許多有趣的結(jié)果，比如分割圖 $\longrightarrow$ 街景圖貌嫡，邊緣圖 $\longrightarrow$ 真實圖比驻。對于第一次看到的時候還是很驚艷的，那么這個是怎么做到的呢岛抄？我們可以設(shè)想一下别惦，如果是我們，我們自己會如何設(shè)計這個網(wǎng)絡(luò)夫椭。

直觀的想法

最直接的想法就是掸掸，設(shè)計一個CNN網(wǎng)絡(luò)，直接建立輸入-輸出的映射蹭秋，就像圖像去噪問題一樣扰付。可是對于上面的問題仁讨，這樣做會帶來一個問題羽莺。生成圖像質(zhì)量不清晰。

拿左上角的分割圖 $\longrightarrow$ 街景圖為例洞豁，語義分割圖的每個標(biāo)簽比如“汽車”可能對應(yīng)不同樣式禽翼，顏色的汽車。那么模型學(xué)習(xí)到的會是所有不同汽車的評均族跛，這樣會造成模糊闰挡。

pix2pix語義地圖L1loss結(jié)果

如何解決模糊呢？

這里作者想了一個辦法礁哄，即加入GAN的Loss去懲罰模型长酗。GAN相比于傳統(tǒng)生成式模型可以較好的生成高分辨率圖片。思路也很簡單桐绒，在上述直觀想法的基礎(chǔ)上加入一個判別器夺脾，判斷輸入圖片是否是真實樣本之拨。模型示意圖如下：

pix2pix模型示意圖

上圖模型和CGAN有所不同，但它是一個CGAN咧叭，只不過輸入只有一個蚀乔，這個輸入就是條件信息。原始的CGAN需要輸入隨機噪聲菲茬，以及條件吉挣。這里之所有沒有輸入噪聲信息，是因為在實際實驗中婉弹，如果輸入噪聲和條件睬魂，噪聲往往被淹沒在條件C當(dāng)中，所以這里直接省去了镀赌。

其他tricks

從上面兩點可以得到最終的Loss由兩部分構(gòu)成：

輸出和標(biāo)簽信息的L1 Loss氯哮。
GAN Loss
測試也使用Dropout，以使輸出多樣化

pix2pix Loss

采用L1 Loss而不是L2 Loss的理由很簡單商佛，L1 Loss相比于L2 Loss保邊緣（L2 Loss基于高斯先驗喉钢，L1 Loss基于拉普拉斯先驗）。

GAN Loss為LSGAN的最小二乘Loss良姆，并使用PatchGAN(進一步保證生成圖像的清晰度)出牧。PatchGAN將圖像換分成很多個Patch，并對每一個Patch使用判別器進行判別（實際代碼實現(xiàn)有更取巧的辦法）歇盼，將所有Patch的Loss求平均作為最終的Loss舔痕。

最后編輯于：2018.11.18 11:59:33

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市豹缀，隨后出現(xiàn)的幾起案子伯复，更是在濱河造成了極大的恐慌，老刑警劉巖邢笙，帶你破解...
沈念sama閱讀 218,122評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件啸如，死亡現(xiàn)場離奇詭異，居然都是意外死亡氮惯，警方通過查閱死者的電腦和手機叮雳，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,070評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來妇汗，“玉大人帘不，你說我怎么就攤上這事⊙罴” “怎么了寞焙？”我有些...
開封第一講書人閱讀 164,491評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我捣郊，道長辽狈，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,636評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任呛牲，我火速辦了婚禮刮萌，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘娘扩。我一直安慰自己着茸，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,676評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布畜侦。她就那樣靜靜地躺著，像睡著了一般躯保。火紅的嫁衣襯著肌膚如雪旋膳。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,541評論 1贊 305
城市分裂傳說
那天途事，我揣著相機與錄音验懊，去河邊找鬼。笑死尸变，一個胖子當(dāng)著我的面吹牛义图，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播召烂，決...
沈念sama閱讀 40,292評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼碱工，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了奏夫？” 一聲冷哼從身側(cè)響起怕篷，我...
開封第一講書人閱讀 39,211評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎酗昼，沒想到半個月后廊谓，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,655評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡麻削，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,846評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年蒸痹，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片呛哟。...
茶點故事閱讀 39,965評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡叠荠，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出扫责，到底是詐尸還是另有隱情蝙叛，我是刑警寧澤，帶...
沈念sama閱讀 35,684評論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布公给，位于F島的核電站借帘，受9級特大地震影響蜘渣，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜肺然，卻給世界環(huán)境...
茶點故事閱讀 41,295評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一蔫缸、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧际起，春花似錦拾碌、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,894評論 0贊 22
一樁弒父案校翔，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至灾前，卻和暖如春防症，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背哎甲。一陣腳步聲響...
開封第一講書人閱讀 33,012評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工蔫敲，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人炭玫。一個月前我還...
沈念sama閱讀 48,126評論 3贊 370
代替公主和親
正文我出身青樓奈嘿，卻偏偏與公主長得像，于是被迫代替她去往敵國和親吞加。傳聞我的和親對象是個殘疾皇子裙犹，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,914評論 2贊 355

pix2pix

直觀的想法

如何解決模糊呢？

其他tricks

推薦閱讀更多精彩內(nèi)容