ST-CGAN 用GAN實現(xiàn)陰影檢測和陰影去除

最近兩天剛看到的論文谊却,寫一篇文章當做筆記

繼去年底Phillip Isola,Jun-Yan Zhu等人提出pix2pix框架以來梅誓,image translation的應用引起了大家的重點關注,相應的github倉庫更是獲得了高達4000+的star奈梳。至此,GAN在image to image translation, semantic segmentation, image style transfer等眾多領域都達到了state-of-the-art的效果,本文介紹的ST-CGAN在pix2pix框架的基礎上做出改進循榆,分別構建兩個生成器和兩個判別器從而實現(xiàn)了陰影檢測和陰影去除,與之前的模型相比取得了更好的效果墨坚。

論文鏈接:Stacked Conditional Generative Adversarial Networks for Jointly Learning Shadow Detection and Shadow Removal

生成對抗網(wǎng)絡GAN(Generative adversarial network)由Goodfellow于2014年提出秧饮,16年DCGAN在圖像領域取得了十分驚艷的效果,之后便接連出現(xiàn)GAN的許多變體(pix2pix, WGAN, SRGAN, CycleGAN等等),原始GAN提出了一個minimax game浦楣,由生成器不斷生成fake data去欺騙判別器袖肥,而判別器不斷學習如何鑒別fake data和real data,生成器和判別器在不斷博弈的過程中互相提升振劳,最終達到收斂椎组。

首先讓我們先來看一看為什么pix2pix能取得如此驚艷的效果

在pix2pix之前已經(jīng)有許多GAN的變種(DCGAN, CGAN),這些GAN在當時都取得了不錯的效果历恐,雖然在某種程度上還存在著不穩(wěn)定寸癌,多樣性差,生成圖像分辨率不高等問題弱贼。博主認為這些GAN的變種是以生成看起來真的圖像作為目標蒸苇,缺乏實際的應用場景。pix2pix模型借用conditional GAN的思想吮旅,將整張原圖直接輸入溪烤,并提出了pair的概念,讓判別器同時判斷兩個pair的真假庇勃,從而建立了圖片與圖片之間的聯(lián)系檬嘀,實現(xiàn)image-to-image translation。

說得更直白一點责嚷,pix2pix與之前的GAN最大的區(qū)別就在于將一個pair中的兩張圖一起作為判別器的輸入(實現(xiàn)上就是把兩個圖片疊在一起鸳兽,channel為6作為輸入),這樣的結構使得判別器不再是簡單地判斷圖片本身的真與假罕拂,而是進一步判斷兩個圖片的對應關系揍异,從而使得生成器生成的圖片同時具備真實性和相關性。

回到本篇文章將要介紹的ST-CGAN中來爆班,介于pix2pix應用場景的單一性衷掷,很多人在思考如何將GAN應用于更廣泛的應用場景中,ST-CGAN就是其中一個柿菩。ST-CGAN的模型結構如下圖所示棍鳖。

由上圖我們可以看到,ST-CGAN構建了兩個生成器碗旅,G1用于從原圖生成含有陰影的圖渡处,G2用于從原圖和陰影圖的疊加中生成去除了陰影的圖,而兩個判別器則分別監(jiān)督這兩個生成過程祟辟,最終達到收斂医瘫。

可以看到論文中給出的效果都還不錯


論文中作者將Balance Error Rate (BER)作為評估檢測(Detection)陰影效果的標準,用Root mean square error (RMSE)作為評估生成的去除陰影的圖像(Removal)效果的標準

關于Balance Error Rate (BER)的詳細解釋讀者可以看這個回答旧困。Root mean square error (RMSE)就是在MSE的基礎上取平方根醇份。

在這里要吐槽一下稼锅,文中并沒有指明BER表達式中幾個變量對應的含義,包括在實驗部分的表格中論文里給出了shadow和Non-shadow也沒有給出定義僚纷。矩距。。博主根據(jù)實驗描述判斷怖竭,這里把生成的陰影圖切割為包含陰影的區(qū)域(shadow)和不包含陰影的區(qū)域(Non-shadow)锥债,然后針對這兩個不同的類分別與Ground Truth計算對應的像素點之間的error(論文中的描述為"along with separated per pixel error rates per class (shadow and non-shadow“)。具體而言痊臭,TP/(TP+FN)指代陰影區(qū)域正確檢測到陰影的部分哮肚,TN/(TN+FP)指代非陰影區(qū)域判斷為沒有陰影的部分,這樣BER的值越低對應模型的效果就越好广匙。

實驗部分允趟,論文提出了一個新的數(shù)據(jù)集ISTD(Large-scale Dataset with Image Shadow Triplets),與其他包含陰影圖的數(shù)據(jù)集不同的地方在于鸦致,ISTD數(shù)據(jù)集包含三類數(shù)據(jù)潮剪,包含陰影的原始圖片,陰影標注數(shù)據(jù)和不包含陰影的原始圖片分唾,基于ISTD數(shù)據(jù)集論文提出的模型才得以實踐(因為模型要求的輸入條件就必須包含這三種數(shù)據(jù))鲁纠。

可以看到,基于ISTD數(shù)據(jù)集訓練的情況下鳍寂,ST-CGAN達到了不錯的效果,同時為了說明模型的魯棒性情龄,論文也在別的數(shù)據(jù)集下做了對比實驗迄汛,由于其它的數(shù)據(jù)集不具備包含三類數(shù)據(jù)的條件(即不包含沒有陰影的原始圖像),論文給出的解決辦法是先用別的模型生成一個"roughly generated shadow-free images"添加到數(shù)據(jù)集中骤视。

效果相對于第一個實驗略差一點鞍爱。還有幾組數(shù)據(jù)這里就不再贅述了,論文給出了幾種不同模型做陰影去除(Removal)的效果對比

可以看到专酗,除了第5組數(shù)據(jù)中陰影部分較暗的情況下效果略差睹逃,其他情況效果還不錯。

最后祷肯,博主想到既然pix2pix實現(xiàn)了雙向端到端的image translation沉填,那ST-CGAN是否可以用來從原始圖片生成出逼真的含有陰影的圖片呢?這個可能要論文作者來解答了佑笋。

從B到A可能可以實現(xiàn)在沒有陰影的圖像上添加陰影的效果

以上就是對ST-CGAN的大概解讀翼闹,下面聊一下博主對這篇論文的優(yōu)缺點評價:

優(yōu)點:

1.idea很不錯,用GAN來做Detection和Removal蒋纬,為大家打開了思路猎荠,現(xiàn)在有不少人都在思考怎么把GAN拓展到更加廣的應用場景里坚弱。

2.實驗效果不錯,與幾個Baseline相比效果有明顯提升关摇。

缺點:

1.正如文中所說荒叶,論文描述里一些地方指代不清,希望原作者后續(xù)能給出新的版本输虱。

2.相對于其它模型些楣,ST-CGAN所需要的先驗條件變多了,具體來講就是需要包含陰影的原始數(shù)據(jù)悼瓮,陰影圖戈毒,不包含陰影的原始數(shù)據(jù)這三類數(shù)據(jù),而其它的模型是在不具備第三類數(shù)據(jù)的情況下做的横堡,在這樣的情況下ST-CGAN表現(xiàn)更好可能跟它獲取的輸入條件更多有關埋市。

3.實驗中給出了陰影部分教深的情況下的實驗結果,并沒有給出在陰影部分較淺的情況下的結果命贴,其次如何給出一個深淺的標準也是一個值得討論的問題道宅,這可能直接影響到對模型評價標準。

以上是博主一些個人的想法胸蛛,也歡迎大熱烈討論~


原地址:知乎專欄

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末污茵,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子葬项,更是在濱河造成了極大的恐慌泞当,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件民珍,死亡現(xiàn)場離奇詭異襟士,居然都是意外死亡,警方通過查閱死者的電腦和手機嚷量,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門陋桂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蝶溶,你說我怎么就攤上這事嗜历。” “怎么了抖所?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵梨州,是天一觀的道長。 經(jīng)常有香客問我田轧,道長摊唇,這世上最難降的妖魔是什么缭保? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任懂牧,我火速辦了婚禮晶丘,結果婚禮上握巢,老公的妹妹穿的比我還像新娘。我一直安慰自己岛请,他們只是感情好旭寿,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著崇败,像睡著了一般盅称。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上后室,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天缩膝,我揣著相機與錄音,去河邊找鬼岸霹。 笑死疾层,一個胖子當著我的面吹牛,可吹牛的內容都是我干的贡避。 我是一名探鬼主播痛黎,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼刮吧!你這毒婦竟也來了湖饱?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤杀捻,失蹤者是張志新(化名)和其女友劉穎井厌,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體致讥,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡仅仆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了拄踪。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡拳魁,死狀恐怖惶桐,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情潘懊,我是刑警寧澤姚糊,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站授舟,受9級特大地震影響救恨,放射性物質發(fā)生泄漏。R本人自食惡果不足惜释树,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一肠槽、第九天 我趴在偏房一處隱蔽的房頂上張望擎淤。 院中可真熱鬧,春花似錦秸仙、人聲如沸嘴拢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽席吴。三九已至,卻和暖如春捞蛋,著一層夾襖步出監(jiān)牢的瞬間孝冒,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工拟杉, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留庄涡,地道東北人。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓捣域,卻偏偏與公主長得像啼染,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子焕梅,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內容