(SRCNN)及pytorch實現(xiàn)_Learning a Deep Convolutional Network for Image Super-Resolution——超分辨率(二)

Learning a Deep Convolutional Network for Image Super-Resolution

SRCNN是深度學習用在超分辨率重建上的開山之作蓖柔。SRCNN的網(wǎng)絡(luò)結(jié)構(gòu)非常簡單卦碾,僅僅用了三個卷積層,網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示。

在這里插入圖片描述

論文鏈接: (Learning a Deep Convolutional Network for Image Super-Resolution, ECCV2014)
Pytorch實現(xiàn)源碼

算法簡介

SRCNN算法的框架竹习,SRCNN將深度學習與傳統(tǒng)稀疏編碼之間的關(guān)系作為依據(jù)础钠,將3層網(wǎng)絡(luò)劃分為圖像塊提取(Patch extraction and representation)排监、非線性映射(Non-linear mapping)以及最終的重建(Reconstruction)仇奶。
SRCNN的流程為:
(1)先將低分辨率圖像使用雙三次差值放大至目標尺寸(如放大至2倍、3倍驾窟、4倍)庆猫,此時仍然稱放大至目標尺寸后的圖像為低分辨率圖像(Low-resolution image),即圖中的輸入(input)绅络;

(2)將低分辨率圖像輸入三層卷積神經(jīng)網(wǎng)絡(luò)月培,(舉例:在論文中的其中一實驗相關(guān)設(shè)置,對YCrCb顏色空間中的Y通道進行重建昨稼,網(wǎng)絡(luò)形式為(conv1+relu1)—(conv2+relu2)—(conv3))第一層卷積:卷積核尺寸9×9(f1×f1)节视,卷積核數(shù)目64(n1),輸出64張?zhí)卣鲌D假栓;第二層卷積:卷積核尺寸1×1(f2×f2)寻行,卷積核數(shù)目32(n2),輸出32張?zhí)卣鲌D匾荆;第三層卷積:卷積核尺寸5×5(f3×f3)拌蜘,卷積核數(shù)目1(n3),輸出1張?zhí)卣鲌D即為最終重建高分辨率圖像牙丽。

們首先使用雙三次插值將其放大到所需的大小简卧,這是我們執(zhí)行的唯一預處理3。讓我們將插值圖像表示為Y.我們的目標是從Y中恢復與地面實況高分辨率圖像X盡可能相似的圖像F(Y)烤芦。為了便于呈現(xiàn)举娩,我們?nèi)苑QY為“低分辨率的“圖像,雖然它與X具有相同的大小构罗。我們希望學習映射F铜涉,它在概念上由三個操作組成:

  • 1)補丁提取和表示:該操作從低分辨率圖像Y中提取(重疊)補丁遂唧,并將每個補丁表示為高維向量芙代。這些向量包括一組特征圖,其數(shù)量等于向量的維數(shù)盖彭。
  • 2)非線性映射:該操作是每個高維向量到另一個高維向量的非線性映射纹烹。每個映射的矢量在概念上是高分辨率補丁的表示页滚。這些向量包括另一組特征映射。
  • 3)重建:該操作聚合高分辨率補丁表示以生成最終的高分辨率圖像铺呵。該圖像應該與真實標記X相似裹驰。

算法流程

Patch extraction and representation

圖像恢復中的流行策略是密集地提取補丁,然后通過一組預先訓練的基礎(chǔ)(例如PCA陪蜻,DCT邦马,Haar等)來表示它們贱鼻。這相當于用一組濾波器對圖像進行卷積宴卖,每個濾波器都是一組基。將這些基礎(chǔ)的優(yōu)化包括在網(wǎng)絡(luò)的優(yōu)化中邻悬。第一層表示為操作F_{1}
F_{1}(\mathbf{Y})=\max \left(0, W_{1} * \mathbf{Y}+B_{1}\right)

其中W_{1}B_{1}分別代表濾波器和偏置症昏。這里W_{1}的大小為c \times f_{1} \times f_{1} \times n_{1},其中c是輸入圖像中的通道數(shù)父丰,f_{1}是濾波器的空間大小肝谭,n_{1}是濾波器的數(shù)量。很明顯蛾扇,W_{1}在圖像上應用n_{1}個卷積攘烛,每個卷積的內(nèi)核大小為c \times f_{1} \times f_{1}。輸出由n_{1}個特征圖組成镀首。B_{1}n_{1}維向量坟漱,其每個元素與濾波器相關(guān)聯(lián)。我們在濾波器響應上應用整流線性單元(ReLU更哄,max(0芋齿,x))

Non-linear mapping 非線性映射

第一層為每個補丁提取n_{1}維特征。在第二操作中成翩,我們將這些n_{1}維向量中的每一個映射為n_{2}維向量觅捆。這相當于應用具有平凡空間支持1 x 1的n_{2}濾波器。此解釋僅適用于1 x 1過濾器麻敌。但是很容易推廣到像3 x 3或5 x 5這樣的大型濾波器 栅炒。在那種情況下,非線性映射不是輸入圖像的補丁; 相反术羔,它是在3 x 3或5 x 5特征圖的“補丁”赢赊。第二層的操作是:
F_{2}(\mathbf{Y})=\max \left(0, W_{2} * F_{1}(\mathbf{Y})+B_{2}\right)
這里W_{2}的大小是n_{1} \times 1 \times 1 \times n_{2}B_{2}n_{2}維聂示。每個輸出n_{2}維向量在概念上是將用于重建的高分辨率補丁的表示域携。

Reconstruction

在傳統(tǒng)方法中,經(jīng)常對預測的重疊高分辨率補丁進行平均以產(chǎn)生最終的完整圖像鱼喉。平均可以被認為是一組特征圖上的預定義濾波器(其中每個位置是高分辨率補片的“扁平”矢量形式)秀鞭。由此推動趋观,我們定義卷積層以產(chǎn)生最終的高分辨率圖像:
F(\mathbf{Y})=W_{3} * F_{2}(\mathbf{Y})+B_{3}
這里W_{3}的大小是n_{2} \times f_{3} \times f_{3} \times cB_{3}是三維矢量锋边。

訓練

(1)訓練數(shù)據(jù)集:論文中某一實驗采用91張自然圖像作為訓練數(shù)據(jù)集皱坛,對訓練集中的圖像先使用雙三次差值縮小到低分辨率尺寸,再將其放大到目標放大尺寸豆巨,最后切割成諸多33×33圖像塊作為訓練數(shù)據(jù)剩辟,作為標簽數(shù)據(jù)的則為圖像中心的21×21圖像塊(與卷積層細節(jié)設(shè)置相關(guān));

(2)損失函數(shù):采用MSE函數(shù)作為卷積神經(jīng)網(wǎng)絡(luò)損失函數(shù)往扔;
L(\Theta)=\frac{1}{n} \sum_{i=1}^{n}\left\|F\left(\mathbf{Y}_{i} ; \Theta\right)-\mathbf{X}_{i}\right\|^{2}

(3)卷積層細節(jié)設(shè)置:第一層卷積核9×9贩猎,得到特征圖尺寸為(33-9)/1+1=25,第二層卷積核1×1萍膛,得到特征圖尺寸不變吭服,第三層卷積核5×5,得到特征圖尺寸為(25-5)/1+1=21蝗罗。訓練時得到的尺寸為21×21艇棕,因此圖像中心的21×21圖像塊作為標簽數(shù)據(jù)。(卷積訓練時不進行padding)

測試

(1)全卷積網(wǎng)絡(luò):所用網(wǎng)絡(luò)為全卷積網(wǎng)絡(luò)串塑,因此作為實際測試時沼琉,直接輸入完整圖像即可;

(2)Padding:訓練時得到的實際上是除去四周(33-21)/2=6像素外的圖像桩匪,若直接采用訓練時的設(shè)置(無padding)打瘪,得到的圖像最后會減少四周各6像素(如插值放大后輸入512×512,輸出500×500)吸祟。因此在測試時每一層卷積都進行了padding(卷積核尺寸為1×1的不需要進行padding)瑟慈。這樣保證插值放大后輸入與輸出尺寸的一致性。

實驗結(jié)果

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末屋匕,一起剝皮案震驚了整個濱河市葛碧,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌过吻,老刑警劉巖进泼,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異纤虽,居然都是意外死亡乳绕,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門逼纸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來洋措,“玉大人,你說我怎么就攤上這事杰刽〔しⅲ” “怎么了王滤?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長滓鸠。 經(jīng)常有香客問我雁乡,道長,這世上最難降的妖魔是什么糜俗? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任踱稍,我火速辦了婚禮,結(jié)果婚禮上悠抹,老公的妹妹穿的比我還像新娘珠月。我一直安慰自己,他們只是感情好锌钮,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布桥温。 她就那樣靜靜地躺著引矩,像睡著了一般梁丘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上旺韭,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天氛谜,我揣著相機與錄音,去河邊找鬼区端。 笑死值漫,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的织盼。 我是一名探鬼主播杨何,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼沥邻!你這毒婦竟也來了危虱?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤唐全,失蹤者是張志新(化名)和其女友劉穎埃跷,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邮利,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡弥雹,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了延届。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剪勿。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖方庭,靈堂內(nèi)的尸體忽然破棺而出厕吉,到底是詐尸還是另有隱情赦颇,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布赴涵,位于F島的核電站媒怯,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏髓窜。R本人自食惡果不足惜扇苞,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望寄纵。 院中可真熱鬧鳖敷,春花似錦、人聲如沸程拭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽恃鞋。三九已至崖媚,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間恤浪,已是汗流浹背畅哑。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留水由,地道東北人荠呐。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像砂客,于是被迫代替她去往敵國和親泥张。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容