UNet介紹

參考鏈接1
參考鏈接2
參考鏈接3

一蔚携、語義分割（semantic segmentation）介紹

1.圖像分類（image classification）

image.png

分類和定位（classification with localization）

image.png

物體檢測(cè)（object detection）

image.png

語義分割（semantic segmentation）

image.png

實(shí)例分割（instance segmentation）

image.png

幾個(gè)方向的對(duì)比：

對(duì)比圖

二券坞、理解卷積，最大池化和轉(zhuǎn)置卷積

1. 卷積（convolution）

一個(gè)卷積操作有兩個(gè)輸入
（I）3D輸入圖片（NinNinchannels）
（ii） k個(gè)過濾器組成的一個(gè)系列（filters/kernels/feature extractors）同诫，每個(gè)過濾器的尺寸為（ffchannels），f通常為3或5樟澜。
卷積操作的輸出為一個(gè)三維的volume（也稱為feature map或者輸出）误窖，其尺寸為（NoutNoutk）
Nin和Nout的關(guān)系如下：

卷積算法

卷積操作可視化如下：

image.png

在上圖中，輸入的尺寸在773秩贰，兩個(gè)過濾器的尺寸為333霹俺，padding為0，步長(zhǎng)為2毒费。因此丙唧，輸出的volume的尺寸為332。

另一個(gè)重要概念為感知域（receptive field）觅玻。它是指輸入volume中每個(gè)filter所看到的部分想际。在上圖中培漏，3*3的藍(lán)色區(qū)域?yàn)楦兄颉８兄蛞渤３１环Q為context胡本。

receptive field (context) is the area of the input image that the filter covers at any given point of time.

2. 最大池化操作

目的：減小feature map的尺寸

來源: https://www.quora.com/What-is-max-pooling-in-convolutional-neural-networks##)

最大池化中兩個(gè)重要的超參數(shù)（hyper-parameters）：filter的尺寸和步長(zhǎng)牌柄。

最大池化的目的是保留每個(gè)區(qū)域最重要的信息（具有最大值的像素）并且丟棄不重要的信息。這里的”重要“是指侧甫，能最好描述圖片內(nèi)容的信息友鼻。

值得注意的是，卷積和池化都能減小圖片尺寸闺骚，因此他們被稱為”下采樣（down sampling）“彩扔。

3. 上采樣（up sampling）

如果我們只做下采樣，我們只能得到”what“信息僻爽，但是損失了”where“信息虫碉。為了得到”where"信息，需要對(duì)圖片進(jìn)行上采樣胸梆。
上采樣的方法有：bi-linear interpolation, cubic interpolation, nearest neighbor interpolation, unpooling, transposed convolution, etc
轉(zhuǎn)置卷積（transposed convolution）是對(duì)圖片進(jìn)行上采樣時(shí)比較被偏愛的方法敦捧。

4. 轉(zhuǎn)置卷積（transposed convolution）

強(qiáng)烈建議閱讀這篇文章

我自己之前也總結(jié)過。

三碰镜、UNET的結(jié)構(gòu)

UNET結(jié)構(gòu)的介紹性文字：

The architecture contains two paths. First path is the contraction path (also called as the encoder) which is used to capture the context in the image. The encoder is just a traditional stack of convolutional and max pooling layers. The second path is the symmetric expanding path (also called as the decoder) which is used to enable precise localization using transposed convolutions. Thus it is an end-to-end fully convolutional network (FCN), i.e. it only contains Convolutional layers and does not contain any Dense layer because of which it can accept image of any size.

UNet的結(jié)構(gòu)

文中輸入推按的尺寸是572 * 572 * 3兢卵。這里我們用128 * 128 * 3的圖片進(jìn)行舉例。

下圖是關(guān)于UNET結(jié)構(gòu)的詳細(xì)介紹：

image.png

下面我自己結(jié)合參考鏈接寫一些對(duì)結(jié)構(gòu)的理解：
先看decoder部分：

2@Conv layers是指應(yīng)用了兩個(gè)連續(xù)的卷積層绪颖；
c1-c5是卷積層的輸出秽荤，p1-p4是最大池化層的輸出；
進(jìn)行conv2d layer的filter的channel數(shù)目增多柠横，從而增加output的channel數(shù)目窃款，但是size不變；
進(jìn)行maxpool事后牍氛，channel數(shù)目不變晨继，但是size減小了一半；
decoder部分是從128x128x3 到8x8x256搬俊。

參考鏈接
overtiling 策略
參考鏈接
邊緣像素加權(quán)

參考鏈接
這個(gè)UNet的降采樣一共經(jīng)歷了4層紊扬。淺層可以抓取圖像的一些簡(jiǎn)單的信息，比如邊界唉擂、顏色等餐屎。深藏結(jié)構(gòu)因?yàn)楦惺芤按罅耍医?jīng)過的卷積操作變多了楔敌，會(huì)抓取一些抽象特征啤挎。

再看encoder部分：
每一次轉(zhuǎn)置卷積之后驻谆，height和weights都加倍卵凑，同時(shí)depth(channel數(shù)目)減半;
c6和u6的size相同庆聘；
encoder部分是從8x8x256 到 128x128x3；
灰色箭頭表示復(fù)制和剪切操作勺卢，可以發(fā)現(xiàn)伙判，在同一層左邊的最后一層要比右邊的第一層要大一些，這就導(dǎo)致了：想要利用淺層的feature黑忱，就要進(jìn)行一些剪切宴抚，也導(dǎo)致了最終的輸出是輸入的中心某個(gè)區(qū)域；
長(zhǎng)連接（skip connection）的優(yōu)點(diǎn)：參考鏈接

fight the vanishing gradient problem
learns pyramid level feature
recover information loss in down sampling
其他network與長(zhǎng)連接（skip connection）相對(duì)應(yīng)的功能：參考鏈接
FCN: use summation
U-Net: use concatenation
SegNet: use pooling indice instead of skip connection
Some generators in GAN have no skip connection

U-Net中的長(zhǎng)連接是有必要的甫煞，它聯(lián)系了輸入圖像的很多信息菇曲，有助于還原降采樣所帶來的信息損失，在一定程度上抚吠，我覺得它和殘差的操作非常類似常潮，也就是residual操作，x+f(x)楷力。我不知道大家是否同意這一個(gè)觀點(diǎn)喊式。因此，我的建議是最好給出一個(gè)綜合長(zhǎng)連接和短連接的方案萧朝。

四岔留、問答環(huán)節(jié)

1. 為什么在decoder里要采用雙卷積？

2. 為什么在encoder里要用到decoder中卷積的output检柬，是如何運(yùn)用的献联？

The reason here is to combine the information from the previous layers in order to get a more precise prediction.

在upsampling中使用feature channels能使得context information傳播到更高分辨率的層去（更高層的up layer）。
能夠通過鏡像的方法來推斷出丟失信息何址。

3. UNet和其他的FCN相比酱固，還有哪些其他的不同？這些改變對(duì)結(jié)果有什么好處头朱？

最后編輯于：2020.07.23 13:03:30

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末运悲，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子项钮，更是在濱河造成了極大的恐慌班眯，老刑警劉巖，帶你破解...
沈念sama閱讀 219,427評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件烁巫，死亡現(xiàn)場(chǎng)離奇詭異署隘，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)亚隙，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,551評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門磁餐，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事诊霹⌒哐樱” “怎么了？”我有些...
開封第一講書人閱讀 165,747評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵脾还，是天一觀的道長(zhǎng)伴箩。經(jīng)常有香客問我，道長(zhǎng)鄙漏，這世上最難降的妖魔是什么嗤谚？我笑而不...
開封第一講書人閱讀 58,939評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮怔蚌，結(jié)果婚禮上巩步，老公的妹妹穿的比我還像新娘。我一直安慰自己桦踊，他們只是感情好渗钉，可當(dāng)我...
茶點(diǎn)故事閱讀 67,955評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著钞钙，像睡著了一般鳄橘。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上芒炼，一...
開封第一講書人閱讀 51,737評(píng)論 1贊 305
城市分裂傳說
那天瘫怜，我揣著相機(jī)與錄音，去河邊找鬼本刽。笑死鲸湃，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的子寓。我是一名探鬼主播暗挑，決...
沈念sama閱讀 40,448評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼斜友！你這毒婦竟也來了炸裆？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,352評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤鲜屏，失蹤者是張志新（化名）和其女友劉穎烹看，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體洛史，經(jīng)...
沈念sama閱讀 45,834評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡惯殊，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,992評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了也殖。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片土思。...
茶點(diǎn)故事閱讀 40,133評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出己儒，到底是詐尸還是另有隱情崎岂，我是刑警寧澤，帶...
沈念sama閱讀 35,815評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布址愿，位于F島的核電站该镣，受9級(jí)特大地震影響冻璃，放射性物質(zhì)發(fā)生泄漏响谓。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,477評(píng)論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一省艳、第九天我趴在偏房一處隱蔽的房頂上張望娘纷。院中可真熱鬧，春花似錦跋炕、人聲如沸赖晶。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,022評(píng)論 0贊 22
一樁弒父案辐烂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽遏插。三九已至，卻和暖如春纠修，著一層夾襖步出監(jiān)牢的瞬間胳嘲，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,147評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來泰國(guó)打工扣草，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留了牛，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,398評(píng)論 3贊 373
代替公主和親
正文我出身青樓辰妙，卻偏偏與公主長(zhǎng)得像鹰祸，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子密浑，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,077評(píng)論 2贊 355

UNet介紹

一蔚携、語義分割（semantic segmentation）介紹

二券坞、 理解卷積，最大池化和轉(zhuǎn)置卷積

1. 卷積（convolution）

2. 最大池化操作

3. 上采樣（up sampling）

4. 轉(zhuǎn)置卷積（transposed convolution）

三碰镜、UNET的結(jié)構(gòu)

四岔留、問答環(huán)節(jié)

1. 為什么在decoder里要采用雙卷積？

2. 為什么在encoder里要用到decoder中卷積的output检柬，是如何運(yùn)用的献联？

3. UNet和其他的FCN相比酱固，還有哪些其他的不同？這些改變對(duì)結(jié)果有什么好處头朱？

二券坞、理解卷積，最大池化和轉(zhuǎn)置卷積